第一份工作是大数据工程师——那段经历塑造的不是某项具体技能,而是一套看系统的方式:规模大到一定程度,「小问题」会变成「根本问题」。你以为是性能问题,扒开来是数据质量;你以为是逻辑问题,根在数据模型的设计。这种「往深一层想」的工程直觉,后来在我做的每一件事里都留下了印记。
后来转向 LLM 应用——这是工程直觉第一次被完全颠覆的时刻。传统软件的 bug 会报错;LLM 的「bug」是幻觉,它看起来对,然后你发现是错的,而且没办法用测试捕捉它。性能不是延迟,是召回率,是那种没有标准答案的东西。读懂一个 AI 系统,需要一套完全不同的工程直觉。
现在我花大量时间在弄清楚一件事:AI 落地的真正瓶颈在哪里。结论有点反直觉——不是模型不够强,是流程没标准化。把 AI 嵌进一个没有清晰输入输出的工作流,往往只会放大原有的混乱。MIT 和 McKinsey 的研究反复指向同一个结论,我在自己参与的项目里也验证过:AI 能产生可量化回报的地方,几乎都是「先把流程理清,AI 再渐进介入」——而不是反过来。
专注 AI 工程化落地
2026 — 至今企业 AI 落地 · 工作流改造
读源码,开 PR,也追问设计决策背后的权衡。企业 AI 真正的难题,藏在框架的实现细节里,不在 PPT 里。
Python & 全栈开发者
2023 — 2025全栈开发 · LLM 应用
从传统软件走进 LLM 应用的那个节点,是工程直觉第一次被逼着全部重建的时刻。
大数据工程师
2021 — 2023即刻 Jike
在即刻,规模迫使你往深处看——你以为是性能问题,扒开来是数据质量;你以为是逻辑问题,根在数据模型的设计。
Airflow 扩展 API 插件——通过 CLI 命令封装 RESTful API,支持 Airflow v2.X。让 DAG 管理更灵活,运维操作更便捷。
Agent 落地实战
不空谈概念、不堆砌 API 调用教程,聚焦 AI Agent 在真实工作流里的落地痛点。从单一场景验证到稳定复用的完整过程,探讨长周期任务的稳定性控制、多工具调用的流程设计、业务场景的深度适配。
2025年3月大数据工程实践
不做教科书式的概念搬运,聚焦真实业务场景里的大数据链路搭建、优化与落地。分享数据从采集、清洗、存储到分析应用的全流程实践,让数据体系真正支撑业务决策与 AI 应用。
2025年3月系统与链路性能优化
不空谈理论参数,聚焦端到端的全链路性能调优。从代码逻辑的精简、架构设计的优化,到数据链路的提速、服务响应的压测与调优,在快速迭代中守住系统的稳定与高效。
2025年3月工具的本质
好的工具应该像空气——存在时感觉不到,缺失时立刻发现。不追逐技术热点,只打磨真正解决问题的东西。工具的价值不在于它有多复杂,而在于它让使用者多省心。
2025年3月自动化工作流提效
不分享零散的工具插件,聚焦「如何用 AI 与自动化,把重复劳动彻底清零」。拆解从需求到落地的全流程提效方案,让 AI 成为真正的效率杠杆,而不是只会写代码的打字机。
2025年3月Hermes Agent 主打「the agent that grows with you」——像个会自己成长的实习生。我把这句话当真了:模型一个权重都不动,全靠它自己攒 skill,真能越用越聪明吗?答案有点反直觉——一条人写的好 skill 能让同一个模型从 10% 的做对率涨到 74%,但让它自己写一条,连一半差距都补不上。
2026-06-12ETL 写坏了几万个 parquet 文件,你打开 S3 桶却发现——没有 commit、没有回滚,被覆盖的对象永远找不回来了。这篇文章拆开 lakeFS Graveler 的设计:一棵两层 Merkle 树加上基于哈希的分块,如何让十亿文件规模的每次提交只写 2 个新文件、99% 的内容原地复用——以及它和区块链共享了同一套数学,目标却截然相反。
2026-06-08深度体验 OpenClaw 一周、烧完 3 亿 Token 后的结论:问题不是 AI 不够聪明,而是纯自然语言交互在执行型任务中存在根本缺陷。用四种交互模式分析「谁来消化歧义」这个核心问题。
2026-03-10