第2350篇：如何成为AI工程方向的技术专家——从T型到专家型的成长路径

老张2026/4/30大约 6 分钟

第2350篇：如何成为AI工程方向的技术专家——从T型到专家型的成长路径

适读人群：有1-5年经验、希望在AI工程方向建立深度专长的Java工程师 | 阅读时长：约18分钟 | 核心价值：给出AI工程专家成长的真实路径，而不是废话鸡汤

我想先说一件让我印象深刻的事。

去年面试了一个自称"AI工程专家"的候选人，简历写得很漂亮：参与过多个AI项目、用过Spring AI、LangChain4j、部署过大模型……

问他："RAG系统里，当用户的问题和知识库的语义距离比较远时，你怎么提升召回率？"

他停顿了几秒，说："可以调高TopK参数。"

仅此而已。

他知道工具，但不知道为什么要这么做，更不知道还有哪些其他路径（查询改写、混合检索、HyDE假设文档嵌入……）。他是个知道如何用工具的人，但还不是专家。

这个差距，就是这篇文章要说的。

"专家"意味着什么

先把概念说清楚，不然后面都是虚的。

知道如何用：会配置Spring AI、会写RAG、会部署服务。这是入门。

知道为什么：理解RAG为什么比Fine-tuning更适合企业知识库、为什么分块大小影响召回质量、为什么LLM的Temperature要因场景而设。这是进阶。

知道边界：知道什么时候RAG解决不了问题（动态推理、复杂数学计算）、知道某个方案在什么规模下会崩、知道哪些"最佳实践"是在特定场景下才成立的。这是专家。

能创造新方案：当遇到现有方案解决不了的问题，能基于对底层原理的理解，设计出新的解决思路。这是顶尖专家。

大多数工程师卡在第一层和第二层之间。

AI工程专家的知识地图

先有地图，再谈路径。AI工程专家需要的知识分三个圈：

核心圈（必须深）：

LLM工作原理（Transformer、Attention、上下文窗口）
RAG全链路（检索、重排、生成、评估）
Agent设计（工具调用、规划、记忆）
向量数据库原理（HNSW、IVF、ANN）

扩展圈（需要广）：

分布式系统（AI服务的部署和扩展）
数据工程（文档处理、数据清洗）
评估与监控（AI应用的质量衡量）

应用圈（需要实践）：

具体框架（Spring AI、LangChain4j）
具体模型（GPT、Claude、DeepSeek、本地模型）
具体业务场景（客服、代码、文档、数据分析）

三阶段成长路径

第一阶段：打通核心链路（0-6个月）

目标：能独立搭建一个可以上生产的RAG系统。

不是能跑Demo，是能上生产——有日志、有监控、有错误处理、有限流。

这个阶段很多人会走错：把时间花在横向学习N个AI框架上，而不是把一个框架用深。

我的建议是：选一个框架（Spring AI或LangChain4j）彻底搞懂，然后做一个完整的RAG项目，从文档入库到查询返回，每个环节都要理解原理，出了问题能自己排查。

验收标准：

能回答"为什么我的RAG召回质量不好"，并给出至少3种改进方案
能解释向量相似度检索的原理，为什么余弦相似度比欧氏距离更常用
能写出带测试的生产级代码，不是只有Service类

第二阶段：深入特定方向（6个月-2年）

目标：在某个具体方向建立深度，能解决同行搞不定的问题。

AI工程的具体方向：

RAG优化方向：向量检索优化、Reranker、混合检索、评估体系
Agent工程方向：复杂工具调用、长任务规划、错误恢复
LLM服务化方向：推理服务部署、量化、KV缓存、批处理优化
AI安全方向：Prompt注入防护、内容安全、隐私保护

选哪个方向，取决于你目前在做什么项目、公司在解决什么问题。不要选你感兴趣但公司根本用不到的方向——没有实战场景，深度起不来。

这个阶段最重要的不是学新技术，而是在真实问题上死磕：

一个RAG系统，用户反馈"答非所问"的比例高。原因不止一个：检索不准、Prompt没有约束AI不要乱发挥、上下文太长被截断……你要一个一个分析，一个一个解决，这个过程里积累的判断力是别人学不来的。

第三阶段：建立影响力（2年以上）

目标：从"能解决问题"到"能影响决策"。

这个阶段，技术深度仍然重要，但不再是唯一的。

你需要能回答的问题变了：

"我们这个场景，用RAG还是Fine-tuning还是两者结合？成本怎么算？"
"这个新的向量数据库值得迁移吗？迁移风险是什么？"
"团队现在做AI工程，应该优先招什么背景的人？"

这些问题没有标准答案，需要你基于深度技术理解+业务判断力+行业视野综合给出。

建立影响力的具体路径：

写作：把你解决问题的过程写成文章，不是教程，是真实的分析过程
分享：在团队内、部门内分享，慢慢扩展到外部技术社区
开源：贡献或维护一个AI相关的开源项目

一个反直觉的建议

很多人以为"专家"的标志是"什么都知道"。

这是错的。

真正的专家对自己知识的边界非常清楚，他们说得最多的话之一是："这个问题在我深度研究的范围之外，我能给你的判断有限……但我的经验告诉我……"

不确定性的清醒认知，比虚假的全知全能，更值钱。

AI这个领域变化很快，每个月都有新的模型、新的框架、新的技术。追不上的焦虑是正常的，不正常的是用焦虑驱动学习而不是用价值驱动学习。

价值驱动学习：这个新技术能帮我解决什么实际问题？能让我在现在的工作里产生什么价值？

焦虑驱动学习：这个都不学我会不会落后？这个工具都不会会不会找不到工作？

前者让你深，后者让你乱。

判断自己在哪个层次的三个问题

如果你想知道自己现在在哪个层次，问自己这三个问题：

你最近一次深入研究一个AI工程问题（而不只是跑通Demo），是什么时候？结论是什么？
你能说出你用过的RAG系统的召回率是多少吗？如果召回率不理想，你做了哪些改进？
你上一次对一个"最佳实践"产生质疑并深入验证，是什么时候？

如果三个问题都能清晰回答，你在进阶阶段。如果只能回答第一个，你在入门阶段。如果一个都回答不上来……先回去做项目，再来讨论成长路径。