第2350篇:如何成为AI工程方向的技术专家——从T型到专家型的成长路径
第2350篇:如何成为AI工程方向的技术专家——从T型到专家型的成长路径
适读人群:有1-5年经验、希望在AI工程方向建立深度专长的Java工程师 | 阅读时长:约18分钟 | 核心价值:给出AI工程专家成长的真实路径,而不是废话鸡汤
我想先说一件让我印象深刻的事。
去年面试了一个自称"AI工程专家"的候选人,简历写得很漂亮:参与过多个AI项目、用过Spring AI、LangChain4j、部署过大模型……
问他:"RAG系统里,当用户的问题和知识库的语义距离比较远时,你怎么提升召回率?"
他停顿了几秒,说:"可以调高TopK参数。"
仅此而已。
他知道工具,但不知道为什么要这么做,更不知道还有哪些其他路径(查询改写、混合检索、HyDE假设文档嵌入……)。他是个知道如何用工具的人,但还不是专家。
这个差距,就是这篇文章要说的。
"专家"意味着什么
先把概念说清楚,不然后面都是虚的。
知道如何用:会配置Spring AI、会写RAG、会部署服务。这是入门。
知道为什么:理解RAG为什么比Fine-tuning更适合企业知识库、为什么分块大小影响召回质量、为什么LLM的Temperature要因场景而设。这是进阶。
知道边界:知道什么时候RAG解决不了问题(动态推理、复杂数学计算)、知道某个方案在什么规模下会崩、知道哪些"最佳实践"是在特定场景下才成立的。这是专家。
能创造新方案:当遇到现有方案解决不了的问题,能基于对底层原理的理解,设计出新的解决思路。这是顶尖专家。
大多数工程师卡在第一层和第二层之间。
AI工程专家的知识地图
先有地图,再谈路径。AI工程专家需要的知识分三个圈:
核心圈(必须深):
- LLM工作原理(Transformer、Attention、上下文窗口)
- RAG全链路(检索、重排、生成、评估)
- Agent设计(工具调用、规划、记忆)
- 向量数据库原理(HNSW、IVF、ANN)
扩展圈(需要广):
- 分布式系统(AI服务的部署和扩展)
- 数据工程(文档处理、数据清洗)
- 评估与监控(AI应用的质量衡量)
应用圈(需要实践):
- 具体框架(Spring AI、LangChain4j)
- 具体模型(GPT、Claude、DeepSeek、本地模型)
- 具体业务场景(客服、代码、文档、数据分析)
三阶段成长路径
第一阶段:打通核心链路(0-6个月)
目标:能独立搭建一个可以上生产的RAG系统。
不是能跑Demo,是能上生产——有日志、有监控、有错误处理、有限流。
这个阶段很多人会走错:把时间花在横向学习N个AI框架上,而不是把一个框架用深。
我的建议是:选一个框架(Spring AI或LangChain4j)彻底搞懂,然后做一个完整的RAG项目,从文档入库到查询返回,每个环节都要理解原理,出了问题能自己排查。
验收标准:
- 能回答"为什么我的RAG召回质量不好",并给出至少3种改进方案
- 能解释向量相似度检索的原理,为什么余弦相似度比欧氏距离更常用
- 能写出带测试的生产级代码,不是只有Service类
第二阶段:深入特定方向(6个月-2年)
目标:在某个具体方向建立深度,能解决同行搞不定的问题。
AI工程的具体方向:
- RAG优化方向:向量检索优化、Reranker、混合检索、评估体系
- Agent工程方向:复杂工具调用、长任务规划、错误恢复
- LLM服务化方向:推理服务部署、量化、KV缓存、批处理优化
- AI安全方向:Prompt注入防护、内容安全、隐私保护
选哪个方向,取决于你目前在做什么项目、公司在解决什么问题。不要选你感兴趣但公司根本用不到的方向——没有实战场景,深度起不来。
这个阶段最重要的不是学新技术,而是在真实问题上死磕:
一个RAG系统,用户反馈"答非所问"的比例高。原因不止一个:检索不准、Prompt没有约束AI不要乱发挥、上下文太长被截断……你要一个一个分析,一个一个解决,这个过程里积累的判断力是别人学不来的。
第三阶段:建立影响力(2年以上)
目标:从"能解决问题"到"能影响决策"。
这个阶段,技术深度仍然重要,但不再是唯一的。
你需要能回答的问题变了:
- "我们这个场景,用RAG还是Fine-tuning还是两者结合?成本怎么算?"
- "这个新的向量数据库值得迁移吗?迁移风险是什么?"
- "团队现在做AI工程,应该优先招什么背景的人?"
这些问题没有标准答案,需要你基于深度技术理解+业务判断力+行业视野综合给出。
建立影响力的具体路径:
- 写作:把你解决问题的过程写成文章,不是教程,是真实的分析过程
- 分享:在团队内、部门内分享,慢慢扩展到外部技术社区
- 开源:贡献或维护一个AI相关的开源项目
一个反直觉的建议
很多人以为"专家"的标志是"什么都知道"。
这是错的。
真正的专家对自己知识的边界非常清楚,他们说得最多的话之一是:"这个问题在我深度研究的范围之外,我能给你的判断有限……但我的经验告诉我……"
不确定性的清醒认知,比虚假的全知全能,更值钱。
AI这个领域变化很快,每个月都有新的模型、新的框架、新的技术。追不上的焦虑是正常的,不正常的是用焦虑驱动学习而不是用价值驱动学习。
价值驱动学习:这个新技术能帮我解决什么实际问题?能让我在现在的工作里产生什么价值?
焦虑驱动学习:这个都不学我会不会落后?这个工具都不会会不会找不到工作?
前者让你深,后者让你乱。
判断自己在哪个层次的三个问题
如果你想知道自己现在在哪个层次,问自己这三个问题:
- 你最近一次深入研究一个AI工程问题(而不只是跑通Demo),是什么时候?结论是什么?
- 你能说出你用过的RAG系统的召回率是多少吗?如果召回率不理想,你做了哪些改进?
- 你上一次对一个"最佳实践"产生质疑并深入验证,是什么时候?
如果三个问题都能清晰回答,你在进阶阶段。如果只能回答第一个,你在入门阶段。如果一个都回答不上来……先回去做项目,再来讨论成长路径。
