第1659篇:AI工程师的晋升路径——从P6到P8需要具备哪些能力
第1659篇:AI工程师的晋升路径——从P6到P8需要具备哪些能力
写这篇文章有点迟疑,因为聊晋升这种话题,说得不好容易变成鸡汤。但确实不断有读者私信问我,也有不少人在星球里提这个问题,所以还是决定认真写一写,尽量说干货,少说废话。
我不是HR,没有资格定义什么是"标准答案"。但作为在这个行业做了10年的老工程师,经历了大厂的晋升答辩、带过几十人的团队、也面试过很多候选人,有些判断还是有一定参考价值的。
先说结论:AI工程师的晋升路径,技术能力是必要条件,但到了P7及以上,影响力和判断力比代码能力更重要。
P6:能干活,能干好活
P6大概对应工作1-4年,能独立负责一个模块或者一个中等复杂度的功能。
在AI工程方向,P6的核心要求是:能落地,不依赖别人帮你解决问题。
具体来说:
技术深度够用:能独立写出生产可用的代码,理解自己用的框架和工具的原理,而不仅仅是会调API。比如用LangChain搭了一套RAG,你得知道为什么检索结果不好、该怎么调优,而不是只会复制官方example然后不知道下一步。
能处理常见问题:向量检索质量差、推理速度慢、Prompt效果不稳定,这些常见问题有标准的排查和解决流程。P6要能独立处理,遇到新问题知道从哪里找资料、从哪里下手。
代码质量过关:这个说起来很虚,但实际上P5和P6最直接的区别就在这里。P5的代码经常是"能跑就行",P6的代码要考虑可读性、可测试性、错误处理,reviewer看了不会皱眉头。
一个P6常见的天花板:只能在已知问题上做,遇到没见过的技术挑战就不知道怎么办,需要别人指路。
P7:有判断力,对结果负责
P7是大多数工程师觉得"很难过"的一关,这里有个认知跃迁。
P6到P7不只是代码能力的提升,而是思维方式的转变。
P6的思维是:"我要完成这个任务"。 P7的思维是:"这件事应不应该做?怎么做才是对的?"
技术判断力
P7工程师面对一个问题,能给出自己的判断,而不是把几个方案摆出来让Leader选。
举个实际例子:团队要做一个文档智能问答系统,产品提了需求,大家讨论技术方案。P6可能说"可以用RAG,也可以用Fine-tuning,或者两者结合"。P7应该能说清楚:这个场景下,文档内容更新频繁、领域知识量大,RAG更合适;Fine-tuning在这里不划算,因为更新成本高;结合方案会增加系统复杂度,当前阶段不值得。
这种判断力不是天生的,是踩了够多坑之后积累出来的。但光踩坑不够,还需要主动总结和复盘。
P7在AI技术选型上的典型判断能力:
- 什么时候应该用RAG,什么时候应该Fine-tuning,什么时候Prompt Engineering就够了
- 向量检索和关键词检索怎么混合,不同场景下的权衡
- 选哪个向量数据库:Milvus、Weaviate、Qdrant,不同场景的适用性
- 什么时候自己部署开源模型,什么时候调用API更划算
这些判断能力,背后是对多个技术方案的深度理解,以及在实际项目里的验证经验。
能影响周围的人
P7的影响力通常体现在2-3人的小范围。能帮组里的P5/P6解决技术难题,能做代码Review真正帮到别人(不是走过场),能在技术讨论里提出有价值的观点。
这里有一个陷阱:有些工程师技术很强但不愿意帮别人,或者总是用"忙"来推托。这种人在P6没问题,到P7就会卡住。
一个P7常见的卡点
局限在自己的技术域:AI工程师可能对RAG、推理优化很精通,但对部署、稳定性、成本控制没有太多关注;或者反过来,基础设施很强但对AI业务不够深入。P7要有足够的全栈视角,能看到一个AI系统从数据到服务的全链路。
P8:有架构能力,能定义方向
P8开始进入高级工程师/技术专家的层次,这里的要求再次跃升。
P7和P8的核心区别:P7是在已有框架内做好,P8是能设计框架本身。
架构设计能力
P8能独立设计一套完整的AI系统架构,覆盖:
- 数据流(从原始数据到模型训练到推理上线)
- 服务化(多个AI组件如何拆分、如何交互)
- 可靠性(如何处理模型服务不可用、如何做灰度发布)
- 可观测性(推理质量怎么监控、哪些指标是关键的)
- 成本(选什么模型、怎么部署,让成本可控)
一个P8工程师能在白板前把这些画清楚,说清楚各种设计决策的理由,以及这个设计的局限在哪里、以后如何演进。
这种能力的培养,最直接的方式是主动承担系统级的设计工作,而不是总是等别人给你一个设计好的架构去实现。
技术判断超越团队边界
P7的技术判断主要在自己负责的模块内。P8的判断力要超越单一模块,能在多个系统、多个技术方向上做出正确的判断。
比如:公司要搭建统一的AI基础设施(包含模型仓库、推理平台、评估系统),P8要能判断这套基础设施的架构合不合理,哪些地方会成为未来的瓶颈,哪些地方过度设计了。
AI领域特有的P8判断力:
- 私有化部署 vs 调API:不只是成本计算,还要考虑数据安全、迭代速度、团队维护能力
- 统一推理平台 vs 各业务自建:统一降成本但灵活性差,各自建灵活但重复投入,如何决策
- 模型能力建设 vs 工程能力建设:当前团队的投入应该偏哪边
- 什么时候跟进新技术,什么时候等待成熟
这些判断没有标准答案,但P8要能给出有说服力的理由,而不是"不知道,随便"或者"都行"。
跨团队影响力
P8的技术影响力通常覆盖整个大团队甚至跨组。其他团队遇到AI相关的技术问题,会主动来找你咨询。你制定的技术规范、选型建议,能被其他团队采纳。
这里有一个经常被忽视的软技能:沟通和说服能力。技术上正确,但说不清楚、说服不了别人采纳,这种技术判断力的价值大打折扣。
晋升的一些实操经验
主动创造可见度
技术好但不被看见,晋升很慢。这不是说要搞政治,而是要让你的工作成果有记录、有传播。
几个实际的做法:
- 把解决复杂问题的过程写成内部文档,发到团队技术群
- 在团队内部定期做技术分享(哪怕只有5个人听)
- 在Code Review里给出有质量的意见,让组里的人知道你在认真看
- 参与架构评审,即使你不是主要负责人,提出有价值的问题也是可见度
很多优秀的工程师就是不够主动,默默做了很多好工作,但到了晋升答辩时,评委不知道你做了什么。
超出当前级别的要求去干活
最高效的晋升准备方式,不是背诵晋升标准,而是按照下一级的要求去工作。
如果你是P6,想晋升P7,就要开始承担P7的工作:主动做技术判断,不要总是等别人告诉你怎么做;开始帮助组里的P5;开始考虑方案的全局影响而不只是自己负责的部分。
这样干了半年之后,答辩时才有真实的案例可以讲,而不是"我未来会做到……"
找到晋升的核心叙事
晋升答辩最重要的是:用一两个重点项目,清晰展示你达到了下一级的要求。
不要试图把过去一年所有工作都讲一遍,评委会失去耐心。要选2-3个最能体现你能力跃升的项目,把背景、你的判断、你的设计、最终结果讲清楚。
一个好的晋升材料叙事框架:
- 这个项目的业务背景和技术挑战是什么
- 面对这个挑战,你做了什么判断和决策(这是最重要的部分)
- 你的方案怎么实现的,遇到了什么问题怎么解决
- 最终结果怎么样,有什么数据可以证明
关于AI方向的特殊性
AI工程师晋升有一个独特的挑战:这个领域变化太快,很多时候上周的最佳实践这周就过时了。
在这种情况下,不要把晋升押注在"掌握了某个具体的技术"上,而是要展示:你有快速学习和判断新技术的能力。
能说清楚"我是怎么评估和选型一个新技术的",比"我掌握了X技术"更有价值。一个评委能看出来你是在背诵技术细节,还是真正理解这门技术并能做出判断。
一些容易踩的坑
坑1:技术深度和技术广度不平衡
P7以上要求有T字形的知识结构:某个方向有足够的深度,同时有足够宽的广度来做系统思考。只有深度(算法精通但不懂工程)或只有广度(什么都知道但没一样精通)都会卡住晋升。
坑2:只做执行不做判断
有些工程师很勤奋,Leader给什么任务都做,而且做得很好。但从来不主动提出问题、不挑战方案、不说"我觉得这么做不对"。这种人在P6很受欢迎,但P7晋升会卡住,因为P7要求有自己的判断。
坑3:做了很多但讲不清楚
晋升答辩是一次沟通能力的考验。有些工程师技术能力很强,但表达混乱,评委不知道他做了什么、判断是什么、结果是什么。把这件事当成一项技能来练习:学会用结构化的方式讲清楚一个复杂的技术事情。
坑4:等待好时机
"等我做完这个项目再准备晋升"——这种心态会让你一直在等。晋升准备不是某个时间点的突击,而是日常工作方式的积累。
用一个具体例子说明P6/P7/P8的差异
假设团队要做一个企业知识库问答系统,看看三个层级的工程师会怎么表现:
P6的表现:接到任务后,找资料学RAG,实现了一套基本可用的系统。遇到检索效果不好的问题,按照别人的建议调整了chunk大小和overlap,效果有所提升。
P7的表现:在开始实现之前,先分析了业务需求:知识库内容是文档为主还是FAQ为主?用户的问题是精准查询还是语义问答?多大的文档量?基于这些分析,做出了选型决策(用Milvus而不是Pinecone,因为要私有化部署;用混合检索而不是纯向量检索,因为精确词汇匹配也很重要)。实现过程中主动识别了潜在的性能瓶颈,做了压测,给出了容量规划建议。
P8的表现:不只是做这一个系统,而是考虑整个公司的AI知识库需求:不同部门都有类似需求,应该建一套统一的知识库基础设施还是让各部门各自建?统一建设的话,平台边界在哪里?通用能力抽象到什么程度才合适?同时给出了技术路线:先建一套通用的,验证效果后再抽象成平台。并且推动了这个提案在更大的范围内讨论和采纳。
AI工程师能力图谱:各级别技术栈要求
光说"要有判断力"、"要有影响力"这些还是太虚,再具体说说AI工程师在技术能力上,不同级别分别需要精通哪些东西。
P6的技术能力要求
P6需要能独立完成的技术清单(选你所在公司的方向,通常需要掌握70%以上):
LLM应用开发基础
- 能调用各主流LLM的API(OpenAI、Claude、文心等),理解Chat Completions和Completion两种接口的区别和适用场景
- 能写出稳定的Prompt,理解System Prompt、Few-shot、Chain-of-thought等基本技巧,能根据输出结果调整Prompt策略
- 理解Token的概念,知道Token消耗对成本和延迟的影响,能估算给定输入的Token数
RAG系统开发
- 能独立搭建一套基本可用的RAG Pipeline:文档加载→切分→向量化→存储→检索→生成
- 理解不同切分策略(固定大小、按段落、按语义)的优劣,能根据文档类型选择
- 能用LangChain或LlamaIndex这类框架,同时理解框架背后的原理,不是只会照着example复制
向量数据库基础使用
- 能用Milvus或Weaviate存储和检索向量,理解索引类型(HNSW、IVF等)的基本原理和适用场景
- 知道向量相似度的不同计算方式(余弦相似度、内积、欧式距离),知道什么场景用哪个
工程化能力
- 能写出经得住Code Review的Java代码:合理的异常处理、连接池管理、异步调用
- 会写单元测试,AI相关的代码测试有一定难度(输出不确定),能用Mock和快照测试应对
P7需要补充的技术能力
在P6基础上,P7要有以下额外的深度和广度:
推理性能优化
- 理解模型推理的性能瓶颈在哪里:是IO密集(加载模型文件)、计算密集(矩阵运算)还是内存带宽限制
- 能用批处理(Batching)提升推理吞吐,知道静态Batching和动态Batching的区别
- 知道量化(INT8/INT4)对模型体积和推理速度的影响,以及精度损失如何评估
- 理解KV Cache在自回归生成中的作用,知道为什么长上下文会消耗大量显存
评估体系建立
- 能设计AI系统的评估指标:不只是准确率,还有幻觉率、拒绝率、延迟P99、用户满意度
- 能搭建自动化评估Pipeline,用LLM-as-Judge来批量评估输出质量
- 理解评估集的构建原则:覆盖边界情况、代表真实分布、避免数据泄露
多模型编排
- 能设计多步骤的Agent架构,理解工具调用(Function Calling)的原理和局限
- 能用适当的编排框架(LangGraph、AutoGen等)实现复杂的对话流
- 理解什么时候该用Multi-Agent,什么时候单Agent+好Prompt就够了
成本意识
- 能估算一个AI系统的运行成本(按调用量计费的外部API vs 自建推理服务),给出Build vs Buy的判断
- 知道常见的成本优化手段:缓存重复查询的结果、用小模型处理简单任务、混合路由(简单请求用便宜模型)
P8的技术视野要求
P8不需要比P7懂更多具体的技术细节,而是需要在更大的尺度上做正确的决策:
AI系统的全生命周期管理:从数据飞轮(用户反馈如何回流训练数据)到模型版本管理(如何追踪哪个版本在生产上、如何安全地升级),能看到一个AI系统持续运行和迭代的完整图景。
AI安全与合规:理解AI系统的主要风险(提示词注入、模型幻觉、数据隐私),能设计防护措施,能在合规要求和能力限制之间做出权衡。在监管严格的行业(金融、医疗),这方面的能力尤其重要。
技术趋势判断:什么时候应该关注MoE架构、多模态模型、本地小模型,什么时候这些还是"玩具"级别。P8要有自己的判断,而不是追着每篇论文跑。
一个自我评估工具:打分看自己在哪里
我设计了一个简单的自评框架,帮你判断自己目前在哪个层级,以及差距在哪里:
维度一:技术深度(1-5分)
- 1分:了解概念,没有实践
- 3分:能独立实现,遇到问题能自己解决
- 5分:理解原理,能优化和定制,能判断技术边界
维度二:技术广度(1-5分)
- 1分:只懂自己负责的模块
- 3分:理解整个AI系统的主要组件,有跨模块视角
- 5分:能看全链路,包括基础设施、数据、模型、应用层
维度三:判断力(1-5分)
- 1分:按要求做,不做主动判断
- 3分:能在自己负责的范围内做判断,给出有依据的选型建议
- 5分:能在系统级做判断,判断通常被团队认可
维度四:影响力(1-5分)
- 1分:只影响自己
- 3分:能帮助2-3人,在小组内被信任
- 5分:技术判断被跨组采纳,是公司AI技术方向的重要声音
粗略对应:总分8-10分对应P6,12-15分对应P7,17-20分对应P8。
但要注意,这只是帮你发现短板,不是用来给自己贴标签的。维度三和维度四是最容易被忽视的,很多技术很强的工程师在这两个维度上打分并不高。
最后说一点真心话
晋升是个结果,不是目标。如果只盯着晋升,很容易把精力花在"看起来有价值"的事情上,而不是"真正有价值"的事情上。
最稳健的晋升路径是:做真正有挑战的工作,解决真正难的问题,然后把这些工作讲清楚。
AI这个方向给了工程师很多机会,因为这个领域有太多真正难的问题没有解决。一个能把RAG系统做到生产可用且效果优秀的工程师,不愁没有晋升空间。
