AI工程师成长复盘:我的转型经历与给后来者的建议
AI工程师成长复盘:我的转型经历与给后来者的建议
适读人群:正在或准备转型AI方向的Java工程师,想了解真实转型故事的技术人 阅读时长:约25分钟
写在前面
这篇文章我改了三稿。
前两稿我写成了"成功学"——从XX开始学AI,三个月后拿到offer,现在年薪多少。写完自己读了一遍,感觉像假的。
第三稿我决定老实写。
写那些让我难受的时刻,那些走错的弯路,那些真正让我改变的节点。
可能这个版本没那么好看,但我觉得对你更有用。
2022年秋天:那个让我开始焦虑的下午
那是一个普通的周三下午,我在公司写一段CRUD代码,和三年前、两年前、一年前写的几乎一样。
一个同事拿着手机走过来,让我看一段文字:"你看ChatGPT写的代码,比你还快。"
我当时笑了,说"这玩意儿还能替代工程师?你信不信"。
但那天下班路上,我一直在想这件事。
不是因为那段代码有多厉害,而是因为我突然意识到:我在靠"记忆力"和"熟练度"赚钱,而不是靠"解决复杂问题的能力"赚钱。 如果有工具能更快地记忆和熟练,我的核心竞争力是什么?
那种感觉很难受。不是恐慌,是一种沉沉的不安。
我做了10年Java开发,做过电商系统、金融后台、政务平台。论熟练程度,我不差。但"熟练"这两个字,第一次让我感到不安全。
第一阶段:盲目期(2022年底-2023年初)
那几个月,我像很多人一样,开始"学AI"。
每天刷各种文章,什么Transformer架构、注意力机制、BERT和GPT的区别……买了好几门课,从Python基础学起,学到pandas、sklearn,想着先把机器学习基础打好。
结果两个月下来,什么都学了一点,什么都没学通。
最难受的是:我不知道学这些跟我的工作有什么关系。
训练一个线性回归模型,和我做的企业软件开发,完全是两个世界。我感觉自己在从头开始,10年的Java经验好像变成了负债——要先清空再重装。
那段时间,我一度想放弃这个方向。
有天晚上我在论坛看到一句话,现在想起来还觉得重要:
"你不需要成为AI研究员,你需要成为能把AI应用到真实系统的工程师。这是两条完全不同的路。"
我读了好几遍。
这话把我敲醒了。我走错方向了。
转折点:换一个视角看AI
2023年3月,我做了一件改变方向的事:停下来问自己,AI能帮我解决什么我现在解决不了的工程问题?
我当时在做一个客服系统。每天有几千条用户咨询,人工回答重复性问题占了60%以上的工作量。这是一个我知道的真实痛点。
我不再去学"AI是什么",而是去研究"我能用AI做什么"。
那时候Spring AI还没有,我用的是Spring Boot + LangChain4j,接OpenAI的API。第一个版本非常粗糙:把FAQ文档拆成段落,用embedding存进向量库,用户问问题就检索相关段落喂给GPT-3.5生成回答。
代码很简单,但跑起来那一刻,我感觉非常不一样。
这是我用过的、我写的代码,在解决一个真实问题。
不是学术玩具,不是跟风Demo,是我在10年工程经验上长出的新能力。
最难的那段路:技术积累期
说实话,2023年到2024年初那段时间,是我做技术以来最密集的学习期,没有之一。
我基本上每天晚上要花2-3小时研究。
难点不是技术本身,而是那个时候信息太乱。
RAG的最佳实践?每个人说的都不一样。向量数据库怎么选?每个月都有新的出现。Prompt工程怎么写?各种"秘籍"满天飞。
我花了大量时间在信息噪音里打转。
真正让我走出来的,是开始写文章。
写文章不是因为想当"博主",而是因为我发现:只有当你能把一个东西写清楚,你才真正理解了它。 每篇文章写完,那个知识点就在我脑子里固化了。
2023年6月我发了第一篇技术文章,写的是"用Spring Boot + OpenAI做一个简单的问答系统"。当时粉丝寥寥,但没关系,写给未来的自己的。
后来写到了100篇。这是我没想到的事。
那些走过的弯路
回头看,有几个弯路让我印象很深:
弯路一:先学Python,再学Java AI
我花了两个月学Python和机器学习,其实完全没必要。Java生态的AI工具已经足够完整,工程化能力更强。对于工程落地,Java是比Python更好的语言。
弯路二:追求"最新最好"的技术
向量数据库我试了Chroma、Pinecone、Qdrant、Weaviate,每个都装了用了,花了大量时间。后来发现PgVector就够用,而且运维成本最低。
"最新"不等于"最合适"。
弯路三:看了太多文章,做了太少项目
有一段时间我每天刷技术文章,以为刷完就掌握了。假的。只有当你真正做一个项目、遇到真实的问题、查资料解决、再遇到下一个问题,技术才会真正属于你。
弯路四:太关注Model,不关注System
早期我花了大量时间测试哪个模型效果更好,反复比较GPT-3.5 vs GPT-4,研究各种Prompt技巧。
后来才明白:对工程师来说,检索质量、系统设计、数据管理才是决定最终效果的因素,比换个好模型有用得多。
让我真正成长的几件事
第一件:做一个完整的生产级项目
2024年初,我接了一个企业知识库项目,用AI改造一个内部搜索系统。这是我第一次把AI系统真正推上生产。
过程比我预想的难太多了。数据清洗、权限控制、幻觉处理、监控运维……每一个环节都有真实的坑。
但做完那个项目,我对AI工程的理解跨了一个台阶。不再是"会调API",而是"能交付一个稳定运行的AI系统"。
第二件:从被动学习到主动输出
写公众号是一件改变了我的事。
不是因为涨了多少粉丝,而是因为"教别人"这件事,逼着我把每个知识点搞清楚。
每次写文章之前,我都会重新看一遍相关的官方文档,自己把代码跑一遍,确保能跑通再写出来。这个过程让我踩了很多坑——但都是在自己电脑上踩的,不是在生产上踩的。
第三件:组建了一个同行圈子
大概是2024年中,我开了知识星球。起初真的没想太多,就是想有个地方,把那些在公众号上写不开的东西写出来,同时能跟有类似经历的工程师聊一聊。
没想到进来了一两百人,后来慢慢到了一千多人。
这件事对我来说最大的收获是:听别人的问题,是最好的学习方式之一。
星球里每天都有人问问题。有些问题很基础,有些很犀利。回答这些问题的过程,让我的知识结构越来越完整,越来越知道哪些东西是真正重要的,哪些只是噪音。
低谷时刻
不是一路高歌。
2023年底有一段时间,我很迷茫。
那时候GPT-4出了,各种开源模型飞速迭代,感觉自己刚学会一个东西,它就过时了。LangChain被人批评架构烂,Spring AI还没GA,整个生态像是一锅滚水,不知道该抓哪个。
有两周我几乎没有碰AI相关的东西,写了几篇传统的Java技术文章。
那段时间我问了自己一个问题:如果AI这个方向没有我想的那么大,我是否还会做这件事?
答案是:会。
因为做这些事情本身让我快乐——研究一个技术问题、写一篇文章、帮一个人解决困惑。这些事情的价值不取决于AI的风口有多大。
想清楚这一点,状态就回来了。
我现在的状态
现在的我,和2022年那个在焦虑中写CRUD的自己,确实不一样了。
不一样不在于"我现在做AI了",而在于:
我对技术变化不那么焦虑了。 因为我知道,技术会变,但把技术转化成解决方案的能力是积累的。学会RAG的过程中,我学的不只是RAG,是"如何把新技术快速工程化落地"这件事。
我对自己的价值更清楚了。 Java工程师做AI有独特的优势:工程严谨性、系统设计能力、性能和可靠性意识。这些是别人很难复制的。
我学会了在不确定中做决定。 2025年的AI技术还在快速变化。但我不再等"稳定了再学",而是学会了"在移动中瞄准"。
给后来者的建议
如果你现在正在考虑转型AI方向,我想说几句实在的:
第一:不要从"学AI"开始,从"用AI解决一个问题"开始。
找一个你现在的工作中存在的真实痛点,想想AI能不能帮上忙。做出来,哪怕很粗糙,你会学到比读100篇文章更多的东西。
第二:Java工程师的优势是工程能力,不要丢掉它。
你的Spring、你的架构设计、你的生产运维经验,这些在AI时代更值钱,不是更不值钱。AI系统要上生产,需要的是工程能力,而不只是模型调用能力。
第三:接受"永远有东西不懂"的状态。
AI领域变化快,这是事实。但不是说你要什么都会,而是说你要培养快速学习、快速验证的能力。我现在学一个新东西,从看文档到跑通一个Demo,一般不超过两天。这个能力比"已经掌握什么"更重要。
第四:写出来,不管写给谁。
记笔记,写文章,或者在星球里分享,都行。输出是最好的学习方式。而且你会发现,当你开始输出,很快就有人来找你交流,你的学习速度会快很多。
第五:找一个同行圈子。
一个人摸索很慢。不是因为智力问题,而是因为信息不对称——你不知道哪些方向已经被验证,哪些是死路。有一个能交流的圈子,能帮你少走很多弯路。
写在最后
这篇文章写完,我发现我想说的其实很简单:
转型这件事,没有捷径,但有方法。
最重要的方法不是找到最好的教程或最好的课,而是开始做,然后在做的过程中持续学。
我写这个公众号,是因为我希望能把自己踩过的坑分享出来,让后来的人少踩一点。
不是所有人都能绕开所有坑,但能少一些,就值得了。
感谢每一个看到这里的人。你能看到这里,说明你是认真在思考这件事的人。
认真的人,不会混得太差。
