和读者聊聊天——1500 期前最后一次随笔
和读者聊聊天——1500 期前最后一次随笔
适读人群:老读者,以及想认识老张的新读者 | 阅读时长:约8分钟 | 核心价值:就是聊聊
这篇文章我打算不讲技术。
不是因为没有技术想说——最近积累了一堆东西想写——而是写到1497了,离1500就三篇,我想在这个节骨眼上喘口气,跟你们聊聊最近我在干嘛,想什么,看什么。
这类文章我平时很少写,觉得"水文"。但今天,我就打算水一篇。
最近在做的项目
有个项目最近占了我很多时间,是给一家中型律师事务所做的AI合同分析工具的升级版。
原本的版本是我去年做的,他们用了大半年,积累了一批使用反馈。这次升级主要是解决两个问题:一是召回质量,有些条款类型AI一直漏;二是律师不愿意看AI给的长段落分析,他们要的是结构化、可以快速扫描的格式。
这两个问题一个是技术问题,一个是产品问题。
技术那个我调了好一段时间,最后发现根本原因是我之前的chunk策略对法律条款不适用——法律文本的语义单元和普通文章不一样,段落边界不一定是语义边界。重新设计了一套针对合同文本的分割逻辑,效果好了很多。
产品那个反而解决得快,就是改了输出的prompt,让AI按表格格式输出,律师扫一眼就能定位到关注点。一天改完,律师反馈说"终于好用了"。
这让我再次意识到:技术问题往往不是真正的阻碍,用户体验的问题才是你被嫌弃的原因。
最近读的书
最近在读黄仁宇的《万历十五年》,断断续续读了很久,最近才读完。
这本书和AI没有任何关系,但我读的时候一直在想一个问题:为什么一个系统明明已经在走向失效,身处其中的人却无法改变?不是因为他们不聪明,万历皇帝不蠢,张居正更是聪明人,问题在于:当一个制度的惯性足够大,个人的努力很难改变轨迹,反而被轨迹塑造。
我觉得这对理解大公司很有用。很多人在大公司里感到无力,觉得自己什么都看到了但什么都做不了,那不是你的问题,是轨道的问题。
扯远了。这本书写得好,推荐给没有读过的人。
另外最近在读一本关于复杂系统的书,叫《系统之美》(Thinking in Systems),多内拉·梅多斯写的。这本书彻底改变了我对"为什么AI系统会产生我们不想要的行为"这个问题的理解。推荐给做AI应用的人,哪怕跳过那些建模的部分,前半部分也很值得。
最近对AI这件事有什么新感受
我最近越来越觉得一件事:AI能力的提升在加速,但真正用好AI的门槛并没有降低,只是换了形式。
三年前,用好AI的门槛是"会写Prompt"。 现在,会写Prompt已经不够了,门槛变成了"会判断AI的输出什么时候可信、什么时候不可信"。
这个判断能力,比写Prompt难多了。它需要你对领域本身有深度理解,才能评估AI给你的答案的质量。
有一个我最近观察到的现象:在AI帮助下,一个中等水平的人可以很快产出一个看起来不错的结果,但辨别这个结果是真的不错还是只是"看起来不错",仍然需要领域专家。
这意味着AI放大的,不是"能力",而是"效率"——如果你本来就有判断力,AI让你做得更快;如果你没有判断力,AI让你做错得更快。
这个判断越来越影响我对"AI能不能替代XXX职位"这个问题的看法。
一件最近让我想了很久的事
有个老读者,关注我超过两年了,最近发消息说:他按照我的建议开始学AI工程,学了差不多一年,也做了几个小项目,但还是没有拿到第一个真实付费客户。他有点沮丧,问我是不是路走错了。
我想了很久才回他。
我没有告诉他"坚持就好",那是废话。
我问他:你做的项目,是你自己想做的,还是你觉得市场上应该有需求的?
他说:我觉得市场上应该有需求的。
我说:这就是问题所在。
不是说"市场需求"是错的起点,而是如果你自己都不确定有没有需求,那你做出来的东西通常是为了验证需求存在,而不是在真正解决问题。用户能感受到这个区别。
我建议他换一种方向:找一个他自己真正遇到过的问题,或者他认识的某个具体的人真实遇到的问题,从那里出发。哪怕市场很小,做出来的东西会更真实,也更容易被第一个付费客户看上。
他说要试试。我不知道结果,但这是我目前能给的最诚实的建议。
离1500就三篇了
写到这里,我突然有点感慨。
1500这个数字,三年前我根本没有想过。当时的目标是:先写100篇,看看有没有人看。然后是写到500,然后是1000,现在是1500。
每个阶段的心态其实都不一样。100篇时的心态是试探,1000篇时的心态是习惯,现在1500篇时的心态是……平静。
不是麻木,不是疲惫。就是平静。
这件事变成了我生活的一部分,就像每天喝咖啡一样自然。而且我发现,当一件事真正变成习惯之后,它带给你的东西反而更多,因为你不再用"有没有收益"这个标准来衡量它,你就是在做这件事。
接下来三篇:1498是100条实战经验,1499是感谢,1500是里程碑文章。
我想好好写这三篇。
好了,聊天到这里,下一篇我们回到正题。
