// 表面能力：会用RAG
List<Document> docs = vectorStore.similaritySearch(query);
String answer = chatClient.prompt().user(buildPrompt(docs, question)).call().content();

// 深度能力：能解释这些参数背后的取舍
/*
 * withTopK(5): 为什么是5而不是3或10？
 * - K太小：可能遗漏关键信息
 * - K太大：噪音增多，超出Context Window，成本增加
 * - 5是在召回率和精确性之间的平衡点
 *
 * withSimilarityThreshold(0.7f): 为什么是0.7？
 * - 阈值太低：不相关内容进入Context，AI会产生幻觉
 * - 阈值太高：过滤掉本来有用的边缘相关内容
 * - 0.7对于text-embedding-3-small模型是实践验证的合理值
 *
 * Embedding模型的选择为什么影响这个阈值？
 * - 不同模型的向量空间分布不同
 * - OpenAI模型和BGE模型的0.7含义完全不同
 */

这种思维方式，才是你在团队里的核心价值。AI工具生成不了这种判断，初级工程师也讲不清楚。

3.2 建立你的技术知识图谱

/**
 * 这是一段可以用来和面试官/技术评审对话的代码
 * 展示的不只是"能写出来"，而是"知道为什么这么写"
 */
@Service
@Slf4j
public class ExpertRagService {

    private final VectorStore vectorStore;
    private final ChatClient chatClient;
    private final EmbeddingModel embeddingModel;

    /**
     * 生产级RAG查询
     * 每个设计决策都有明确的技术原因
     */
    public RagResult query(String question, RagConfig config) {
        long startTime = System.currentTimeMillis();

        // 决策1：查询扩展（Query Expansion）
        // 原因：用户输入往往过于简短，直接检索召回率低
        // 技术：让LLM重写查询，生成3个语义相似的变体
        List<String> expandedQueries = expandQuery(question);

        // 决策2：多路检索（Multi-retrieval）
        // 原因：不同查询变体可能触发不同的相关文档
        // 风险：成本是单次检索的N倍，需要控制N的大小
        List<Document> allDocs = expandedQueries.stream()
            .flatMap(q -> vectorStore.similaritySearch(
                SearchRequest.query(q)
                    .withTopK(config.getTopK())
                    .withSimilarityThreshold(config.getThreshold())
            ).stream())
            .distinct()  // 去重
            .toList();

        // 决策3：MMR去重（Maximal Marginal Relevance）
        // 原因：避免context里都是相似内容，浪费token
        // 效果：在相关性和多样性之间取平衡
        List<Document> diverseDocs = applyMmr(allDocs, question, config.getTopK());

        // 决策4：Context排序（Lost in Middle问题）
        // 研究发现：LLM对context中间的内容关注度最低
        // 解决：将最相关的文档放在首尾
        List<Document> orderedDocs = reorderForLlm(diverseDocs);

        long retrievalTime = System.currentTimeMillis() - startTime;
        log.info("RAG检索完成: expandedQueries={}, rawDocs={}, finalDocs={}, time={}ms",
            expandedQueries.size(), allDocs.size(), orderedDocs.size(), retrievalTime);

        String context = orderedDocs.stream()
            .map(Document::getContent)
            .collect(java.util.stream.Collectors.joining("\n\n---\n\n"));

        String answer = chatClient.prompt()
            .system("基于以下知识库内容准确回答问题：\n\n" + context)
            .user(question)
            .call()
            .content();

        return new RagResult(answer, orderedDocs, retrievalTime);
    }

    private List<String> expandQuery(String originalQuery) {
        String expandPrompt = """
            对以下问题生成3个语义相似的查询变体，用于文档检索。
            要求：每个变体从不同角度表达同一需求。
            只输出查询列表，每行一个，不要编号。
            原始问题：%s
            """.formatted(originalQuery);

        String response = chatClient.prompt().user(expandPrompt).call().content();
        return List.of(response.split("\n"));
    }

    private List<Document> applyMmr(List<Document> docs, String query, int k) {
        // MMR算法简化实现
        // 完整实现参考star球源码
        return docs.stream().limit(k).toList();
    }

    private List<Document> reorderForLlm(List<Document> docs) {
        // Lost-in-Middle解决：最相关放首尾
        if (docs.size() <= 2) return docs;
        var result = new java.util.ArrayList<Document>(docs.size());
        // 奇数位置放在开头，偶数位置放在结尾
        for (int i = 0; i < docs.size(); i++) {
            if (i % 2 == 0) result.add(0, docs.get(i));
            else result.add(docs.get(i));
        }
        return result;
    }

    public record RagResult(String answer, List<Document> sourceDocs, long retrievalTimeMs) {}
}

四、行业经验：让你不可替代的关键

4.1 行业经验 ≠ 只是"在那个行业工作过"

很多工程师的"行业经验"停留在：我在金融公司写过三年CRUD。

真正有护城河价值的行业经验是：

行业经验层次	示例	护城河强度
表面经验	在金融公司写过代码	弱
业务理解	懂金融产品的逻辑和流程	中
合规知识	理解监管要求、风险控制规则	强
领域判断力	能判断AI在特定场景是否合规/可信	极强

4.2 行业+AI的稀缺组合

每个行业都有自己的"AI+行业"稀缺岗位。你在哪个行业有积累，那个行业就是你的主战场。

五、构建护城河的行动路径

5.1 12个月的成长地图

第1-3个月（技术基础）：
  ✓ 掌握Spring AI核心：ChatClient、RAG、Function Calling
  ✓ 完成2-3个完整的AI项目，能说清楚架构决策
  ✓ 理解Embedding、向量数据库的工作原理

第4-6个月（深化行业结合）：
  ✓ 在当前行业找到3个AI可以改进的业务场景
  ✓ 至少完成1个有业务价值的AI项目，要有数据
  ✓ 输出：内部技术分享、公众号/掘金文章

第7-9个月（建立影响力）：
  ✓ 在团队里成为"AI问题找你"的人
  ✓ 参与1个行业AI相关的开源项目或标准制定
  ✓ 有至少1个量化的业务改进结果（省了多少钱/快了多少）

第10-12个月（形成护城河）：
  ✓ 简历上有2-3个完整的AI工程项目，能讲清楚技术选型
  ✓ 有行业特定的AI应用经验（如金融AI合规、医疗AI数据等）
  ✓ 能对"该不该上AI/上什么AI"做出有说服力的判断

5.2 一个量化自己护城河的方法

护城河指数 = 技术深度分（0-100）× 行业经验分（0-100）/ 100

技术深度评分：
  - 能独立设计RAG系统架构：+30
  - 能解释Embedding模型的选型依据：+20
  - 有生产级AI系统的运维经验：+25
  - 能做AI应用的性能调优：+25

行业经验评分：
  - 在某行业工作超过3年：+30
  - 对该行业的核心业务规则有深入理解：+30
  - 有该行业的监管/合规知识：+25
  - 有与该行业客户沟通的经验：+15

六、老张的建议

小周问完我之后沉默了很久，然后发了条消息："我在金融公司做了六年，但从来没想过把这个当成优势。"

我说："现在还不晚。你懂交易系统、懂风控逻辑、懂监管要求——这些是任何一个刚从学校出来的AI工程师短期内学不到的。你现在只需要在技术侧补上AI工程能力，然后成为那个同时懂金融和AI的人。"

转型不是放弃过去，而是在原有积累上叠加新的能力。

你在哪个行业工作，那个行业就是你的起点，也是你最大的竞争壁垒。