// MCP Server实现示例 - Spring AI已经支持
@Configuration
public class McpServerConfig {

    @Bean
    public McpServer mcpServer(List<McpToolProvider> toolProviders) {
        return McpServer.builder()
            .name("enterprise-tools")
            .version("1.0.0")
            .tools(toolProviders)
            .build();
    }
}

// 把企业系统功能暴露为MCP工具
@Component
public class HrSystemMcpTool implements McpToolProvider {

    @Override
    public List<Tool> getTools() {
        return List.of(
            Tool.builder()
                .name("query_employee_leave")
                .description("查询员工的剩余假期天数")
                .inputSchema(Schema.of(Map.of(
                    "employeeId", Schema.string("员工工号"),
                    "year", Schema.integer("查询年份")
                )))
                .executor(this::queryLeave)
                .build()
        );
    }

    private Object queryLeave(Map<String, Object> params) {
        String employeeId = (String) params.get("employeeId");
        int year = (int) params.get("year");
        return hrService.getLeaveBalance(employeeId, year);
    }
}

未来趋势：企业内部系统（ERP、HR、CRM）会普遍提供MCP接口，AI助手通过MCP标准协议访问企业数据，Java工程师的工作重心会从"写业务逻辑代码"转向"把业务能力封装为AI可用的工具"。

趋势三：可观测性成为标配

AI应用有一个普通应用没有的问题：黑盒性。你不知道AI为什么给出这个答案，不知道检索命中了哪些文档，不知道哪次调用消耗了多少token。

Spring AI 1.0已经内置了对OpenTelemetry的支持，未来这块会持续深化：

# 配置AI可观测性
management:
  tracing:
    enabled: true
  otlp:
    tracing:
      endpoint: http://jaeger:4318/v1/traces

spring:
  ai:
    openai:
      chat:
        options:
          model: gpt-4o
    # 启用AI相关的指标收集
    observation:
      include-prompt: true       # 记录Prompt内容
      include-completion: true   # 记录Completion内容
      include-error: true        # 记录错误详情

// 自定义AI调用追踪
@Service
public class ObservableAiService {

    private final ChatClient chatClient;
    private final ObservationRegistry observationRegistry;

    public String chat(String question, String userId) {
        // 创建带业务标签的Observation
        Observation observation = Observation.createNotStarted(
            "ai.knowledge.query", observationRegistry)
            .highCardinalityKeyValue("user.id", userId)
            .lowCardinalityKeyValue("query.type", classifyQuery(question))
            .start();

        try (Observation.Scope scope = observation.openScope()) {
            String answer = chatClient.prompt()
                .user(question)
                .call()
                .content();

            observation.event(Observation.Event.of("answer.generated"));
            return answer;

        } catch (Exception e) {
            observation.error(e);
            throw e;
        } finally {
            observation.stop();
        }
    }
}

未来形态：每一次AI调用的Prompt、token消耗、响应时间、检索命中率都会像HTTP请求一样被完整记录和可视化，AI应用的运维会和传统Web应用一样成熟。

趋势四：本地模型成为主流选项

原因很直接：

成本：DeepSeek-R1等国产开源模型性能追上GPT-4，成本低90%
数据安全：敏感行业（金融、医疗、政府）数据不能出内网
延迟：本地模型P99延迟更稳定，不受网络影响

Spring AI已经对Ollama有良好的支持，这个方向会持续加强：

@Configuration
@Profile("on-premise")  // 私有化部署时激活
public class LocalModelConfig {

    @Bean
    public ChatModel chatModel() {
        // 完全本地推理，数据不出内网
        return OllamaChatModel.builder()
            .ollamaApi(OllamaApi.builder()
                .baseUrl("http://gpu-server:11434")
                .build())
            .defaultOptions(OllamaOptions.builder()
                .model("deepseek-r1:32b")
                .temperature(0.1)
                .numCtx(8192)
                .build())
            .build();
    }

    @Bean
    public EmbeddingModel embeddingModel() {
        return OllamaEmbeddingModel.builder()
            .ollamaApi(OllamaApi.builder()
                .baseUrl("http://gpu-server:11434")
                .build())
            .defaultOptions(OllamaOptions.builder()
                .model("mxbai-embed-large")
                .build())
            .build();
    }
}

趋势五：AI测试工程化

目前AI测试是个大问题：AI输出不确定，传统单元测试框架不适用。未来会有专门的AI测试框架：

// AI测试的未来形态（部分已经实现）
@SpringBootTest
class AiQualityTest {

    @Autowired
    private KnowledgeBaseQaService qaService;

    @Test
    @AiEval(metric = "faithfulness", threshold = 0.8)
    void testAnswerFaithfulness() {
        // 测试回答是否忠实于检索文档（不编造）
        String answer = qaService.answer("公司的年假政策是什么？");
        // AiEval框架自动评估answer是否基于知识库内容
    }

    @Test
    void testAnswerWithRagas() {
        // 使用RAGAS指标评估RAG质量
        List<EvalCase> cases = loadEvalDataset("hr-qa-dataset.json");

        RagasEvaluator evaluator = RagasEvaluator.builder()
            .faithfulness(0.8)      // 忠实度 >= 0.8
            .answerRelevancy(0.75)  // 答案相关性 >= 0.75
            .contextRecall(0.7)     // 上下文召回 >= 0.7
            .build();

        EvalReport report = evaluator.evaluate(cases, qaService::answer);

        assertThat(report.getOverallScore()).isGreaterThan(0.75);
    }
}

对Java工程师意味着什么

整理成一张技能演进图：

技能维度	2024年要求	2026年要求
LLM接入	API调用	多模型管理 + 路由策略
RAG工程	基础向量检索	混合检索 + 重排序 + 评估体系
Agent开发	简单Tool调用	多Agent协作 + 状态管理
可观测性	日志	AI链路追踪 + 质量指标
测试	功能测试	AI输出质量评估 + 回归测试
成本管控	粗放使用	Token预算 + 模型路由降本
数据安全	基础权限	提示注入防御 + 数据脱敏

变化的本质是：AI工程师需要对"不确定性"进行工程化管理。 传统工程追求确定性，AI工程接受概率性，但在这个概率性上建立质量保障体系。

我的行动建议

对于现在的Java工程师，接下来两年最值得做的三件事：

第一：深挖Spring AI生产实践，不是跟着教程走，是真实落地 每做一个项目，都要有完整的可观测性、质量评估，积累真实数据。这是以后谈架构时最有说服力的东西。

第二：至少完整实现一个Agent系统 不是Demo，是能处理真实问题、有完整工具集的系统。Agent开发是接下来两年最核心的技能之一。

第三：了解模型，不用精通 不是要你去训练大模型，但要知道不同模型的能力边界、Token经济、推理模式。模型理解深度直接影响架构决策质量。

Java在AI时代不会消失，它会成为AI工程的主要工程语言之一——像C++之于游戏引擎一样，在需要高可靠性、高并发、大型企业系统的地方，Java的优势依然无可替代。

只是写法变了，思维方式变了。