第2187篇：LLM系统的安全审计——记录每一次AI决策的完整追踪链路

老张2026/4/30大约 7 分钟

第2187篇：LLM系统的安全审计——记录每一次AI决策的完整追踪链路

适读人群：在合规性要求高的行业落地AI的工程师 | 阅读时长：约16分钟 | 核心价值：构建不可篡改的AI决策审计链路，满足监管要求并支持事故追查

监管部门的检查通知在早上九点到的邮件里。

内容是：请提供过去六个月，所有AI辅助决策的完整记录，包括输入数据、模型参数、输出结果，以及决策的最终采用情况。

我们的AI系统已经跑了八个月。前两个月什么都没记录，后来补了基础日志，但根本不满足"完整记录"的要求——模型版本没记录，Prompt内容没记录，哪个操作员最终采用了AI建议也没记录。

花了一周时间，最终拼凑出了一份勉强满足要求的报告。那一周的狼狈让我彻底明白了：AI审计日志不是事后工作，是从第一天就要建立的基础设施。

AI审计的合规性要求

不同监管场景的AI审计要求：

金融行业（央行、证监会要求）：
  - 信贷/投资建议的AI辅助决策必须有完整记录
  - 记录保存期限：5-7年
  - 必须包含：数据输入、模型版本、输出结果、人工采纳情况
  - 必须不可篡改（不能事后修改）

医疗行业（卫健委要求）：
  - 诊断辅助AI的每次输出都需要记录
  - 医生的最终决定和AI建议的对比
  - 患者知情同意记录

欧盟AI法案（EU AI Act）：
  - 高风险AI系统必须有日志记录能力
  - 记录必须包含足够信息以进行事后审计
  - 处理个人数据时要记录数据来源

GDPR：
  - AI决策如果影响个人，当事人有权要求解释
  - 必须能重现当时的决策过程

共同要求：
  1. 完整性：不能遗漏任何决策记录
  2. 不可篡改性：记录一旦写入不能被修改
  3. 可追溯性：能从最终决策反追到所有输入
  4. 时效性：有明确的时间戳

审计日志的数据模型

/**
 * AI决策审计日志
 * 
 * 这个数据结构必须完整记录一次AI辅助决策的全貌
 */
@Entity
@Table(name = "ai_audit_logs")
@Data
@Builder
@Immutable  // 标记为不可变，防止代码层面的修改
public class AIAuditLog {
    
    @Id
    private String auditId;         // UUID，不可重复
    
    // === 请求标识 ===
    private String sessionId;       // 会话ID（可追踪多轮对话）
    private String requestId;       // 本次请求的唯一ID
    private String traceId;         // 分布式追踪ID（关联系统内其他日志）
    
    // === 用户信息（脱敏） ===
    private String userId;          // 脱敏后的用户ID
    private String operatorId;      // 操作员ID（人工审核场景）
    private String clientIp;        // 脱敏后的IP
    
    // === AI系统配置（快照） ===
    private String modelId;         // 使用的模型ID（如：gpt-4-turbo-2024-04-09）
    private String modelVersion;    // 模型版本
    private String promptVersionId; // Prompt版本ID
    
    @Column(columnDefinition = "TEXT")
    private String systemPromptHash;  // System Prompt的Hash（不存明文，防泄露）
    private String systemPromptVersionId;  // 可通过这个ID查阅Prompt内容
    
    // === 输入（脱敏后） ===
    @Column(columnDefinition = "TEXT")
    private String userInputAnonymized;  // 脱敏后的用户输入
    
    @Column(columnDefinition = "TEXT")
    private String contextSummary;     // 上下文摘要（不存完整内容）
    
    private String inputDataHash;      // 完整输入的Hash（用于完整性验证）
    
    // === 检索信息（RAG场景） ===
    private List<String> retrievedDocumentIds;  // 检索到的文档ID列表
    private List<Double> relevanceScores;        // 相关性分数
    
    // === 输出 ===
    @Column(columnDefinition = "TEXT")
    private String aiOutputHash;       // AI输出的Hash
    
    @Column(columnDefinition = "TEXT")
    private String aiOutputSummary;    // AI输出摘要（不存完整内容）
    
    private double confidenceScore;    // AI置信度
    
    // === 决策结果 ===
    @Enumerated(EnumType.STRING)
    private DecisionOutcome humanDecision;  // 人工的最终决定
    
    private String humanDecisionReason;     // 人工修改AI建议的原因（如果有）
    private String operatorComment;         // 操作员备注
    
    // === 质量评估 ===
    private Double qualityScore;       // 事后评估分数（如果有）
    private String qualityEvaluatorId; // 评估者（可能是自动系统）
    
    // === 时间戳（不可修改） ===
    private Instant requestTime;
    private Instant responseTime;
    private long latencyMs;
    
    // === 不可篡改性保证 ===
    private String recordHash;         // 整条记录的Hash（用于检测篡改）
    private String previousRecordHash; // 上一条记录的Hash（形成链式结构）
    
    public enum DecisionOutcome {
        AI_ADOPTED,        // 采用了AI建议
        AI_MODIFIED,       // 修改了AI建议
        AI_REJECTED,       // 拒绝了AI建议
        NO_HUMAN_REVIEW    // 自动执行，没有人工审核
    }
}

不可篡改审计日志实现

/**
 * 不可篡改的审计日志服务
 * 
 * 使用区块链式哈希链确保日志不可篡改
 */
@Service
@RequiredArgsConstructor
@Slf4j
public class ImmutableAuditLogService {

    private final AIAuditLogRepository auditRepo;
    private final MessageDigestProvider digestProvider;
    private final AuditLogEncryptionService encryptionService;

    /**
     * 写入审计日志
     * 
     * 每条记录都链接到上一条，形成不可篡改的链条
     */
    @Transactional
    public AIAuditLog writeLog(AuditLogCreateRequest request) {
        // 获取最新记录的Hash，用于构建链条
        String previousHash = auditRepo.findLatestHash()
            .orElse("GENESIS");  // 第一条记录
        
        // 构建记录（先不含Hash）
        AIAuditLog log = buildLog(request, previousHash);
        
        // 计算本条记录的Hash
        String recordHash = computeRecordHash(log);
        log.setRecordHash(recordHash);
        
        // 保存（不可修改）
        AIAuditLog saved = auditRepo.save(log);
        
        log.info("审计日志已写入: auditId={}", saved.getAuditId());
        
        return saved;
    }

    /**
     * 验证审计日志的完整性
     * 
     * 遍历整个链条，验证每条记录的Hash是否正确
     */
    public IntegrityCheckResult verifyIntegrity(
            LocalDateTime from, LocalDateTime to) {
        
        List<AIAuditLog> logs = auditRepo.findByTimeRange(from, to);
        
        int totalChecked = 0;
        int tamperingDetected = 0;
        List<String> tampered = new ArrayList<>();
        
        String previousHash = null;
        
        for (AIAuditLog log : logs) {
            // 重新计算这条记录的Hash
            String expectedHash = computeRecordHash(log);
            
            // 如果Hash不匹配，说明记录被篡改
            if (!expectedHash.equals(log.getRecordHash())) {
                tamperingDetected++;
                tampered.add(log.getAuditId());
                log.error("审计日志完整性失败！auditId={}", log.getAuditId());
            }
            
            // 验证链条连续性
            if (previousHash != null && 
                    !log.getPreviousRecordHash().equals(previousHash)) {
                tamperingDetected++;
                tampered.add(log.getAuditId() + "(chain break)");
            }
            
            previousHash = log.getRecordHash();
            totalChecked++;
        }
        
        return new IntegrityCheckResult(
            totalChecked, tamperingDetected, tampered,
            tamperingDetected == 0);
    }

    /**
     * 计算记录Hash
     * 
     * 包含记录的所有关键字段，确保任何修改都会导致Hash变化
     */
    private String computeRecordHash(AIAuditLog log) {
        String content = String.join("|",
            log.getAuditId(),
            log.getRequestId(),
            log.getUserId(),
            log.getModelId(),
            log.getSystemPromptVersionId(),
            log.getInputDataHash(),
            log.getAiOutputHash(),
            log.getRequestTime().toString(),
            log.getPreviousRecordHash()
        );
        
        return DigestUtils.sha256Hex(content);
    }
}

完整调用链追踪

/**
 * 分布式追踪集成
 * 
 * 把AI审计日志和分布式追踪关联，实现完整的调用链可见性
 */
@Component
@RequiredArgsConstructor
public class AICallChainTracer {

    private final Tracer tracer;  // OpenTelemetry Tracer
    private final ImmutableAuditLogService auditLogService;

    /**
     * 包装LLM调用，记录完整追踪
     */
    public <T> T traceWithAudit(
            String operationName,
            Callable<T> operation,
            AuditContext auditContext) throws Exception {
        
        Span span = tracer.spanBuilder("llm." + operationName)
            .setAttribute("llm.model", auditContext.getModelId())
            .setAttribute("llm.prompt_version", auditContext.getPromptVersionId())
            .setAttribute("user.id", auditContext.getAnonymizedUserId())
            .startSpan();
        
        try (Scope scope = span.makeCurrent()) {
            long startTime = System.currentTimeMillis();
            T result = operation.call();
            long latencyMs = System.currentTimeMillis() - startTime;
            
            span.setAttribute("llm.latency_ms", latencyMs);
            span.setStatus(StatusCode.OK);
            
            // 写入审计日志
            auditLogService.writeLog(AuditLogCreateRequest.builder()
                .traceId(span.getSpanContext().getTraceId())
                .operationName(operationName)
                .latencyMs(latencyMs)
                .auditContext(auditContext)
                .result(result)
                .build());
            
            return result;
            
        } catch (Exception e) {
            span.setStatus(StatusCode.ERROR, e.getMessage());
            span.recordException(e);
            throw e;
        } finally {
            span.end();
        }
    }
}

审计日志查询与报告

/**
 * 审计报告生成
 * 
 * 面向监管检查，生成可提交的审计报告
 */
@Service
@RequiredArgsConstructor
public class AuditReportService {

    private final AIAuditLogRepository auditRepo;
    private final PromptVersionRepository promptVersionRepo;

    /**
     * 生成监管报告
     * 
     * 可以按用户、时间范围、决策类型过滤
     */
    public AuditReport generateRegulatoryReport(
            AuditReportRequest request) {
        
        List<AIAuditLog> logs = auditRepo.findByFilters(
            request.getFromTime(),
            request.getToTime(),
            request.getUserId(),
            request.getDecisionType());
        
        // 统计基本信息
        long totalDecisions = logs.size();
        long aiAdoptedCount = logs.stream()
            .filter(l -> l.getHumanDecision() == DecisionOutcome.AI_ADOPTED)
            .count();
        long aiRejectedCount = logs.stream()
            .filter(l -> l.getHumanDecision() == DecisionOutcome.AI_REJECTED)
            .count();
        
        // 关联Prompt版本（审计时能看到当时用的是哪个Prompt）
        Map<String, String> promptVersionDetails = logs.stream()
            .map(AIAuditLog::getSystemPromptVersionId)
            .distinct()
            .collect(Collectors.toMap(
                id -> id,
                id -> promptVersionRepo.findById(id)
                    .map(PromptVersion::getChangeDescription)
                    .orElse("版本信息缺失")));
        
        // 验证日志完整性
        IntegrityCheckResult integrity = auditLogService.verifyIntegrity(
            request.getFromTime(), request.getToTime());
        
        return AuditReport.builder()
            .reportId(UUID.randomUUID().toString())
            .fromTime(request.getFromTime())
            .toTime(request.getToTime())
            .totalDecisions(totalDecisions)
            .aiAdoptionRate((double) aiAdoptedCount / totalDecisions)
            .aiRejectionRate((double) aiRejectedCount / totalDecisions)
            .modelVersionsUsed(getDistinctModelVersions(logs))
            .promptVersionDetails(promptVersionDetails)
            .integrityCheckPassed(integrity.isPassed())
            .generatedAt(Instant.now())
            .build();
    }
}

核心洞察：审计不是合规负担，是事故响应能力

文章开头那次监管检查后，我从一个"审计是合规负担"的想法，转变成了"审计是系统能力"。

审计日志至少在三个场景下救过我们：

用户投诉追查：用户说"AI给我推荐了错误的产品"，我们能精确找到当时的对话，核实到底发生了什么，而不是双方各执一词。
模型版本回归分析：某个Prompt版本上线后用户满意度下降，我们通过审计日志找到了下降前后的回答对比，精确定位了问题。
安全事件调查：发现有用户试图通过多轮对话越狱，审计日志让我们能完整重现攻击路径，修复安全漏洞。

几个工程实践：

Hash链是审计不可篡改的核心机制，实现成本低，但价值极高。不要存明文Prompt，存Hash + 版本ID，既能防止数据泄露，又能证明用的是哪个版本。
设计时考虑GDPR/数据合规。审计日志包含用户行为数据，必须有数据脱敏、保留期限和删除机制。
把审计写入作为标准切面，而不是每个接口单独实现。用AOP或拦截器统一处理，确保覆盖所有AI调用点，不遗漏。