第2293篇：隐私计算与AI——同态加密和安全多方计算的工程入门

老张2026/4/30大约 7 分钟

第2293篇：隐私计算与AI——同态加密和安全多方计算的工程入门

适读人群：对隐私计算感兴趣、想了解工程可行性的AI工程师 | 阅读时长：约14分钟 | 核心价值：理解同态加密和MPC的工程本质，判断它们在AI场景下的实际应用边界

有读者问我：联邦学习说是数据不出域，但梯度里是不是还是有信息？别人能不能从梯度反推出原始数据？

这个问题问得很好。确实，梯度攻击（Gradient Inversion Attack）理论上可以从共享的梯度里重构出部分原始数据。联邦学习的隐私保障不是绝对的。

那有没有更强的隐私保障？有——同态加密和安全多方计算（MPC）。这两个技术能提供数学上可证明的隐私保证，但代价是极高的计算开销。

这篇文章的目标是：让你理解这两个技术是什么、能做什么、工程上的代价是什么，帮你判断什么时候值得用。

同态加密（Homomorphic Encryption）

同态加密允许在密文上直接做计算，不需要解密。计算的结果解密后，等于在明文上做同样计算的结果。

用一个类比：想象你把一份数据装进一个特殊的手套盒，别人可以隔着盒子做一些操作（加法、乘法），操作完的结果还是装在盒子里。你拿回来打开盒子，得到的是操作结果，而别人全程没有看到原始数据。

部分同态加密（PHE）：只支持加法或乘法其中一种操作，性能较好，工程可用。

全同态加密（FHE）：支持任意计算，但计算开销极大——目前FHE做一次128位乘法需要几十毫秒，比明文运算慢100万倍以上。

在AI场景里，同态加密的主要用途是保护用于推理的数据：用户把敏感数据加密后发给服务器，服务器在密文上运行AI模型推理，返回加密的结果，用户解密得到答案。服务器全程没有看到用户的原始数据。

// 使用Microsoft SEAL库（通过JNI调用）做同态加密示例
// 注意：这是概念演示，真实FHE开销极大

@Service
public class HomomorphicEncryptionDemo {
    
    // Microsoft SEAL的Java封装
    private final SealContext sealContext;
    private final Encryptor encryptor;
    private final Decryptor decryptor;
    private final Evaluator evaluator;
    
    /**
     * 演示：在加密数据上做简单的线性运算（神经网络的一层）
     * 真实场景中这会慢得多
     */
    public EncryptedVector encryptedLinearLayer(
            EncryptedVector input,
            PlainMatrix weights,
            PlainVector bias) {
        
        // 矩阵乘法：encrypted_input × plaintext_weights
        // 同态加密支持"密文×明文"，比"密文×密文"快很多
        EncryptedVector result = evaluator.multiplyPlain(input, weights);
        
        // 加偏置：encrypted_result + plaintext_bias
        evaluator.addPlainInplace(result, bias);
        
        return result;
    }
    
    /**
     * 演示：用户端加密数据
     */
    public EncryptedVector encryptUserData(float[] userData) {
        // 对数据进行编码（浮点数需要特殊编码格式）
        Plaintext encoded = ckksEncoder.encode(userData, scale);
        return new EncryptedVector(encryptor.encrypt(encoded));
    }
    
    /**
     * 演示：用户端解密结果
     */
    public float[] decryptResult(EncryptedVector encryptedResult) {
        Plaintext decrypted = decryptor.decrypt(encryptedResult.getCiphertext());
        return ckksEncoder.decode(decrypted);
    }
}

同态加密的工程现实：

目前FHE的性能瓶颈是数量级的问题，不是优化的问题。即使是最新的FHE库，在AI推理上也比普通推理慢几个数量级。一个在GPU上10ms完成的推理任务，用FHE可能需要数小时。

实际可用的是部分同态加密，用在非常具体的场景：

加密的统计查询（只需要加法）
简单的打分排名（线性运算）

全同态加密目前主要在学术界和实验室，工程化还需要相当长的时间。

安全多方计算（MPC）

MPC解决的问题：多个参与方想共同计算一个函数的结果，但每个参与方都不想让其他参与方看到自己的输入。

经典例子——百万富翁问题：Alice和Bob想知道谁更有钱，但都不想透露自己的具体财富数字。MPC可以让他们计算出"谁更有钱"这个答案，而不泄露具体数字。

在AI联邦学习中，MPC可以用于更安全的梯度聚合：多个参与方的梯度通过MPC协议聚合，服务器只看到聚合结果，看不到任何参与方的单独梯度。

常见的MPC协议：

秘密共享（Secret Sharing）：把秘密值分拆成N份，分发给N个参与方，只有收集到足够多份才能重建
混淆电路（Garbled Circuit）：适合通用计算，但通信开销大
同态MAC：适合线性计算的验证

// 用秘密共享实现MPC聚合的简化示例
@Service
public class MpcGradientAggregation {
    
    private final int numParticipants;
    private final SecureRandom secureRandom = new SecureRandom();
    
    /**
     * 加法秘密共享：把梯度分成n份，发给n个参与方
     * 任意n份相加等于原始梯度
     */
    public List<float[]> shareGradient(float[] gradient) {
        int n = numParticipants;
        List<float[]> shares = new ArrayList<>();
        
        // 创建n-1个随机份
        for (int i = 0; i < n - 1; i++) {
            float[] share = new float[gradient.length];
            for (int j = 0; j < gradient.length; j++) {
                // 在有限域上生成随机数（简化：用float）
                share[j] = (secureRandom.nextFloat() - 0.5f) * 2;
            }
            shares.add(share);
        }
        
        // 最后一份 = 原始值 - 所有随机份的和
        float[] lastShare = new float[gradient.length];
        for (int j = 0; j < gradient.length; j++) {
            lastShare[j] = gradient[j];
            for (float[] share : shares) {
                lastShare[j] -= share[j];
            }
        }
        shares.add(lastShare);
        
        return shares;
    }
    
    /**
     * 聚合服务器：只能看到所有份额的总和，看不到任何参与方的原始梯度
     */
    public float[] aggregateShares(List<List<float[]>> allParticipantsShares) {
        // allParticipantsShares[i][j] = 参与方i给聚合服务器j的份额
        // 聚合服务器把收到的所有份额相加，得到聚合结果的一部分
        
        int gradientLength = allParticipantsShares.get(0).get(0).length;
        float[] aggregatedShare = new float[gradientLength];
        
        for (List<float[]> participantShares : allParticipantsShares) {
            // 每个参与方的一份
            float[] share = participantShares.get(serverIndex);
            for (int i = 0; i < gradientLength; i++) {
                aggregatedShare[i] += share[i];
            }
        }
        
        // 这里aggregatedShare是聚合梯度的一个份额
        // 需要收集所有服务器的份额才能重建完整的聚合梯度
        return aggregatedShare;
    }
}

差分隐私：更实用的隐私保护

相比同态加密和MPC的极高工程复杂度，差分隐私（Differential Privacy）是目前工程上最实用的隐私保护技术。

差分隐私的核心思想：在数据或计算结果上添加精心设计的噪声，使得攻击者无法从输出结果判断某个特定个体是否在数据集中。

已有大规模工程应用：苹果在iOS上收集键盘统计数据、Google在Chrome上收集使用习惯，都用了差分隐私。

@Component
public class DifferentialPrivacyGuard {
    
    /**
     * Laplace机制：用于数值查询的差分隐私
     * epsilon越小，隐私保护越强，但噪声越大、精度越低
     */
    public double addLaplaceNoise(double value, double sensitivity, double epsilon) {
        double scale = sensitivity / epsilon;
        // Laplace分布噪声
        double u = new Random().nextDouble() - 0.5;
        double noise = -scale * Math.signum(u) * Math.log(1 - 2 * Math.abs(u));
        return value + noise;
    }
    
    /**
     * 高斯机制：用于向量（梯度）的差分隐私
     */
    public float[] addGaussianNoise(float[] gradient, double sensitivity, 
                                     double epsilon, double delta) {
        // 计算噪声标准差
        double sigma = sensitivity * Math.sqrt(2 * Math.log(1.25 / delta)) / epsilon;
        
        float[] noisyGradient = new float[gradient.length];
        Random random = new Random();
        
        for (int i = 0; i < gradient.length; i++) {
            noisyGradient[i] = gradient[i] + (float)(random.nextGaussian() * sigma);
        }
        
        return noisyGradient;
    }
    
    /**
     * 梯度裁剪：在添加噪声之前，限制梯度的L2范数
     * 使sensitivity可控
     */
    public float[] clipGradient(float[] gradient, double maxNorm) {
        double norm = 0;
        for (float g : gradient) {
            norm += g * g;
        }
        norm = Math.sqrt(norm);
        
        if (norm <= maxNorm) {
            return gradient;
        }
        
        // 裁剪
        float scale = (float)(maxNorm / norm);
        float[] clipped = new float[gradient.length];
        for (int i = 0; i < gradient.length; i++) {
            clipped[i] = gradient[i] * scale;
        }
        return clipped;
    }
}

工程选型建议

在实际AI项目里，选择隐私保护技术的优先级：

优先考虑差分隐私：开销小（10-20%精度损失，计算开销可忽略），工程成熟，有Apple、Google的大规模实践验证。联邦学习+差分隐私是目前隐私计算的最佳实践组合。

MPC用于特定场景：当需要多方安全聚合、且参与方之间不信任时，MPC有价值。商业产品（如蚂蚁摩斯、微软SEAL）让MPC的工程门槛降低了很多。

同态加密暂时不要用于AI推理：性能问题没有解决，暂时不适合生产场景。可以关注学术进展，未来5-10年可能有突破。

隐私计算是一个仍在快速发展的领域，工程和学术之间的差距正在缩小。