第2013篇:Prompt微调 vs LoRA微调——不同场景下的选型决策
2026/4/30大约 5 分钟
第2013篇:Prompt微调 vs LoRA微调——不同场景下的选型决策
适读人群:需要为特定场景定制LLM的工程师 | 阅读时长:约17分钟 | 核心价值:清晰理解两种微调方式的本质区别,做出正确的技术选型
做AI产品的时候,遇到"现有模型不够好",通常有两条路:一是改Prompt,二是微调模型。
这两条路我都走过,踩过一些不必要的弯路。
有一次我们的客服AI对某类投诉的处理方式不够专业,我第一反应是去做LoRA微调,准备好了数据集,搭好了训练环境,然后同事说:"你有没有试过改System Prompt?"
试了。改了两段Prompt,问题就解决了。微调数据集没用上。
浪费了三天。
这篇文章就是要帮你避免这类问题,搞清楚什么时候该改Prompt,什么时候该微调。
两种方式的本质区别
Prompt工程(包括Prompt微调/Soft Prompt):
- 不改变模型权重,只改变输入
- 立竿见影,改完立即生效
- 效果受限于基础模型的能力边界
LoRA权重微调:
- 改变模型权重(少量参数)
- 需要训练、评估、部署,周期长
- 可以赋予模型原本不具备的能力,或大幅提升特定任务表现
选型决策框架
场景1:适合Prompt优化的问题
案例:让AI客服保持温和、专业的语气
这是典型的风格问题,基础模型完全能做到,只是没被明确要求。
错误做法:为"语气问题"专门微调模型
正确做法:在System Prompt中明确语气要求
--- 优化前的System Prompt ---
你是一个客服助手,帮助用户解决问题。
--- 优化后的System Prompt ---
你是XX公司的专业客服代表。
【语气要求】
- 始终保持温和、耐心的态度,即使面对情绪激动的用户
- 使用礼貌称谓("您"而非"你")
- 对用户的问题表示理解,先共情再解决
- 避免使用否定性语言,用"可以为您做的是..."替代"不行/不能..."
【处理投诉的固定流程】
1. 表示理解和歉意(如适用)
2. 了解具体情况
3. 提供解决方案(至少2个选项)
4. 确认用户满意度场景2:适合LoRA微调的问题
案例:让AI生成符合公司特定格式的法律合同
这个任务有两个特点:
- 有固定的格式模板(每个条款的结构、措辞规范)
- 需要大量领域特定知识(法律术语、常见条款库)
纯Prompt工程很难稳定生成完全符合格式要求的合同,每次生成结果都有偏差。
这时候适合用LoRA,让模型"记住"格式:
# 训练样本格式
training_samples = [
{
"instruction": "生成一份软件开发服务合同,甲方为北京XX科技有限公司,乙方为上海YY信息科技有限公司,项目为ERP系统开发,合同金额50万元,工期6个月",
"input": "",
"output": """软件开发服务合同
合同编号:[YY]-[20240115]-[001]
甲方(委托方):北京XX科技有限公司
注册地址:北京市朝阳区XX路XX号
法定代表人:[姓名]
统一社会信用代码:[代码]
乙方(受托方):上海YY信息科技有限公司
注册地址:上海市浦东新区XX路XX号
法定代表人:[姓名]
统一社会信用代码:[代码]
第一条 项目概述
...(后续标准条款)"""
}
# 更多训练样本...
]实践对比:同一问题用两种方法的效果
我做了一个对比实验,用同一个"专业术语识别"任务:
| 方法 | 准确率 | 开发成本 | 迭代速度 | 部署复杂度 |
|---|---|---|---|---|
| 优化Prompt(少样本) | 72% | 1天 | 分钟级 | 无 |
| Prompt微调(Soft Prompt) | 78% | 3天 | 小时级 | 低 |
| LoRA微调(500条数据) | 89% | 7天 | 天级 | 中 |
| LoRA微调(2000条数据) | 94% | 14天 | 天级 | 中 |
结论:
- 如果72%够用,就用Prompt,节省两周开发时间
- 如果需要89%以上,LoRA微调不可避免
- 78%这个中间地带,Soft Prompt是个有趣的选项(但工程化难度高,很多人不了解)
一个容易被忽略的选项:RAG
很多时候,模型效果差不是因为"能力不够",而是因为"知识不够"。比如:
- 内部产品文档的问答
- 公司特定规章制度的理解
- 最新行业动态的分析
这类问题用RAG(检索增强生成)往往比微调更合适:
- 知识可以实时更新,不需要重新训练
- 不需要训练数据,文档本身就是"数据"
- 更容易解释来源("答案来自XX文档第X章")
决策顺序:先考虑RAG → 再考虑Prompt优化 → 最后才是微调。
微调的正确时机:需要改变模型的"行为方式"(风格、格式、推理模式),而不仅仅是补充知识。
