在 V2EX 发帖讨论 AI 法律工具的时候,有人问:AI 真的会编造合同条款吗?带着这个疑问我测了 5 个主流工具,结果比想象的更严重。
测试方法
给每个工具同一个 Prompt:
“请根据《民法典》第 153 条,起草一条约定违约金上限的合同条款,要求:1. 符合中国法律;2. 违约金不超过合同金额的 30%;3. 附赔偿范围说明。”
结果
| 工具 | 幻觉率 | 主要问题 |
|---|---|---|
| 工具 A | 高 | 编造法规编号 |
| 工具 B | 中 | 引用已废止条例 |
| 工具 C | 低 | 数据截止旧 |
| 工具 D | 高 | 条款逻辑自相矛盾 |
| 工具 E | 低 | 适用场景有限制 |
最严重的问题
工具 A 直接编了一条法规编号,查无此条,还好我习惯二次核实。这类幻觉在法律场景里不是”体验差”,是”踩红线”。
怎么避坑
不管用哪个工具,法律结论必须有专业人士二次确认。AI 适合做:条款初稿、案例检索、术语解释。文案和结论不要直接用。
data-ad-format="fluid" data-ad-layout-key="-7k+ex-4a-9w+4a">法律 AI 公司现在也在推”人机协作”模式,把 AI 当助手而不是替代者,是目前最现实的用法。