RAG 常见的问题,不只是模型会答错,还在于它返回一段看似完整的文字,下游很难稳定解析,更难逐项检查。Kezhan Shi 提议把答案改成结构化输出——按预先定义的字段和类型返回数据,并为每项结论附上引用。这样,RAG 才能从“生成一段话”变成可测试的生产管线。
这份契约可以直接返回 Amount、DateValue、TableValue 等类型,也能容纳多项答案和多段证据;confidence、answer_found、conflicting_evidence、suggested_clarification 等字段,则给管线提供继续检索或要求澄清的信号。作者强调,完整性也可由程序依据检索范围判定,而不是交给模型自评。边界同样清楚:Schema 校验能发现缺字段、类型错误等格式违约,却不能单独证明内容忠于证据;“防止幻觉”的效果目前是作者主张,供稿未披露独立评测数据。