04.
大模型的选择
在我们提供了尽可能高质量的史料信息后,就到了大模型最后的阅读理解阶段,我们一开始采用的是 gpt-35-turbo-1106,发现在这个问题上表现并不是很理想(可能是由于语料都是比较碎片化的段落),非常出现容易幻觉。在经过了一定的prompt工程后(例如:告诉它需要忠实地参考原文),但最终还是无法达到期待的效果。刚好 OpenAI 年底发布了更便宜的 gpt4 版本 gpt4-turbo-1205, 无论是对于格式的要求,以及对于幻觉的克服,都有了显著的提升,我们选择了gpt4-turbo 作为最后的 reader。
05.
为段落加上引用