这里不包括 “按原样使用模型” 选项,因为几乎没有任何业务用例可以有效地使用基础大模型。原封不动地使用基础大模型可以很好地用于一般搜索,但如果要做好特定的业务,则需要考虑上述选项之一。
二、主要内容
比较是如何进行的?分析是基于以下指标进行的:
- 准确性(回答的准确程度如何?)
- 实施复杂性(实施过程有多复杂?)
- 工作量(需要多少努力来实现?)
- 总拥有成本(TCO)(拥有解决方案的总成本是多少?)
- 更新和更改的便利性(架构是否耦合度低?替换
/
{/}
/升级组件是否容易?)
假设:我们将根据这些指标对每种解决方案进行评估,并且分析仅适用于比较,而不是普遍适用。例如:如果针对某个指标,提示工程被评为低分,意味着它在该指标上的表现低于其他选项,并不一定意味着它在该指标上普遍表现差。
首先让我们来谈谈最受关注的问题:哪种方法提供了最准确的回答?
- 提示工程(Prompt Engineering)的核心是在提供尽可能多的上下文信息的同时,通过提供少量示例(few-shot learning)来更好地让大模型了解您的用例。虽然结果在孤立情况下看起来令人印象深刻,但与本文中讨论的其他方法相比,它产生的结果最不准确。
- 检索增强生成ÿ