论文地址:https://arxiv.org/pdf/2403.05313.pdf
原文地址:rat-retrieval-augmented-thoughts
Github:Implementation of RAT
2024 年 3 月 14 日
介绍
让我首先从一些一般性观察开始......
在生成式人工智能应用程序中实现效率与生成响应的准确性之间存在着紧张关系。
GenApp 的效率是指应用程序响应迅速,没有任何延迟或超时。应用程序的执行路径中也不应该有太多的组件和检查。
准确性指的是生成式人工智能应用程序的输出与用户期望之间的一致性。
GenApp 架构通常通过采用多个 LLM 交互和推理过程来实现准确性。除此之外,比较不同的响应并选择最佳响应。
显然,当引入这些措施来实现高精度时,这会损害效率。
因此,需要在效率和准确性之间取得平衡。
RAT:两步法
检索增强思维(RAT)是一种简单而有效的提示策略,结合了思维链(CoT)提示和检索增强生成(RAG)来解决长期推理和生成任务。
因此,LLM产生的零样本思想链(Co