RAG:检索增强生成

一种模型架构:巧妙整合从庞大知识库中检索到的信息,以此提高大模型回答的准确性与深度。

一、RAG对大模型的辅助作用

1.RAG通过对大量多方位全面的数据的检索,改善LLM幻觉问题,增强其推理能力,拓宽LLM应用场景(提高适应性)

2.实时检索最新数据,保持生成内容时效性

3.链接生成内容与检索到的原始资料,增强内容可追溯性

4.检索特定领域相关数据,提高回答专业性

5.检索整合长文本信息,提高LLM长文本输入的处理能力

二、RAG工作流程

处理 检索 增强 生成

1.转化(如何转化?)输入的原始数据,使其变为模型可使用的格式(什么格式?),并存储在对应的数据库(如何搭建?)中

2.根据用户问题在数据库中检索(怎样检索?)相关信息

3.对检索到的信息进行处理(二次处理?两次处理有何区别)和增强(怎样理解增强?)

4.增强后信息输入生成模型得到答案

三、RAG与微调对比

RAG相较于微调的优势有:

1.无需重新训练来更新信息,只需直接检索知识库即可实现更新(是否意味着要更新知识库,知识库如何更新?)

2.对数据处理和操作要求极低

3.通过链接,使回答有较好的可解释性可追溯性

4.通过检索知识库的方式降低了产生幻觉的概率

四、RAG成功案例

问答系统对话系统文档摘要,文档生成等多个领域取得了成功

  • 19
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值