AI小知识----什么是RAG

  1. RAG的概念
    RAG的全称是Retrieval-Augmented Generation,中文翻译为检索增强生成。它是一个为大模型提供外部知识源的概念,这使它们能够生成准确且符合上下文的答案,同时能够减少模型幻觉。

「检索(Retrive)」 根据用户请求从外部知识源检索相关上下文。为此,使用嵌入模型将用户查询嵌入到与向量数据库中的附加上下文相同的向量空间中。这允许执行相似性搜索,并返回矢量数据库中最接近的前 k 个数据对象。

「增强(Augment)」 用户查询和检索到的附加上下文被填充到提示模板中。

「生成(Generate)」 最后,检索增强提示被馈送到 LLM。

1.RAG既是大语言模型(LLM)较为热门的应用开发架构,也是其在垂直领域的应用拓展。

它能在LLM强大功能的基础上,通过拓展访问特定领域数据库或内部知识库,以补足通用模型在垂直领域的知识短板。

2.在LLM的基础上,RAG能通过数据内循环,更好地解决数据来源问题。

增强搜索与生成功能的同时,能减少行业用户对数据私密性与安全性的顾虑。这也推动其成为各类大模型落地项目不可缺少的技术组件。

3.RAG的利用,能有效减少模型幻觉的发生,进一步提升大模型检索和生成性能。

因为训练成本相对较低,RAG目前已拓展到企业信息库建设、AI文档问答、业务培训、科研等场景,搭配AI agent,极大地加快了大模型的商业化进程。

为了提高RAG的智能化程度和应用价值,人们甚至在原来的检索增强生成体系的基础上,推出了Self-RAG(即自反思的检索增强生成方法),以进一步提升检索效率和大模型生成质量。这算是RAG的一大升级与进化了。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值