RAG检索增强生成:在智能云快捷构建知识库教会ERNIE你要的知识

RAG(Retrieval-Augmented Generation,检索增强生成)是当下热门的大模型前沿技术之一,它结合了语言模型和信息检索技术,旨在提高文本生成和回答问题的准确性和质量。以下是对RAG检索增强生成的详细解释:

一、定义与背景

  • 定义:RAG是一种结合检索和生成技术的模型,通过引用外部知识库的信息来生成答案或内容。具体来说,当模型需要生成文本或回答问题时,它会先从一个庞大的文档集合中检索出相关的信息,然后利用这些检索到的信息来指导文本的生成。
  • 起源:2020年,Facebook AI Research(FAIR)团队发表名为《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》的论文,首次提出了RAG概念。

二、工作原理

RAG模型的工作流程通常包括以下几个关键步骤:

  1. 检索:系统从大规模的文档集合或知识库中检索与输入查询相关的信息。这通常涉及语义搜索技术,以确保检索到的内容与用户意图高度相关。
  2. 利用:检索到的信息被用作生成文本或回答问题的参考源。这些信息可以填充到文本模板中,或直接用于指导生成模型的输出。
  3. 生成:基于检索到的信息和输入查询,生成模型(如大型语言模型LLM)生成最终的文本响应或答案。生成的文本可能经过额外的后处理步骤,以确保其语法正确且连贯。

三、优势与特点

  • 通用性强:RAG模型适用于多种自然语言处理任务,如问答系统、文档生成、智能助手等。
  • 知识更新及时:由于RAG模型可以实时检索外部知识库,因此能够确保生成的内容与最新信息保持一致。
  • 可解释性强:RAG模型的答案直接来源于检索库,因此具有较强的可解释性,用户可以核实答案的准确性。
  • 高度定制能力:RAG模型可以根据特定领域的知识库和prompt进行定制,快速适应不同领域的需求。
  • 安全隐私管理:通过限制知识库的权限,RAG模型可以实现安全控制,确保敏感信息不被泄露。
  • 减少训练成本:与微调相比,RAG模型在数据上具有很强的可拓展性,可以直接更新知识库而无需重新训练模型。

四、应用场景

RAG模型在多个自然语言处理任务中展现出巨大的潜力,包括但不限于:

  • 问答系统:通过检索大规模文档集合来回答用户提出的各种问题。
  • 文档生成和自动摘要:基于检索的知识生成文章段落、文档或自动摘要。
  • 智能助手和虚拟代理:结合聊天记录回答用户问题、提供信息和执行任务。
  • 信息检索:改进信息检索系统,使其更准确、更深刻。
  • 知识图谱填充:通过检索文档来识别和添加新的知识点,填充知识图谱中的实体关系。

想做RAG有着各种各样奇奇怪怪的方法,通常chatgpt和chatglm靠纯代码去操作,也就是将知识库文件传入进去,但在智能云上可以较为简单的去建知识库,以下演示AppBuilder里的操作方式:

其实相对来看,智能云的打包操作其实很懒人的,基本上做rag需要的传入类型都涵盖了,包括文本和网页, 其实最主要的工作都集中在如何切片上:

需要警告的是,虽然看起来直接传入word或者pdf都可以非常准确的做出判断,但pdf和带有格式的word如果使用默认切片很有可能会出现奇奇怪怪的bug,很典型的错误就是有多个知识库文件时很有可能当中的一些切片知识会产生混淆。

因此最好使用纯文字,但考虑有些知识库涉及图片和光学字符识别,所以还是演示pdf,以我自己的简历pdf为例:

这是我想要命中的知识点,也就是我可能会向模型提问:2z2z2的科研成果履历有什么?

 其实你看,大模型的回答还是比较精准的

但是由于本地部署的原因,服务端到用户端的接受与传入tokens量是有很大的限制的,而一旦面临多用户端使用接口的情况,服务端的载荷一高,那就很有可能出问题了,比如我之前传入过我的简历和我老师的简历,大模型就曾把我的学术成就和我老师的成就混淆

  • 16
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值