RAG检索增强生成：在智能云快捷构建知识库教会ERNIE你要的知识

2z2z2

于 2024-07-29 14:14:12 发布

阅读量549

点赞数 16

文章标签：自然语言处理人工智能知识图谱 nlp 文心一言

本文链接：https://blog.csdn.net/2302_82050581/article/details/140769623

版权

RAG（Retrieval-Augmented Generation，检索增强生成）是当下热门的大模型前沿技术之一，它结合了语言模型和信息检索技术，旨在提高文本生成和回答问题的准确性和质量。以下是对RAG检索增强生成的详细解释：

定义：RAG是一种结合检索和生成技术的模型，通过引用外部知识库的信息来生成答案或内容。具体来说，当模型需要生成文本或回答问题时，它会先从一个庞大的文档集合中检索出相关的信息，然后利用这些检索到的信息来指导文本的生成。
起源：2020年，Facebook AI Research（FAIR）团队发表名为《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》的论文，首次提出了RAG概念。

RAG模型的工作流程通常包括以下几个关键步骤：

RAG模型在多个自然语言处理任务中展现出巨大的潜力，包括但不限于：

想做RAG有着各种各样奇奇怪怪的方法，通常chatgpt和chatglm靠纯代码去操作，也就是将知识库文件传入进去，但在智能云上可以较为简单的去建知识库，以下演示AppBuilder里的操作方式：

其实相对来看，智能云的打包操作其实很懒人的，基本上做rag需要的传入类型都涵盖了，包括文本和网页，其实最主要的工作都集中在如何切片上：

需要警告的是，虽然看起来直接传入word或者pdf都可以非常准确的做出判断，但pdf和带有格式的word如果使用默认切片很有可能会出现奇奇怪怪的bug，很典型的错误就是有多个知识库文件时很有可能当中的一些切片知识会产生混淆。

因此最好使用纯文字，但考虑有些知识库涉及图片和光学字符识别，所以还是演示pdf，以我自己的简历pdf为例：

这是我想要命中的知识点，也就是我可能会向模型提问：2z2z2的科研成果履历有什么？

其实你看，大模型的回答还是比较精准的

但是由于本地部署的原因，服务端到用户端的接受与传入tokens量是有很大的限制的，而一旦面临多用户端使用接口的情况，服务端的载荷一高，那就很有可能出问题了，比如我之前传入过我的简历和我老师的简历，大模型就曾把我的学术成就和我老师的成就混淆

关注