利用茴香豆网页版上传了自己的知识库,并根据知识库的内容进行相关对话问答。
以下是截图:
通过自己实际操作,发现由于知识库的内容太少,因此某些问题得不到准确的回答,但只要是提问有关上传文档中的问题,得出的回答还是较完整、准确的。当然,实践中只是使用了一个很简单的知识库,主要在于体验了利用茴香豆搭建自己知识库的过程,还是有一定的收获。
RAG
检索增强生成(Retrieval Augmented Generation, RAG)是一种技术,它通过从数据源中检索信息来辅助大语言模型(Large Language Model, LLM)生成答案。旨在通过利用外部知识库来增强大型语言模型的性能。它通过检索与用户输入相关的信息片段,并结合这些信息来生成更准确、更丰富的回答。
可以应用于:问答系统、文本生成、信息检索、图片描述
三个重要的部分:Indexing,Retrieval,Generation.(索引,检索,生成)
- indexing : 将知识源分割成chunk,编码成向量然后储存在向量数据库中。
- retrieval: 将接收到的用户的问题也编码成向量,然后在indexing生成的向量数据库里找与问题最相关的文档块(top-k chunks)。
- Generation: 将retrieval里检索到的文档块与原始问题一起作为提示(prompt)输入到LLM在,生成最终答案
- RAG工作流具体示意: