RAG
定义
RAG(Retrieval Augmented Generation)是一种结合了检索(Retrieval)和生成(Generation)的技术,旨在通过利用外部知识库来增强大型语言模型(LLMs)的性能。它通过检索与用户输入相关的信息片段,并结合这些信息来生成更准确、更丰富的回答。
应用
问答系统,文本生成,信息检索,图片描述
RAG工作原理
Indexing(索引);将知识源(如文档或网页)分割成chunk,编码成向量,并存储在向量数据库中。
Retrieval(检索):接收到用户的问题后,将问题也编码成向量,并在向量数据库中找到与之最相关的文档块(top-k chunks)。
Generation(生成):将检索到的文档块与原始问题一起作为提示(prompt)输入到LLM中,生成最终的回答。
茴香豆介绍
黄香豆是一个基于LLMs的领域知识助手,由书生浦语团队开发的开源大模型应用。专为即时通讯(IM)工具中的群聊场景优化的工作流,提供及时准确的技术支持和自动化问答服务。通过应用检索增强生成(RAG)技术,茴香豆能够理解和高效准确的回应与特定知识领域相关的复杂查询。
应用场景
智能客服:技术支持、领域知识对话。
IM工具中创建用户群组,讨论、解答相关的问题。
随着用户数量的增加,答复内容高度重复,充斥大量无意义和闲聊,人工回复,成本高,影响工作效率。
茴香豆通过提供自动化的问答支持,帮助维护者减轻负担,同时确保用户问题得到有效解答。
1.0在茴香豆web版中创建属于自己领域的知识问答助手
在web创建自己的知识问答助手,首先创建自己的知识库
进入后,点击上传文档
然后就可以问和茴香豆互动了