书生浦语第三次课堂作业与笔记

视频地址:https://www.bilibili.com/video/BV1QA4m1F7t4/
文档地址:https://github.com/InternLM/Tutorial/blob/camp2/huixiangdou/readme.md

什么是RAG?

  检索增强生成(Retrieval-Augmented Generation,简称RAG)是一种结合了检索模型和生成模型的技术,旨在提高大型语言模型(Large Language Models,LLMs)的准确性和可靠性。RAG通过利用外部知识源,例如数据库或文档集合,来增强模型的生成能力。这种方法允许模型在生成响应之前引用权威和最新的信息,从而减少错误信息(或称为“幻觉”)的产生。

RAG的三个主要流程

  RAG的基本工作流程包括三个主要步骤:检索(Retrieval)、增强(Augmentation)和生成(Generation)。首先,模型接收到用户的查询,然后使用检索系统从外部知识源中检索相关的信息或文档。接着,这些检索到的信息被合并到原始查询中,为模型提供额外的上下文。最后,增强后的查询被输入到大型语言模型中,模型根据这些信息生成最终的响应。

工作流程如下:

RAG的优势

  RAG的优势在于它能够结合LLMs的强大生成能力和外部数据源的精确信息,从而提供更加准确和丰富的回答。此外,与微调(Fine-Tuning)相比,RAG提供了一种更灵活、成本效益更高的方法来适应特定领域或最新的信息。RAG还可以帮助模型处理复杂的查询和任务,通过迭代检索和生成,逐步构建和优化响应。

茴香豆

茴香豆由微信/飞书前端,LLM后端,外部知识数据库三部分组成。其主要应用场景为智能客服,优点为:

1.开源,免费商用

2.本地部署,无需担心数据/隐私泄露

3.专为群聊助手优化,部署成本低

4.应用RAG技术,专业知识快速获取,同时支持多种IM软件和LLM

结果

  

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值