RAG基础知识及应用

简单介绍下RAG的基础知识和RAG开源应用 “茴香豆"

一. RAG 基础知识

1. RAG工作原理

        RAG是将向量数据库和大模型问答能力的有效结合,从而达到让大模型的知识能力增加的目的。首先将知识源存储在向量数据库中,当提出问题时,去向量数据库检索,找到相关的部分后,一起送给大模型生成最终的回答。

2.RAG工作流程

3.RAG发展进程

        RAG最早由Meta的Lewis提出,其中有三类RAG,分别是Naive RAG,Advanced RAG, Modular RAG。

4. RAG常见优化方法

        常见的优化方法有嵌入优化,索引优化,查询优化,上下文管理,迭代检索,递归检索,自适应检索,LLM微调等。

5. RAG对比大模型微调

        使用的RAG的优势在于可以动态更新知识,处理长尾知识问题,但依赖外部知识库的质量和覆盖范围,依赖大模型能力。

        大模型微调的优势可以让模型性能针对特定任务优化,但需要大量的标注主句,且对新任务的适应性较差。

6. 评估框架和基准测试

7. RAG总结

二. RAG开源项目 -- 茴香豆

1. 茴香豆介绍

        茴香豆是一个基于LLMs的领域知识助手,由书生浦语团队开发的大模型应用。

2. 茴香豆的特性

        茴香豆具有 免费开源且可商用,高效准确,领域知识,部署成本低,安全,扩展性强等特点。

3. 茴香豆构建

        构建一个基于茴香豆的RAG应用,需要前端如微信,飞书;知识库文档;大模型后端(可支持主流大模型远程或本地)

4. 茴香豆工作流

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

有意思科技

给与不给,我都会更新

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值