书生浦语第三节茴香豆:搭建你的RAG智能助理笔记

 RAG(Retrieval Augmented Generation)是一项通过检索与用户输入相关的信息片段,并结合外部知识库来生成更准确、更丰富的回答的技术。解决 LLMs 在处理知识密集型任务时可能遇到的挑战, 如幻觉、知识过时和缺乏透明、可追溯的推理过程等。提供更准确的回答、降低推理成本、实现外部记忆。

茴香豆项目的特点包括:

设计拒答、响应两阶段pipeline:针对群聊场景设计,能够在解答问题的同时避免消息泛滥。

低成本运行:运行成本低至1.5G显存,无需额外训练即可适用于各行业。

工业级开源可商用:提供了一整套前后端web、android、算法源码,方便开发者进行二次开发和商业应用。

易于部署:支持快速部署到多种通讯平台,如微信群等,方便用户接入和体验。

持续更新和优化:项目团队定期更新,增加新功能,如支持不同格式的文件解析,提升检索精度等。

社区支持:提供了丰富的文档和教程,帮助开发者快速上手,并有社区支持进行问题解答和讨论。

通过上述特点,茴香豆项目为用户提供了一个强大的工具,可以在即时通讯工具的群聊中提供及时准确的技术支持和自动化问答服务,极大地提升了用户体验和效率。
——————————

现用ppt进行更详细的介绍:

基本概述:

 基本工作原理:

 重要组成部分之向量数据库:

Rag流程示例

 rag发展进程

rag常见的优化方法

 rag与微调,各自适用场景不同。

 大模型常用优化方法的比较

 rag的评价

 rag总结

 下面介绍一个开源的rag产品:茴香豆

茴香豆的特点

 茴香豆的构建

 茴香豆工作流

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值