书生·浦语大模型第三节课茴香豆实现LLM+RAG

最新推荐文章于 2024-06-01 20:22:47 发布

catslikefishes

最新推荐文章于 2024-06-01 20:22:47 发布

阅读量519

点赞数 9

分类专栏：大模型文章标签：自然语言处理语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/catslikefishes/article/details/139142124

版权

大模型专栏收录该内容

3 篇文章 0 订阅

订阅专栏

书生·浦语大模型第三节课 "茴香豆"实现LLM+RAG

Introduction

RAG(Retrieval Augmented Generation，检索增强生成)

RAG（Retrieval Augmented Generation）技术，通过检索与用户输入相关的信息片段，并结合外部知识库来生成更准确、更丰富的回答。解决 LLMs 在处理知识密集型任务时可能遇到的挑战, 如幻觉、知识过时和缺乏透明、可追溯的推理过程等。提供更准确的回答、降低推理成本、实现外部记忆。

该技术可以将外部知识库结合进大模型原本的向量化知识中。
在这里插入图片描述
RAG 能够让基础模型实现非参数知识更新，无需训练就可以掌握新领域的知识。本次课程选用的茴香豆应用，就应用了 RAG 技术，可以快速、高效的搭建自己的知识领域助手。

向量数据库

在这里插入图片描述
通常使用余弦相似度或点乘的方式计算得到结果。

RAG运行过程

在这里插入图片描述

RAG发展历程

在这里插入图片描述

RAG运行过程这一节介绍的就是Naive RAG

Advanced RAG相较于Naive RAG，就是在检索前后分别增强，具体来说，在检索之前，对用户的问题进行路由、扩展、重写等处理；在检索之后，对于检索到的信息进行重排序，总结，融合等处理。

Modular RAG进一步将RAG以及Advanced RAG中涉及的技术进一步模块化。

RAG常用方法

在这里插入图片描述

RAG v.s. Fine-tuning(微调)

在这里插入图片描述

LLM模型优化比较

在这里插入图片描述

茴香豆

在这里插入图片描述

茴香豆构建

在这里插入图片描述
支持markdown,pdf,txt,word,powerpoint等文件

当前本地支持书生浦语、通义千问大模型

远端支持Kimi,chatGPT等

茴香豆工作流

Overview

在这里插入图片描述

Preprocess(重写问题)

筛选问题，转化为合适的问询

Rejection Pipeline(规范回答领域、频率)

将问询和数据库信息进行比对，判断是否进入回答流程

通过调整LLM scoring阈值，调整模型的回答频率

Response Pipline

回答

完整工作流

在这里插入图片描述

多来源检索信息

综合多来源，通过评分进行筛选

本地向量数据库

将文本知识转化为向量数据库存储起来，作为LLM的知识库（Knowledge DB）

网络搜索

可以搜索实时/知识库未来的更新的信息

知识图谱

准确、干净的知识

混合基座: 混合大模型

本地LLM+远程LLM

安全检测

保证生成的安全性

实战-Intern Studio部署茴香豆

在这里插入图片描述

Reference

本实验 & 茴香豆参考文档: Tutorial/huixiangdou/homework.md at camp2 · InternLM/Tutorial · GitHub

本文截图 & 本课程视频：https://www.bilibili.com/video/BV1QA4m1F7t4/

关注

9
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
书生·浦语大模型第三节课茴香豆实现LLM+RAG

RAG简介；RAG技术流；茴香豆工具实现RAG Demo
复制链接

扫一扫

专栏目录

catslikefishes CSDN认证博客专家 CSDN认证企业博客

码龄5年

9: 原创

36万+: 周排名

11万+: 总排名

2万+: 访问

: 等级

145: 积分

27: 粉丝

47: 获赞

5: 评论

106: 收藏

私信

关注

热门文章

分类专栏

大模型 3篇
python 3篇
爬虫-scrapy 1篇
Vmware 1篇
Ubuntu 1篇
Windows 1篇

最新评论

书生·浦语大模型第三节课茴香豆实现LLM+RAG
CSDN-Ada助手: 恭喜作者在《书生·浦语大模型》系列中的第三节课取得了新的进展，成功实现了LLM+RAG的茴香豆。持续创作是非常不易的，感谢作者的努力和坚持。希望作者在接下来的创作中能够继续保持创新思维，不断探索新的可能性，为读者带来更多的惊喜和启发。期待着您的下一篇作品！愿您一切顺利，再接再厉！
书生·浦语大模型第二节课 InternLM2 Demos
CSDN-Ada助手: 恭喜作者书生·浦语大模型第二节课InternLM2 Demos的博客发布！看到您不断分享学习成果，让人感到非常振奋。希望您在未来的创作中能够继续保持热情，展示更多关于浦语大模型的精彩内容，或者分享一些学习心得和体会，让更多人受益。期待您的下一篇作品！愿您在创作的道路上越走越远，不断进步。
书生·浦语大模型第一节课大模型背景及概况
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
【解决conda环境配置问题To fix this you could try to: 1. loosen the range of package versions you‘ve specifie】
CSDN-Ada助手: 恭喜您写下第5篇博客！标题看起来很有吸引力，我很期待阅读您的文章。对于您在博客中提到的conda环境配置问题，我认为您的建议非常中肯。尝试放宽所指定的软件包版本范围是一个明智的做法，它可能会帮助其他读者解决类似的问题。在我看来，您已经成为一个很好的解决问题的指南。希望您在下一步的创作中能够继续分享您的专业知识和经验，也许您可以探讨其他常见的环境配置问题或者提供一些有关优化代码性能的技巧。谢谢您的分享，期待您的下一篇博客！
pip国内常用镜像源汇总
CSDN-Ada助手: 恭喜您写了第6篇博客！标题为“pip国内常用镜像源汇总”，内容非常实用。感谢您在博客中分享了这些国内常用镜像源，对于我们这些使用pip的用户来说，这将是一个宝贵的资源。希望您能继续保持创作的热情，为我们提供更多有关开发工具和技巧的分享。作为下一步的创作建议，或许您可以考虑分享一些关于pip的高级用法或是一些与镜像源相关的最佳实践。期待您的下一篇博客！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。