基于 InternLM 的知识库

最新推荐文章于 2024-09-06 22:05:33 发布

LJ旗飞飞

最新推荐文章于 2024-09-06 22:05:33 发布

阅读量350

点赞数 10

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_25820969/article/details/135563912

版权

本文讨论了大模型的局限性，如知识时效性和专业能力限制，以及如何通过LangChain框架简化开发流程，尤其是RAG检索增强生成。介绍了构建向量数据库和将InternLM接入LangChain的过程，以实现定制化LLM应用和检索问答链功能，提升知识库助手的效率。

摘要由CSDN通过智能技术生成

大模型开发范式

##LLM 的局限性：

知识时效性受限：如何让LLM能够获取最新的知识
专业能力有限：如何打造垂域大模型
定制化成本高：如何打造个人专属的LLM应用

两种开发范式比较：

在这里插入图片描述
此次课程主要针对： RAG检索增强生成

LangChain 简介

LangChain 框架是一个开源工具，通过为各种 LLM 提供通用接口来简化应用程序的开发流程，帮助开发者自由构建 LLM应用。LangChain 的核心组成模块如下：

链(Chains) :将组件组合实现端到端应用,通过一个对象封装实现一系列LLM 操作
Eg. 检索问答链，覆盖实现了 RAG （检索增强生成)的全部流程。也是此次课程中实践用到的。

基于LangChain搭建RAG应用流程如下图所示：

在这里插入图片描述

构建向量数据库

流程如下：

加载源文件→文档分块→文档向量化

确定源文件类型，针对不同类型源文件选用不同的加载器：核心在于将带格式文本转化为无格式字符串
由于单个文档往往超过模型上下文上限，我们需要对加载的文档进行切分：一般按字符串长度进行分割，也可以手动控制分割块的长度和重叠区间长度
使用向量数据库来支持语义检索，需要将文档向量化存入向量数据库：可以使用任一一种Embedding模型来进行向量化，也可以使用多种支持语义检索的向量数据库,一般使用轻量级的Chroma
搭建知识库助手

将InternLM接入LangChain

LangChain 支持自定义LLM,可以直接接入到框架中。只需将InternLM部署在本地，并封装一个自定义LLM
类，调用本地 InternLM 即可。

构建检索问答链

LangChain提供了检索问答链模版,可以自动实现知识检索、Prompt嵌入、LLM问答的全部流程。
将基于InternLM的自定义LLM和已构建的向量数据库接入到检索问答链的上游
调用检索问答链,即可实现知识库助手的核心功能
如下图所示：
在这里插入图片描述

关注

10
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
基于 InternLM 的知识库

LangChain 框架是一个开源工具，通过为各种 LLM 提供通用接口来简化应用程序的开发流程，帮助开发者自由构建 LLM应用。LangChain 的核心组成模块如下：链(Chains) :将组件组合实现端到端应用,通过一个对象封装实现一系列LLM 操作Eg. 检索问答链，覆盖实现了 RAG （检索增强生成)的全部流程。也是此次课程中实践用到的。
复制链接

扫一扫

LJ旗飞飞 CSDN认证博客专家 CSDN认证企业博客

码龄10年

19: 原创

33万+: 周排名

19万+: 总排名

1万+: 访问

: 等级

284: 积分

73: 粉丝

80: 获赞

0: 评论

110: 收藏

私信

关注

热门文章

分类专栏

STM32 2篇
CubeMX 2篇
FreeMarker 1篇
Keil5 1篇
无人机 1篇

最新评论

vacode 连接到 kernel: base (Python 3.10.9): 正在激活 Python 环境 “base“
CSDN-Ada助手: 恭喜您写了第8篇博客！很高兴看到您正在深入学习Python，这篇博客也很有深度。接下来，建议您可以从实际应用出发，结合自己的经验和思考，写一些Python在项目中的应用实例，分享给大家。期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。