基于 InternLM 和 LangChain 搭建你的知识库

nty102

已于 2024-01-09 10:40:19 修改

阅读量405

点赞数 8

文章标签： langchain 人工智能计算机视觉 llama 深度学习

于 2024-01-09 09:28:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nty102/article/details/135471496

版权

视频地址：基于 InternLM 和 LangChain 搭建你的知识库_哔哩哔哩_bilibili

学习文档：https://github.com/InternLM/tutorial/tree/main/langchain

视频地址

一、大模型开发范式

1、LLM 的局限性

知识时效性受限:如何让LLM能够获取最新的
知识专业能力有限: 如何打造垂域大模型
定制化成本高: 如何打造个人专属的LLM应用

2、两种开发范式

RAG，Finutune

RAG：

二、LangChain简介

LangChain 框架是一个开源工具，通过为各种 LLM 提供通用接口来简化应用程序的开发流程，帮助开发者自由构建 LLM应用LangChain 的核心组成模块

链 (Chains) : 将组件组合实现端到端应用，通过一个对象封装实现一系列LLM 操作
Eq.检索问答链，覆盖实现了 RAG(检索增强生成)的全部流程

基于LangChain搭建RAG应用：

三、构建向量数据库

加载源文件 > 文档分块 > 文档向量化

1,确定源文件类型，针对不同类型源文件选用不同的加载器

核心在于将带格式文本转化为无格式字符串

2,由于单个文档往往超过模型上下文上限，我们需要对加载的文档进行切分

一般按字符串长度进行分割
可以手动控制分割块的长度和重叠区间长度

3,使用向量数据库来支持语义检索，需要将文档向量化存入向量数据库

可以使用任一一种 Embedding 模型来进行向量化
可以使用多种支持语义检索的向量数据库，一般使用轻量级的 Chroma

四、搭建知识库助手

1、将InternLM 接入 LangChain

LangChain 支持自定义LLM，可以直接接入到框架中
我们只需将 InternLM 部署在本地，并封装一个自定义 LLM类，调用本地 InternLM 即可

2、构建检索问答链

LangChain 提供了检索问答链模版，可以自动实现知识检索、Prompt 嵌入、LLM问答的全部流程
将基于 InternLM 的自定义 LLM 和已构建的向量数据库接入到检索问答链的上游
调用检索问答链，即可实现知识库助手的核心功能

3、RAG方案优化建议

a、基于RAG的问答系统性能核心受限于

检索精度
Prompt性能

b、一些可能的优化点

检索方面

基于语义进行分割，保证每一个chunk的语义完整
给每一个chunk生成概括性索引，检索时匹配索引

Prompt方面

迭代优化Prompt策略

Demo

关注

8
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
基于 InternLM 和 LangChain 搭建你的知识库

LangChain 框架是一个开源工具，通过为各种 LLM 提供通用接口来简化应用程序的开发流程，帮助开发者自由构建 LLM应用LangChain 的核心组成模块链 (Chains) : 将组件组合实现端到端应用，通过一个对象封装实现一系列LLM 操作Eq.检索问答链，覆盖实现了 RAG(检索增强生成)的全部流程。
复制链接

扫一扫

nty102 CSDN认证博客专家 CSDN认证企业博客

码龄11年

34: 原创

47万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

621: 积分

192: 粉丝

275: 获赞

15: 评论

306: 收藏

私信

关注

热门文章

分类专栏

书生浦语实战营第二期 3篇
MMLab学习 10篇

最新评论

人体姿态估计（Human Pose Estimation）
sinat_39505652: hrnet是自底向上的方法吧
XTuner InternLM-Chat 个人小助手认知微调实践
CSDN-Ada助手: 恭喜作者在XTuner InternLM-Chat 个人小助手认知微调实践方面的博客发表了第17篇文章！阅读了您的文章后，我对这个主题有了更深的理解。不过，在未来的创作中，我建议您可以尝试结合一些实际案例或者个人经历，让读者更容易理解和接受您的观点。希望您在创作的道路上不断进步，期待您的下一篇精彩文章！
Xtuner大模型低成本微调
CSDN-Ada助手: 恭喜您发布了第18篇博客！看到您对Xtuner大模型低成本微调的深入研究和总结，让我感到非常欣慰。您的文章内容丰富，观点独特，让人受益匪浅。在下一步的创作中，我建议您可以尝试结合实际案例，或者对比不同的调整方法，以及可能的优缺点，给读者提供更多实用的经验分享和建议。希望您能继续保持热情，不断进步，期待您更多精彩的作品！
基于 InternLM 和 LangChain 搭建你的知识库
CSDN-Ada助手: 恭喜你写了第15篇博客！看到你不断分享关于基于 InternLM 和 LangChain 搭建知识库的内容，真的很受启发。不过，我想提一个小建议，希望你能够在下一篇文章中，加入一些实际操作的案例，让读者更容易理解和跟随你的思路。期待你的下一篇作品！加油！
第三次课程作业
CSDN-Ada助手: 恭喜您完成了第三次课程作业并分享在博客中！您的持续创作精神让人敬佩。接下来，或许可以考虑增加一些个人见解或者实例分析，让文章更具深度和吸引力。期待您的下一篇作品！加油！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。