待会删!26.7 Star!LangChain-Chatchat 开源知识库来了

 ▼最近直播超级多,预约保你有收获

f3d432f34eb7f433e316489d0f12c8db.png

LangChain-Chatchat 是基于 ChatGLM 等大语言模型与 LangChain 等应用框架实现,开源、可离线部署的 RAG 检索增强生成大模型知识库项目。最新版本为 v0.2.10,目前已收获 26.7k Stars,非常不错的一个开源知识库项目。

项目地址:https://github.com/chatchat-space/Langchain-Chatchat

 1

LangChain-Chatchat 架构设计

顾名思义,LangChain-Chatchat 利用 LangChain 思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。

依托于本项目支持的开源 LLM 大模型与 Embedding 嵌入模型,本项目可实现全部使用开源模型离线私有部署。与此同时,本项目也支持 OpenAI GPT API 的调用,并将在后续持续扩充对各类模型及模型 API 的接入。

本项目实现原理如下图所示,过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的 Top K 个 -> 匹配出的文本作为上下文和问题一起添加到 Prompt 中 -> 提交给 LLM 大模型生成回答。

a654f0a5aba2dcee33a025240890f5b3.png

从文档处理角度来看,实现流程如下:

4e9048e7b8005cea20fbad2cd66ce275.png

LangChain-ChatChat 具体实现过程如下:

第一、任务定义

首先,我们需要定义问答任务。在 LangChain 中,任务是通过一系列 JSON 格式的配置文件来定义的。对于问答任务,我们需要指定输入文本、输出文本、知识库等相关信息。

第二、模型选择

在定义完任务后,我们需要选择合适的模型来完成任务。LangChain 支持多种自然语言处理模型,比如:BERT、GPT 等。对于问答任务,我们可以选择使用问答模型,比如:QA-BERT、QA-GPT 等。

第三、数据处理

在模型选择完成后,我们需要对输入数据进行处理。这包括文本清洗、分词、编码等步骤。LangChain 提供了一系列工具和库,方便我们进行数据处理。

第四、输出生成

最后,我们需要将模型的输出转换为人类可读的格式。在问答任务中,输出通常是一个答案文本。我们可以使用 LangChain 提供的输出生成工具,将模型的输出转换为格式化的答案文本。

 2

一键本地离线部署

第一、软件环境

  • Linux Ubuntu 22.04.5 kernel version 6.7

  • Python 版本: >= 3.8(很不稳定), < 3.12,推荐 3.11.7

  • CUDA 版本: >= 12.1,推荐 12.1

第二、硬件环境

  • 取决于选择的大模型,在 GPU 运行本地模型的 FP16 版本,至少需要以下的硬件配置,来保证对话的稳定连续。

  • ChatGLM3-6B & LLaMA-7B-Chat 等 7B 模型

    • 最低显存要求: 14GB

    • 推荐显卡: RTX 4080

  • Qwen-14B-Chat 等 14B 模型

    • 最低显存要求: 30GB

    • 推荐显卡: V100

第三、支持三种部署方式

  • 轻量化部署、Docker 部署、常规部署

  • 建议使用 Docker 一键部署

  • docker run -d --gpus all -p 80:8501 registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.0

为了帮助同学们彻底掌握大模型的知识库、向量数据库、 RAG、Agent 智能体、知识图谱的应用开发、部署、生产化,今晚20点我会开一场直播和同学们深度剖析,请同学们点击以下预约按钮免费预约

 3

!送!AI大模型开发直播课程

大模型的技术体系非常复杂,即使有了知识图谱和学习路线后,快速掌握并不容易,我们打造了大模型应用技术的系列直播课程,包括:通用大模型技术架构原理、大模型 Agent 应用开发、企业私有大模型开发、向量数据库、大模型应用治理、大模型应用行业落地案例等6项核心技能,帮助同学们快速掌握 AI 大模型的技能。

 🔥即将开播 

立即扫码,即可免费预约

进入直播,大佬直播在线答疑!

c5746e48c95fe03e0c818a9fca1a0a6d.gif

7234298e6b71fb72df2a7652c12b8d1d.png

本期名额有限

高度起始于速度(手慢无!!)

 4

!!再送!!《AI 大模型技术知识图谱

最近很多同学在后台留言:“玄姐,AI 大模型技术的知识图谱有没?”、“AI 大模型技术有学习路线吗?”

我们倾心整理了 AI 大模型技术的知识图谱快来领取吧!

dcbad2d445def6972f3917a53eaf6727.png

这份业界首创知识图谱和学习路线,今天免费送给大家一份!

只需要以下3步操作就可免费领取:

第一步长按扫码以下我的视频号:玄姐谈AGI

0ed27a4555fd4006ba608b1e64793c09.png

第二步:扫码后,点击以下关注按钮,就可关注我。

29dcdc035755a4367d5e41f81941ddad.jpeg

第三步:点击"客服“按钮,回复知识图谱即可领取。

02466d75507cb77bc5f598b0737800f2.jpeg

END

  • 13
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值