网易RAG问答知识库开源了,9.9K Stars!!

、▼最近直播超级多,预约保你有收获

21bf6177097acca8aa5824f1572696b7.png

1

RAG 问答知识库 QAnything 开源了

网易开源了自研的 RAG 引擎 QAnything。该引擎允许用户上传 PDF、图片、Word、Excel、PowerPoint 等多种格式的文档,并实现类似于 ChatGPT 的互动问答功能,其中每个答案都能精确追溯到相应的文档段落来源。QAnything 支持纯本地部署,上传文档数量无上限,问答准确率高。正如它的名字一样,Q 是 Question,A 是 Answer,QAnything 的目标就是万物皆可问

90ca7c39414a38fccc6d6f578100a672.png总之,QAnything 是一个支持多种格式文件和数据库的本地知识库问答系统,可离线安装。

简单上传本地文件,即可获得准确、快速、靠谱的问答体验。

目前已支持格式: PDF(pdf),Word(docx),PPT(pptx),XLS(xlsx),Markdown(md),电子邮件(eml),TXT(txt),图片(jpg,jpeg,png),CSV(csv),网页链接(html)等。

开源 Github 地址:https://github.com/netease-youdao/QAnything

 2

QAnything 架构设计剖析

整个架构(如下图所示)包括了模型和系统等所有必要的模块。模型方面包括 OCR 解析、Embedding/rerank,以及大模型。系统方面包括向量数据库、MySQL 数据库、前端、后端等必要的模块。整个引擎的功能完整,用户可以直接下载,不需要再搭配其他的模块即可使用。系统可扩展性也非常好,只要硬盘内存足够,就可以一直建库,支持无上限的文档。

2d3d2e09794a9dfc11b3fe2c50ac98cb.png

1、整个架构的工作流程主要包含三个环节:

  • 索引(Indexing):文本索引的构建包括以下步骤:文档解析、文本分块、Embedding 向量化和创建索引。先将不同格式的原始文件解析转换为纯文本,再把文本切分成较小的文本块。通过 Embedding 为每一个文本块生成一个向量表示,用于计算文本向量和问题向量之间的相似度。创建索引将原始文本块和 Embedding 向量以键值对的形式存储,以便将来进行快速和频繁的搜索。

  • 检索(Retrieval):使用 Embedding 模型将用户输入问题转换为向量,计算问题的 Embedding 向量和语料库中文本块 Embedding 向量之间的相似度,选择相似度最高的前 K 个文档块作为当前问题的增强上下文信息。

  • 生成(Generation):将检索得到的前 K 个文本块和用户问题一起送进大模型,让大模型基于给定的文本块来回答用户的问题

2、为什么需要两阶段检索?

  • 知识库数据量大的场景下两阶段优势非常明显,如果只用一阶段Embedding检索,随着数据量增大会出现检索降级的问题。二阶段 rerank重排后能实现准确率稳定增长,即数据越多,效果越好。

  • QAnything 使用的检索组件 BCEmbedding 有非常强悍的双语和跨语种能力,能消除语义检索里面的中英语言之间的差异。

3、使用的基座大模型

  • 开源版本 QAnything 的大模型基于阿里通义千问,并在大量专业问答数据集上进行微调,在阿里千问的基础上大大加强了问答的能力。选择一个性价比高的大模型也是很重要的。

4、相关技术组件

  • BCEmbedding 文本嵌入模型

  • Triton Inference Server 推理服务

  • vLLM 在线推理服务加速器

  • FastChat 即时通讯平台

  • FasterTransformer 在线推理加速库

  • LangChain 应用开发框架

  • LangChain-Chatchat 聊天机器人应用

  • Milvus 向量数据库

  • PaddleOCR 图片识别组件

  • Sanic Python 3.6+ Web 框架

 3

QAnything 本地部署

1、一键部署安装,特别简单

d81c436ec5eb1d4c9214cc885b0851e5.png

2、部署安装 FAQ

https://github.com/netease-youdao/QAnything/blob/master/FAQ_zh.md

为了帮助同学们彻底掌握大模型的向量数据库、知识图谱、RAG 的应用开发、部署、生产化,今天我会开4场直播和同学们深度剖析,请同学们点击以下预约按钮免费预约

 4

!送!AI大模型开发直播课程

大模型的技术体系非常复杂,即使有了知识图谱和学习路线后,快速掌握并不容易,我们打造了大模型应用技术的系列直播课程,包括:通用大模型技术架构原理、大模型 Agent 应用开发、企业私有大模型开发、向量数据库、大模型应用治理、大模型应用行业落地案例等6项核心技能,帮助同学们快速掌握 AI 大模型的技能。

 🔥即将开播 

立即扫码,即可免费预约

进入直播,大佬直播在线答疑!

e52ec70865ead6068e3b5df06932ca25.gif

e91f1aef08ac1e85a09d6e32f2517cd0.png

本期名额有限

高度起始于速度(手慢无!!)

 5

!!再送!!《AI 大模型技术知识图谱

最近很多同学在后台留言:“玄姐,AI 大模型技术的知识图谱有没?”、“AI 大模型技术有学习路线吗?”

我们倾心整理了 AI 大模型技术的知识图谱快来领取吧!

cfaa6ac58cfbf90e48ae359e4edd7745.png

这份业界首创知识图谱和学习路线,今天免费送给大家一份!

只需要以下3步操作就可免费领取:

第一步长按扫码以下我的视频号:玄姐谈AGI

5d7ad072159e720aa9999d691ab70212.png

第二步:扫码后,点击以下关注按钮,就可关注我。

0a56600a5df7d7e7bb23b1e94296ef7a.jpeg

第三步:点击"客服“按钮,回复知识图谱即可领取。

844e4cc0c6230c6c10e65b47a3ee23a7.jpeg

 6

每日一大模型知识

END

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值