揭秘!大模型知识库架构设计和落地困境

 ▼最近直播超级多,预约保你有收获

accd0522e85f5a89547fb7322c186a02.png

 1

大模型知识库架构设计

以下这张图可能许多同学都见过,它展示了一个文档处理流程:首先,将PDF、PPT、Word 等格式的文档进行分割,然后转换为嵌入(Embedding)形式,并存储到向量数据库里。在问答环节,系统会检索并提取与问题相关的文档块,接着构建一个提示词(Prompt),将其输入到一个大语言模型中,最终由模型生成相应的问答内容。

0625a6b5175fa91ed17bbe275fe26b8a.png

以上架构本质上解决两大核心问题:如何突破传统 tokens 数量的限制,以及如何更精准地提炼出问题的本质。 

📏 Text Splitter:将长文本分解为易于管理的小段或碎片的算法。它的目标是将文本分解成可单独处理的小块,这在处理庞大的文档或数据集时尤为重要。

🔬 Embedding:这个过程可以简单理解为数据的向量化。无论是哪种维度的数据,最终都需要通过归一化和自关联的步骤来转化为向量。目前 ChatGPT 的 text-embedding-ada-002 模型表现尤为突出。实际上,ChatGPT 之所以能在众多大模型中脱颖而出,很大程度上得益于其卓越的 Embedding 结果。

💾 VectorStore:存放那些已经向量化数据的向量数据库。市面上许多向量数据库都能够胜任这项工作,比如:Milvus、Pinecone、腾讯云向量数据库、Redis 等,它们不仅能够存储数据,还能支持语义计算,比如:欧式距离、余弦公式等操作。

知识库架构原理很简单,如果知识库库使用用户数少,比如:公司内部员工使用,在一些基础问题上,它还能回答的差不多,但是在复杂问题上,还没有看到一个非常厉害的知识库出现!

 2

大模型知识库的落地困境

首先,我们面临的第一个挑战是:在进行文档向量化的过程中,文档中常常包含大量图片。这些图片在传递语义信息方面往往更为丰富。但在图片处理过程中,它们可能仅仅被转换成一个简单的链接。更有甚者,一些文档还包含视频内容,这进一步增加了处理的复杂性。

因此,文档处理不能仅仅依赖传统的自然语言处理(NLP)技术,还需要能够支持多模态信息的整合和分析。目前,似乎还没有看到哪个系统能够完全实现这样的能力。正如下图所示,它就是一个典型的例子。

946b9ea8a1b28a73b146b67d06e6c3ff.png

其次,我们面临的第二个挑战是:影响结果的就是文档的大小,如果知识库过于庞大,在分割完成后,召回的数据也会过多,必然存在舍弃导致的信息不全。不过这种情况可以通过尝试多路调用,再整合的思路解决。

再次,如果提出的问题区分度不高,得到的答案可能会过于笼统。知识库的核心优势在于提供的信息必须是准确和有用的。用户并非专家,无法辨别每次得到的信息是否正确,因此,如果知识库时而提供有用信息,时而给出错误信息,用户可能会选择不再使用。这与专家使用助手的方式存在本质区别。

为了帮助同学们彻底掌握大模型的知识库、 Agent 智能体、向量数据库、 RAG、知识图谱的应用开发、部署、生产化,今天我会开两场直播和同学们深度剖析,请同学们点击以下预约按钮免费预约

 3

!送!AI大模型开发直播课程

大模型的技术体系非常复杂,即使有了知识图谱和学习路线后,快速掌握并不容易,我们打造了大模型应用技术的系列直播课程,包括:通用大模型技术架构原理、大模型 Agent 应用开发、企业私有大模型开发、向量数据库、大模型应用治理、大模型应用行业落地案例等6项核心技能,帮助同学们快速掌握 AI 大模型的技能。

 🔥即将开播 

立即扫码,即可免费预约

进入直播,大佬直播在线答疑!

ba2e591ece94ecc9da51182be8c349ff.gif

da7b771b27b46309a8289682857aa36f.png

本期名额有限

高度起始于速度(手慢无!!)

 4

!!再送!!《AI 大模型技术知识图谱

最近很多同学在后台留言:“玄姐,AI 大模型技术的知识图谱有没?”、“AI 大模型技术有学习路线吗?”

我们倾心整理了 AI 大模型技术的知识图谱快来领取吧!

a87a93cb99825e88d949d66d6afc0f20.png

这份业界首创知识图谱和学习路线,今天免费送给大家一份!

只需要以下3步操作就可免费领取:

第一步长按扫码以下我的视频号:玄姐谈AGI

12b65ff4657bd1be77985a8d09859adf.png

第二步:扫码后,点击以下关注按钮,就可关注我。

18255ce6dd61b0a63e7fc2e7a43676bc.jpeg

第三步:点击"客服“按钮,回复知识图谱即可领取。

40277bb8c5a1739ab85ec594d90977a7.jpeg

 5

精选福利《基于RAG实现代码知识库》

以下视频你将学到:

    1、基于 RAG 实现代码知识库的流程设计

    2、代码知识库的核心工程点剖析

END

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值