LlamaIndex 实现 RAG（三）- 向量数据库

hawk2014bj

已于 2024-08-26 15:19:18 修改

阅读量708

点赞数 20

分类专栏： LlamaIndex RAG 实现 LlamaIndex LLM 应用落地文章标签： LlamaIndex rag LLM

于 2024-08-25 22:14:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hawk2014bj/article/details/141530262

版权

LlamaIndex LLM 应用落地同时被 2 个专栏收录

8 篇文章 1 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

LlamaIndex RAG 实现

5 篇文章 0 订阅

订阅专栏

RAG 中使用向量存储知识和文档数据，召回时通过语意进行搜索。文档转为向量是个非常消耗时的操作，不同 Embedding Model 参数不同，结果维度也不同，消耗的算力也不同。所以通常的做法都会在索引阶段（Embedding）把向量保存到向量数据库中，在召回阶段，向量数据库会根据选择的算法计算向量相似度，最终将分数高的数据进行返回。本文将介绍向量数据库的使用方法，包括以下几部分

什么是 Embedding Model？
向量数据库的使用，包括 Chroma 和 PGVector
向量文档的管理，文档更新

什么是Embedding Model

嵌入模型用于通过复杂的数值来表示文档，嵌入模型将文本作为输入，并返回一个向量，向量用于捕捉文本的语义。这些嵌入模型经过训练，能够以向量方式表示文本，并帮助实现语音搜索。从高层次来看，如果用户提出一个关于狗的问题，那么该问题的向量与讨论狗的文本的向量将非常相似。在计算向量之间的相似度时，有许多方法可以使用（点积、余弦相似度等）。默认情况下，LlamaIndex在比较嵌入时使用余弦相似度。

相似度算法

向量相似度算法主要包括三种，欧式距离（L2)、

了解本专栏

超级会员免费看

关注

20
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。