LangChain-RAG必备：向量数据库如何CRUD

南七小僧

于 2024-07-15 21:34:38 发布

阅读量117

点赞数 6

分类专栏：人工智能服务器开发 AI技术产品经理文章标签：数据库 langchain oracle

我是南七小僧，邮箱：xkk9866@yeah.net ，C9博士，前百度搜索AI平台产品负责人，欢迎交流思想碰撞。

本文链接：https://blog.csdn.net/qq_25439417/article/details/140449705

版权

人工智能同时被 3 个专栏收录

172 篇文章 238 订阅 ¥19.90 ¥99.00

订阅专栏

AI技术产品经理

69 篇文章 1 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

服务器开发

61 篇文章 158 订阅 ¥19.90 ¥99.00

订阅专栏

RAG是目前大语言模型从工具走向生产力实践的最热门的方式，它可以实现从海量的文本数据中检索相关的信息，并用于生成高质量的文本输出。而聊到RAG，我们就很难避开使用RAG的基础设施-向量数据库。

今天我将带领大家，以最为基础的CRUD入手来看看向量数据库应该如何使用。考虑到目前市面上的向量数据库众多，每个数据库的操作方式也无统一标准。本文将基于LangChain提供的VectorStore类中的统一操作方法，以chroma向量数据库作为示例进行演示。

向量数据库-新增

LangChain的VectorStore类是一个通用的向量数据库的接口，它可以对接不同的底层向量数据库，如chroma、faiss、annoy等，实现统一的操作方法和API。VectorStore类还提供了一些高级的功能，如语义检索、最大边际相关性（MMR）等，可以帮助我们更好地利用向量数据库的能力。

要想向向量数据库中新增数据，我们首先需要创建一个VectorStore对象，并在创建时配置好embedding function，即用于将原始数据转换为向量的函数。如下所示：

# 通过HuggingFace创建embedding_function
embeddings = HuggingFaceEmbedd

了解本专栏

关注

6
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
LangChain-RAG必备：向量数据库如何CRUD

*CRUD只是操作向量数据库的基础手段，想要用好RAG必须在CRUD的基础上掌握语义检索的相关原理。**比如文档拆分时需要按语义尽可能的拆分为小的单元，而在召回时，则需要基于召回的单元尽可能的补充完整的窗口上下文，才能在最终使用LLM时得到尽可能好的结果。这些都需要在crud的基础上执行一些额外操作，我将在下次给大家讲述，希望你持续关注。以上就是本文的全部内容，我希望你能从中学到一些有用的知识，也欢迎你在评论区留下你的反馈或问题。😊。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

南七小僧 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。