探索Langchain与YandexGPT：轻松实现文本嵌入-CSDN博客

本文链接：https://blog.csdn.net/qq_29929123/article/details/142385432

引言

在当今的自然语言处理（NLP）领域，文本嵌入是一项重要的技术，它将文本转换为向量形式，方便进行计算和比较。而YandexGPT提供了一种强大的嵌入方式，结合Langchain库可以高效地实现这一过程。这篇文章将带你深入了解如何使用YandexGPT进行文本嵌入，并提供实用的代码示例。

主要内容

1. 环境准备

在开始之前，确保安装了yandexcloud Python 包：

%pip install --upgrade --quiet yandexcloud

2. 授权设置

使用YandexGPT进行文本嵌入需要创建一个服务账号，并分配ai.languageModels.user角色。接下来，您有两个授权选项：

IAM 令牌：通过构造函数参数iam_token或环境变量YC_IAM_TOKEN指定。
API 密钥：通过构造函数参数api_key或环境变量YC_API_KEY指定。

3. 模型选择

可以通过model_uri参数指定所需的模型。默认情况下，使用来自参数folder_id或环境变量YC_FOLDER_ID指定文件夹中的最新版本的text-search-query模型。

4. 使用Langchain库

我们将使用Langchain库中的YandexGPTEmbeddings类来实现文本嵌入。

代码示例

以下是如何使用YandexGPT实现文本嵌入的完整代码示例：

from langchain_community.embeddings.yandex import YandexGPTEmbeddings

# 使用API代理服务提高访问稳定性
embeddings = YandexGPTEmbeddings()

text = "This is a test document."

# 嵌入查询
query_result = embeddings.embed_query(text)

# 嵌入文档
doc_result = embeddings.embed_documents([text])

# 输出结果
print(query_result[:5])  # 输出前5个元素
print(doc_result[0][:5])  # 输出文档嵌入的前5个元素