使用Hugging Face和LlamaIndex进行AI模型推理

最新推荐文章于 2024-10-12 12:26:23 发布

qq_37836323

最新推荐文章于 2024-10-12 12:26:23 发布

阅读量281

点赞数 3

文章标签：人工智能 python 深度学习

本文链接：https://blog.csdn.net/qq_29929123/article/details/140941649

版权

在这篇文章中，我们将介绍如何使用Hugging Face和LlamaIndex进行AI模型的推理。Hugging Face提供了丰富的AI模型和API接口，而LlamaIndex则是一个强大的工具库，可以帮助我们简化与这些模型的交互。本文将通过示例代码，展示如何在本地和远程环境中运行Hugging Face模型。

安装所需的包

首先，我们需要安装一些必要的Python包。这些包包括LlamaIndex、transformers和huggingface_hub。可以使用以下命令进行安装：

!pip install llama-index
!pip install "transformers[torch]" "huggingface_hub[inference]"

使用示例

下面的代码演示了如何使用Hugging Face的模型进行推理。我们将展示如何在本地和远程环境中运行Hugging Face模型，并进行简单的文本生成任务。

import os
from typing import Optional
from llama_index.llms.huggingface import HuggingFaceInferenceAPI, HuggingFaceLLM

# 设置Hugging Face的API令牌
HF_TOKEN: Optional[str] = os.getenv("HUGGING_FACE_TOKEN")

# 本地运行模型
locally_run = HuggingFaceLLM(model_name="HuggingFaceH4/zephyr-7b-alpha")

# 远程运行模型，通过Hugging Face的推理API
remotely_run = HuggingFaceInferenceAPI(
    model_name="HuggingFaceH4/zephyr-7b-alpha", token=HF_TOKEN
)

# 使用匿名方式远程运行模型
remotely_run_anon = HuggingFaceInferenceAPI(
    model_name="HuggingFaceH4/zephyr-7b-alpha"
)

# 使用推荐的模型运行
remotely_run_recommended = HuggingFaceInferenceAPI(token=HF_TOKEN)

# 生成文本
completion_response = remotely_run_recommended.complete("To infinity, and")
print(completion_response)  # 输出生成的文本

上面的代码演示了如何设置Hugging Face的API令牌，以及如何在本地和远程环境中运行模型。我们使用了HuggingFaceLLM和HuggingFaceInferenceAPI类来进行模型推理。

设置全局Tokenizer

如果你需要修改LLM，还应更改全局的Tokenizer以匹配：

from llama_index.core import set_global_tokenizer
from transformers import AutoTokenizer

set_global_tokenizer(
    AutoTokenizer.from_pretrained("HuggingFaceH4/zephyr-7b-alpha").encode
)