学习人工智能，一定要知道这个网站，都是现成的资源_人工智能模型训练集从哪找的都是-CSDN博客

本文链接：https://blog.csdn.net/qq_45058947/article/details/131998240

Hugging Face

网站地址
Hugging Face 是一个创建和提供自然语言处理（NLP）模型的公司，特别是 Transformer 模型，例如 BERT、GPT-2、RoBERTa 等。Hugging Face 提供了一个非常有用的库：Transformers，可以帮助我们更容易地使用这些模型。

以下是一些使用 Hugging Face Transformers 的基础步骤，以及一个简单的案例。

安装

首先，你需要安装 transformers 库。如果你还没有安装，可以通过 pip 进行安装：

pip install transformers

导入模型和Tokenizer

Hugging Face 的 transformers 库中有许多预训练模型。你可以根据任务的需求选择适合的模型。比如，这里我们选择了 BERT 模型。我们同时也需要导入相应的 Tokenizer，用于处理输入文本。

from transformers import BertModel, BertTokenizer

model_name = 'bert-base-uncased'
model = BertModel.from_pretrained(model_name)
tokenizer = BertTokenizer.from_pretrained(model_name)

文本处理

使用 Tokenizer 处理文本数据。这里我们处理一段简单的文本。

text = "Hello, how are you?"
encoded_input = tokenizer(text, return_tensors='pt')

这将返回一个字典，其中包括 ‘input_ids’ 和 ‘attention_mask’。这两者都是模型所需要的。

输入模型

现在，你可以将编码后的输入数据送入模型中。

output = model(**encoded_input)

输出结果是一个元组，其中包括最后一层的隐藏状态以及池化输出。

案例

这是一个非常基础的示例，主要用于演示如何使用 Hugging Face 的 Transformers。实际使用中，你可能需要根据特定任务进行更详细的设置和调整，比如进行序列分类、命名实体识别、情感分析等。

下面是一个简单的情感分析案例：

from transformers import pipeline

nlp = pipeline("sentiment-analysis")

print(nlp("I love this movie. It's great!"))
print(nlp("I hate this movie. It's terrible!"))

这将输出每句话的情感及其相应的得分。例如：

[{'label': 'POSITIVE', 'score': 0.9998}]
[{'label': 'NEGATIVE', 'score': 0.9997}]

这表示第一句话是正面情感，第二句话是负面情感，得分越接近1表示模型对结果的确定性越高。