huggingface 中模型如何查找和使用？

最新推荐文章于 2024-06-24 17:54:56 发布

x_cube

最新推荐文章于 2024-06-24 17:54:56 发布

阅读量1.6k

点赞数 2

文章标签：数学建模 pytorch 深度学习人工智能 python

本文链接：https://blog.csdn.net/qq_41458274/article/details/131175991

版权

在Models - Hugging Face模型中找使用方法

一：如何找到统一使用方法

对于文字处理AutoTokenizer是一样的，模型名可能不一样。具体操作如下：

1. 先在模型下面找到你需要的模型点开

2. 点开最右边的Use in Transformers

二：如何找到本模型使用方法

滑到底端的如何使用，此为pytorch的使用方法，也有其他的说明。

其中字符串名字可以为路径。

同理，文本操作如下：

专属命名的方法一般是：

分词器命名："模型名+Tokenizer"

图片处理命名：模型名+ImageProcessor

模型名命名：“ 模型名+Modal”

这个命名和公司有关，还是直接选择自己需要的模型在官网查询使用最好。

三：两种使用方法结果一样

# -------------------- 使用 RobertaTokenizer ---------------
tokenizer = RobertaTokenizer.from_pretrained(pretrained_model_path)
inputs = tokenizer("对比原始的分词和最新的分词器", return_tensors="pt")
print(inputs['input_ids'])


# -------------------- 使用 AutoTokenizer ---------------
auto_tokenizer = AutoTokenizer.from_pretrained(pretrained_model_path) # 使用一样的
auto_inputs = auto_tokenizer('对比原始的分词和最新的分词器', return_tensors='pt')
print(auto_inputs['input_ids'])

输出的结果一样。