Transformers预训练模型使用：翻译 Translation

最新推荐文章于 2024-04-20 18:32:07 发布

HMTT

最新推荐文章于 2024-04-20 18:32:07 发布

阅读量1.6k

点赞数

分类专栏： # Transformers 文章标签：自然语言处理深度学习机器翻译人工智能语言模型

本文链接：https://blog.csdn.net/qq_42464569/article/details/122411386

版权

Transformers 专栏收录该内容

11 篇文章 5 订阅

订阅专栏

翻译是将一个语言的文本转化为另一个语言文本的任务。

翻译任务的一个比较经典的数据集是WMT English to German dataset，将英语作为输入，对应德语作为输出（自己用的时候也可以反过来）。

使用pipeline

可以使用如下代码快速实现：

from transformers import pipeline

translator = pipeline("translation_en_to_de")
print(translator("Hugging Face is a technology company based in New York and Paris", max_length=40))

运行结果：

[{'translation_text': 'Hugging Face ist ein Technologieunternehmen mit Sitz in New York und Paris.'}]

由于翻译的pipeline依赖于PreTrainedModel.generate()方法，因此我们可以像上面的max_length一样覆盖默认的方法。

使用模型和文本标记器

具体步骤如下：

实例化文本标记器和模型。一般使用BERT或T5模型。
定义一个需要翻译的文本。
加上T5翻译的特殊前缀translate English to German:。
使用PreTrainedModel.generate()方法进行翻译。

示例代码：

cache_dir="./transformersModels/summarization"
"""
,cache_dir = cache_dir
"""
from transformers import AutoModelWithLMHead, AutoTokenizer

model = AutoModelWithLMHead.from_pretrained("t5-base",cache_dir = cache_dir, return_dict=True)
tokenizer = AutoTokenizer.from_pretrained("t5-base",cache_dir = cache_dir)

inputs = tokenizer.encode("translate English to German: Hugging Face is a technology company based in New York and Paris", return_tensors="pt")
outputs = model.generate(inputs, max_length=40, num_beams=4, early_stopping=True)
print(tokenizer.decode(outputs[0]))

运行结果：

Hugging Face ist ein Technologieunternehmen mit Sitz in New York und Paris.

与pipeline结果一致。

HMTT

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Transformers预训练模型使用：翻译 Translation

翻译是将一个语言的文本转化为另一个语言文本的任务。翻译任务的一个比较经典的数据集是WMT English to German dataset，将英语作为输入，对应德语作为输出（自己用的时候也可以反过来）。使用pipeline可以使用如下代码快速实现：from transformers import pipelinetranslator = pipeline("translation_en_to_de")print(translator("Hugging Face is a technology
复制链接

扫一扫