自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 NLP实验基于Transformer实现机器翻译

首先,我们选取中日语料(from JParaCrawl)来进行本次实验,下载已经用spm训练好的中文分词器(此处采用的英文分词器进行分词,效果还可以)和日文分词器对文本进行分词和索引映射处理,并对数据集进行训练集和验证集的划分,我们可以使用由JParaCrawl提供的标记器,它是使用日语和英语的句子片段创建的。大多出现的问题是torch库和torchtext库的版本不对导致的,多次修改后才找到合适版本。另外有一点要注意的是,在终端中调整库的版本,代码需要重启内核再次运行才能使用调整后的库的版本。

2024-06-27 00:16:03 361

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除