ahuChen-CSDN博客

原创实验14.基于Transformer实现机器翻译（日译中）

在导入所有的日语和其对应的中文数据之后，我删除了数据集中的最后一条数据，因为它有一个缺失值。一般来说，根据以后的使用目的，有两种保存模型的方法。当你使用自己的GPU的时候，NUM_ENCODER_LAYERS 和 NUM_DECODER_LAYERS 设置为3或者更高，NHEAD设置8，EMB_SIZE设置为512。最后，在准备好必要的类和函数之后，我们就可以训练我们的模型了。首先，我们创建函数来翻译新的句子，包括获取日语句子、分词、转换为张量、推理，然后将结果解码回一个英语句子。

2024-06-25 09:09:57 1300

原创实验14.基于Transformer实现机器翻译（日译中）

Japanese HS Code Harmonized Code System < HSコード 2905 非環式アルコール並びにそのハロゲン化誘導体、スルホン化誘導体、ニトロ化誘導体及びニトロソ化誘導体 HS Code List (Harmonized System Code) for US, UK, EU, China, India, France, Japan, Russia, Germany, Korea, Canada ...如果想要看到训练的效果请使用你自己的带GPU的电脑运行这一套代码。

2024-06-22 10:42:56 717

原创实验13：机器翻译

它是预测序列与标签序列匹配词数为𝑛𝑛的子序列的数量与预测序列中词数为𝑛𝑛的子序列的数量之比。举个例子，假设标签序列为𝐴𝐴、𝐵𝐵、𝐶𝐶、𝐷𝐷、𝐸𝐸、𝐹𝐹，预测序列为𝐴𝐴、𝐵𝐵、𝐵𝐵、𝐶𝐶、𝐷𝐷，那么𝑝1=4/5,𝑝2=3/4,𝑝3=1/3,𝑝4=0𝑝1=4/5,𝑝2=3/4,𝑝3=1/3,𝑝4=0。输出层的输出个数为1。在下面的例子中，编码器的时间步数为10，批量大小为4，编码器和解码器的隐藏单元个数均为8。其中的输出指的是最后一层的隐藏层在各个时间步的隐藏状态，并不涉及输出层计算。我们先定义一些特殊符号。

2024-06-22 10:21:09 624

原创实验四：自然语言处理前馈网络

一、实验介绍1. 实验内容在实验3中，我们通过观察感知器来介绍神经网络的基础，感知器是现存最简单的神经网络。感知器的一个历史性的缺点是它不能学习数据中存在的一些非常重要的模式。例如，查看图4-1中绘制的数据点。这相当于非此即彼(XOR)的情况，在这种情况下，决策边界不能是一条直线(也称为线性可分)。在这个例子中，感知器失败了。图4-1 XOR数据集中的两个类绘制为圆形和星形。请注意，没有任何一行可以分隔这两个类。在这一实验中，我们将探索

2024-06-22 09:55:42 805 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 实验14.基于Transformer实现机器翻译（日译中）

原创 实验14.基于Transformer实现机器翻译（日译中）

原创 实验13：机器翻译

原创 实验四：自然语言处理前馈网络

空空如也

空空如也

原创实验14.基于Transformer实现机器翻译（日译中）

原创实验14.基于Transformer实现机器翻译（日译中）

原创实验13：机器翻译

原创实验四：自然语言处理前馈网络