一.实验流程
1.环境配置
2.数据预处理与定义函数
3.构建模型
4.训练
5.进行翻译
6.得到分数
二.学习心得
本次实验是基于transformer进行机器翻译,大体上来说和task2的实验流程很像,除了最后使用的是transformer模型。由于有参考代码作为示例以及在学习task2时就已经搭建好的魔搭gpu环境,实验进行的流程比task2轻松不少,本次实验操作是唯一碰到的问题就是在同一环境下task2的代码能够运行而task3的代码会提示缺少模块,最后是将task3的代码复制到task2中进行运行,最后出来的结果分数也是比前两次高了许多,这样意味着这次实验的结果不如前两次,也许可以通过调参等手段进行改善。