- 博客(1)
- 收藏
- 关注
原创 基于transformer实现机器翻译(日译中)
最后,我们讨论了两种保存模型的方式,一种用于推理,另一种用于恢复训练。总共,在trainen和trainja中的句子数量为5,973,071条,然而,为了学习目的,通常建议对数据进行抽样,并确保一切按预期工作,然后再一次性使用所有数据,以节省时间。在这里,我将BATCH_SIZE设置为16以防止“cuda内存不足”,但这取决于各种因素,如您的机器内存容量、数据大小等,因此根据您的需求随时更改批量大小(注意:PyTorch的教程使用Multi30k德语-英语数据集将批量大小设置为128)。
2024-06-26 20:24:34 796
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人