使用Pytorch复现Transformer

Transformer(Pytorch) - Machine Translation

项目链接点击这里
如果有帮助可以star一下,谢谢!!
使用Pytorch复现Transformer,并完成机器翻译任务(法语 -> 英文、英文 -> 中文)

Install

git clone https://github.com/JiaxingSong718/Transformer.git  # clone
cd Transformer

Environment

conda create -n Transformer python=3.7
conda activate Transformer
pip install -r requirements.txt  # install

Dataset

法语 -> 英文数据集:

数据集trainvalid

英文 -> 中文数据集:

repo中的翻译语料(translation2019zh)

note:由于设备原因,只取了translation2019zh中train的前58000个,valid的前2028个。

将下载后的数据集按照如下结构放置:

Transformer/
├── dataset/
    └── dataset_De2En/
        └── train/
            ├── train.de
            └── train.en
        └── val/
            ├── val.de
            └── val.en

    └── dataset_De2En/
        ├── translation2019zh_train.json
        └── translation2019zh_valid.json

Train

Prepare

先预处理数据将其保存为.pt文件

python ./dataset/dataset_De2En.py or python ./dataset/dataset_En2Zh.py

接下来执行train.py

python train.py --dataset De2En --weights ./checkpoints/model_De2En.pth --epochs 150 --batch-size 256

Decect

python detect.py --dataset De2En --weights ./checkpoints/model_De2En.pth --sentence "Zwei Männer unterhalten sich mit zwei Frauen."

Reference

  • 7
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值