再看机器翻译

前面有文章具体介绍了机器翻译用到的模型:seq2seq和加入attention机制。这里再说点别的。

1 机器翻译评价标准BLUE

参考文章介绍的很详细。论文地址:url

2 模型背后的理论:密码学

例如从中文翻译成英文,可以将中文看做是加密了的英文。

3 工程上

1 Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation

2 NEURAL MACHINE TRANSLATION
BY JOINTLY LEARNING TO ALIGN AND TRANSLATE

https://arxiv.org/pdf/1508.04025.pdf

google的翻译模型

Zero-shot NMT:解决没有翻译原材料的问题

Transformer模型:现在流行的模型

Model Inference:怎样做到统一训练和预测。在各类⽂本⽣成任务中,其实⽂本的⽣成与训练是两种不同的情形。在训练的过程中,我们假设模型在
⽣成下⼀个单词的时候知道所有之前的单词(groud truth)。然⽽在真正使⽤模型⽣成⽂本的时候,每⼀步⽣成的⽂本都来⾃于模型本身。这其中训练和预测的不同导致了模型的效果可能会很差。为了解决这⼀问题,⼈们发明了各种提升模型预测⽔平的⽅法,例如Beam Search

beam search是一种固定宽度的装置。在每一步都选择概率最大的k个词。
第一步选择k个词:y11,y12,y13
第二步为每个词再生成k个下一个词,这里有 k 2 k^2 k2个词,然后选择概率最高的k个词。
k太大,或者太小,都可能会造成标准答案丢失。所以不能完整解决问题。
例如:美国总统和中国主席打电话。
翻译的时候:k=1,那假如最高的词是U.S. 那American就会丢了。
如果k=3,假如排序是American U.S Unite State
在第二步的时候可能因为各种原因把American丢了。

开源项目:
FairSeq https://github.com/pytorch/fairseq Facebook的开源项目
Tensor2Tensor https://github.com/tensorflow/tensor2tensor google开源项目,是Attention is all your need的标准实现
Trax https://github.com/google/trax google现在维护的开源项目

做翻译可以使用的开源工具
Pointer network 文本摘要
Copy Mechanism 文本摘要
Converage Loss
ConvSeq2Seq
Transformer
Tensor2Tensor

PyTorch代码

4 做翻译可以做的事情

1 使用transformer模型
2 可以使用的库 Facebook、OpenNMT-py、huggingface、allenXXX
3 beamsearch
4 Copy Mechanism:直接复制一个词。
5 加入中文分词或者使用word-piece

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值