6-2 实践课:中英文本翻译系统

在这里插入图片描述
star过的话,是可以在自己的目录下找到记录的
在这里插入图片描述
在这里插入图片描述
BPE分词模型介绍 优势1:压缩词表、优势2:缓解了OOV,因为针对没有出现的词不统一用unk,而是有区分的定义
在这里插入图片描述
统计各种组合词的次数然后排序,按最大次数来拆分,最大的次数就是最优可能拆分的可能
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
特别注意,seq-to-seq的框架,有编码器的输入,还有解码器的输入,(source,target)作为input,label和target是刚好错开一位的。
target第一位是BOS,最后一位是最后一个字符,label的第一位是第一个字,最后一位是EOS。不管是翻译模型还是一些问答模型等等,都是和这个架构。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值