star过的话,是可以在自己的目录下找到记录的
BPE分词模型介绍 优势1:压缩词表、优势2:缓解了OOV,因为针对没有出现的词不统一用unk,而是有区分的定义
统计各种组合词的次数然后排序,按最大次数来拆分,最大的次数就是最优可能拆分的可能
特别注意,seq-to-seq的框架,有编码器的输入,还有解码器的输入,(source,target)作为input,label和target是刚好错开一位的。
target第一位是BOS,最后一位是最后一个字符,label的第一位是第一个字,最后一位是EOS。不管是翻译模型还是一些问答模型等等,都是和这个架构。
6-2 实践课:中英文本翻译系统
最新推荐文章于 2023-03-22 14:45:28 发布