机器翻译
文章平均质量分 92
雨宙
喜欢看韩剧的程序猿
展开
-
单语适配器代码复现
采用fairseq框架对单语适配器代码进行复现原创 2023-03-22 12:29:04 · 284 阅读 · 0 评论 -
fairseq读代码系列(二)——多语言的采样过程
本文旨在根据框架代码来探究一下fairseq是如何根据每个语言向的dataset和指定的max token/max sentence来确定每个batch的batch sampler的。原创 2023-03-20 12:56:20 · 786 阅读 · 0 评论 -
fairseq读代码系列(一)
本文主要对fairseq框架模型训练之前的准备工作原理展开说明,重点是对框架源码的理解,文中以transformer模型为例,数据处理的过程是按照官方文档中对IWSLT数据集的处理进行的。原创 2023-02-28 19:16:27 · 1392 阅读 · 2 评论 -
CHRF评估指标
不同于BLEU评估指标,CHRF评估指标可以衡量字符级的准确度和流畅度,改进后的CHRF评估指标(CHRF++)将字符级和单词级融合在一起,更全面的评估文本的生成质量,本文主要对CHRF和CHRF++评估指标的手动计算过程和使用nltk和sacrebleu工具的计算原理作出总结和说明。原创 2022-12-30 11:30:17 · 2233 阅读 · 0 评论 -
BLEU评估指标
BLEU评估指标在机器翻译任务中经常使用,本文主要对BLEU评估指标的计算过程以及计算工具的使用进行总结原创 2022-12-28 17:55:53 · 10555 阅读 · 1 评论