免费链接: Blogger(需翻Q)
文章目录
本文说明
本文汇总了中文文本纠错(Chinese Spell Checking)任务在各个开源项目中的评价指标,他们虽然写法不同,但大部分本质是相同的,但也有少部分论文的评价指标存在问题或其他论文不一致,本文对他们的指标代码进行了分析,并说明了其中的问题。
评价指标总结(结论)
中文文本纠错通常使用精准率(Precision)、召回率(Recall)和F1-Score作为评价指标,有如下四种:
- Character-level Detection Metrics:少数论文使用了。意思是:按字为维度统计,能检测出错字的情况;就目前来看,大部分论文的该指标统计方式相同。
- Character-level Correction Metrics:少数论文使用了。意思是:按字为维度统计,能正确纠正字的情况;目前找到有三篇论文使用了该指标,但多多少少都