jcorrector
项目地址:https://github.com/jiangnanboy/jcorrector
中文文本纠错工具。音似、形似错字(或变体字)纠正,可用于中文拼音、笔画输入法的错误纠正。项目为java开发,此项目参考了pycorrector,在此对作者表示感谢。
jcorrector依据语言模型检测错别字位置,通过拼音音似特征、笔画五笔编辑距离特征及语言模型句子概率值特征纠正错别字。
1.利用n-gram语言模型检测错别字位置,通过拼音音似特征、笔画五笔编辑距离特征及语言模型句子概率值特征纠正错别字。
2.利用深度学习模型(如macbert等)进行中文拼写纠错。
Guide
Question
中文文本纠错任务,常见