错别字分析——自建错词库

        前几天帮师兄弄一个错词库,网上找了半天都没有,就自己动手浏览各大论坛、贴吧,自己鼓捣了一个极少的错词库,相对十分简陋,共200+的错词,分成两个txt文档,有需要的可以拿来下载使用。

文件格式:错误-正确\t[错误]例句\t[正确]例句\n

例子:结帐-结账 喝的差不多了人家来[结帐]喝的差不多了人家来[结账]

传送门:https://github.com/Rrbsmoy/NLP/tree/master/Typos_Analysis/WrongWords

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值