中文文本纠错模型bert4keras

最新推荐文章于 2024-07-01 23:04:08 发布

Py_to_Java2021

最新推荐文章于 2024-07-01 23:04:08 发布

阅读量1.7k

点赞数 1

分类专栏： Python

原文链接：https://github.com/fushengwuyu/chinese_spelling_correction

版权

Python 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

中文文本纠错模型
这里提供三种文本纠错模型的实现

bert语言模型+字音字形相似度
correction_basic.py
缺点:
不能解决多字,少字问题
MLM
correction_mlm.py 利用bert的MLM训练机制实现纠错功能
输入: [CLS]错误句子[SEP][MASK][MASK]…[MASK][SEP]
输出: 正确句子
seq2seq
correction_seq2seq.py 使用文本生成的方式生成正确句子
输入: [CLS]错误句子[SEP][MASK][MASK]…[MASK][SEP
输出: 正确句子
*　缺点：推断速度比较慢

https://github.com/fushengwuyu/chinese_spelling_correction

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
中文文本纠错模型bert4keras

中文文本纠错模型这里提供三种文本纠错模型的实现bert语言模型+字音字形相似度correction_basic.py缺点:不能解决多字,少字问题MLMcorrection_mlm.py 利用bert的MLM训练机制实现纠错功能输入: [CLS]错误句子[SEP][MASK][MASK]…[MASK][SEP]输出: 正确句子seq2seqcorrection_seq2seq.py 使用文本生成的方式生成正确句子输入: [CLS]错误句子[SEP][MASK][MASK]…[MASK]
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。