自然语言理解（NLU）-文本纠错学习笔记1

m0_61948575

已于 2022-04-07 02:33:30 修改

阅读量2k

点赞数 2

分类专栏：自然语言理解文章标签：自然语言处理

于 2022-04-07 02:15:39 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61948575/article/details/124003935

版权

1概念理解：

首先，文本纠错是实现文本语句自动检查、自动纠错的一项重要技术，提高语言的正确性并减少人工成本。

通常类型有：语音转换语言转换、发音不标准、拼写错误、语法错误（多打漏打乱序等）、知识错误（概念模糊）等

2目前研究现状：

目前纠错方法主要分为两个方向：基于规则和基于深度模型

基于规则：第一步是错误检测，第二步是错误纠正

错误检测：先通过结巴中文分词器切词，由于句子中含有错别字，所以切词结果往往会有切分错误的情况，这样从字粒度和词粒度两方面检测错误，整合这两种粒度的疑似错误结果，形成疑似错误位置候选集；

错误纠正：遍历所有的疑似错误位置，并使用音似、形似词典替换错误位置的词，然后通过语言模型计算句子困惑度，对所有候选集结果比较并排序，得到最优纠正词。

深度模型：具体可参照下文中“其他”部分的第三类方法

端到端的深度模型可以避免人工提取特征，减少人工工作量，RNN序列模型对文本任务拟合能力强，rnn_attention在英文文本纠错比赛中取得第一名成绩，证明应用效果不错；

CRF会计算全局最优输出节点的条件概率，对句子中特定错误类型的检测，会根据整句话判定该错误，阿里参赛2016中文语法纠错任务并取得第一名，证明应用效果不错；

seq2seq模

最低0.47元/天解锁文章

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
自然语言理解（NLU）-文本纠错学习笔记1

1概念理解：首先，文本纠错是实现文本语句自动检查、自动纠错的一项重要技术，提高语言的正确性并减少人工成本。通常类型有：语音转换语言转换、发音不标准、拼写错误、语法错误（多打漏打乱序等）、知识错误（概念模糊）等2目前研究现状：目前纠错方法主要分为两个方向：基于规则和基于深度模型基于规则：第一步是错误检测，第二步是错误纠正错误检测：先通过结巴中文分词器切词，由于句子中含有错别字，所以切词结果往往会有切分错误的情况，这样从字粒度和词粒度两方面检测错误，整合这两种粒度的疑似错误结果，..
复制链接

扫一扫

专栏目录

m0_61948575 CSDN认证博客专家 CSDN认证企业博客

码龄3年

3: 原创

118万+: 周排名

100万+: 总排名

8655: 访问

: 等级

37: 积分

10: 粉丝

4: 获赞

2: 评论

59: 收藏

私信

关注

热门文章

分类专栏

自然语言理解 2篇
python/深度学习/keras 1篇

最新评论

python 深度学习方法代码整理
Τιτάν: Your TensorFlow version is newer than 2.4.0 and so graph support has been removed in eager mode and some static graphs may not be supported. See PR #1483 for discussion. `tf.keras.backend.set_learning_phase` is deprecated and will be removed after 2020-10-11. To update it, simply pass a True/False value to the `training` argument of the `__call__` method of your layer or model.这怎么解决呀
python 深度学习方法代码整理
生命苦短必须喜感: 你好，我使用的pytorch不是keras，显示NameError: name 'EarlyStopping' is not defined，是必须使用keras吗？刚学习深度学习

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。