中文句子处理之句子错误检查——顺便为跳票道歉

最新推荐文章于 2024-07-25 10:10:09 发布

fox801501

最新推荐文章于 2024-07-25 10:10:09 发布

阅读量2.7k

点赞数 1

分类专栏：智能语言文章标签：智能语言入门教程依存树句法分析教程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fox801501/article/details/51461089

版权

本文主要介绍中文句子错误检查的方法，并结合依存树进行句法分析，适合智能语言处理初学者入门学习。

摘要由CSDN通过智能技术生成

句子相似度计算已将跳票好久了，工作的事情一直比较忙也没有时间再做，这阵子轻松一点了会慢慢补上（反正已经厚着脸皮跳票快一年了）。有个机会接触到了句子错误检查，突发奇想利用之前的句子依存关系分析做了一个句子错误检查的程序。
说技术实现之前先要老生常谈一个依存关系的问题，一个词在句子中的位置基本上是固定，大家可以结合词性来理解。比如英语中，一个单词的词性是固定的，当年写英语题目判断错误的一个重要手段就是看单词的词性是否是正确的，如果这个单词根本没有这个词性，虽然我不知道它错在哪里但基本能肯定这个句子是错的。这个方法简单粗暴，但确确实实很实用。实际上，我看到的文献，句子错误检查最早的思路就是进行词性判读。这一点大家可以在中科院分词的具体实现中看出端倪，HMM算法的基础就是词性，然后将这个词最可能出现的位置算出来，也顺带进行了一次句子错误检查，大量歧义也在此时被检查出来。这个大家可以看我之前写的歧义分析那篇文章。
那么我们还有什么方法进行句子的错误检查呢？概率！这个就非常宽泛了，想法从简单到复杂都有。最简单的想法，一个字可能出现的概率非常低，但它在句子中出现了，我们就可以怀疑是不是写错字了，那么将写法相似的字或者读音相似的字拿过来，判断一下看看是不是正确的。这种方法显然对一些生僻字非常实用。
另一个想法，我们可以将所有容易弄错的句子或者短语统计出来，然后判断

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。