基于规则和基于统计的区别、方法简介

本文探讨了基于规则和基于统计的自然语言处理(NLP)方法,从理性主义与经验主义的角度出发,阐述两者在语言知识来源、理论基础和处理方法上的差异。基于规则的方法依赖Chomsky的文法理论,而基于统计的方法则利用大规模语料库和统计模型。文章还介绍了统计语言模型,特别是N-gram模型及其平滑技术在解决数据稀疏性问题上的应用。
摘要由CSDN通过智能技术生成

最近在网络上一直在了解有关基于规则和基于统计的方法的文章,但是觉得说的还是很笼统,为此,根据自己所做的工作参考一些材料聊聊自己的认识,说的较为简单,希望大家能给予批评指正!

说起基于规则和基于统计就不能不说一下有关NLP的一些基本研究方法,首先这谈谈理性主义和经验主义在哲学上的不同之处:

其一就是对语言知识来源不同的认识:理性主义认为人的很大一部分语言知识都是与生俱来的,由遗传决定;经验主义认为人的语言知识是通过感官输入,经过一些简单的联想与通用化的操作而得到的。

其次区别之二就是理性主义研究人的语言知识结构,实际的语言数据只是提供这种内在知识的间接证据;而经验主义直接研究这些实际的语言数据。

其三就是它们运用的是不同的理论,理性主义通常是基于Chomsky的语言原则,通过语言所必须遵守的一系列原则来描述语言;经验主义通常是基于Shannon的信息论。

其四就是采用的是不同的处理方法,理性主义是通过一些特殊的语句或是语言现象的研究得到对人的语言能力的认识,而这些语句和语言现象在实际的应用中不常见,而经验主义偏重於对大规模的语言数据,更偏重于对实际使用中的普通语句的统计。

由哲学思想的理性主义和经验主义可以得到基于规则和基于统计的方法,可以说,哲学的两种思想是导致NLP的两个分支。理性主义问题的求解方法是通过规则的分析方法,建立符号处理系统,目前的方法有基于规则库、词典标准、推到算法设计等,具体实现方法有、形式语言、语法理论、词法理论、推理方法等,主要是以Chomsky的文法理论为基础,通过知识库和推理系统的结合来建立NLP系统。而经验主义的问题求解方法是通过大规模的真实语料ÿ

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值