基于规则的自然语言处理在自然语言处理刚开始发展的时候,是处在领先的地位,因为人们觉得自然语言处理的过程和人类学习和认知一门语言的过程应该相似的,所以大量的研究员也是从这个点出发来研究自然语言处理。
但是后来发现根据规则开发出来的系统不是特别好,有的研究员就换一个方向,觉得应该从基于统计的角度来研究自然语言处理,其实基于统计的方法有点像通信的编码与解码,原始语句就是一个已经编码的信息,然后我们根据统计的概率,解码处原始信息。这个方法是自然语言处理的效果有了很大的提升,慢慢地,该方法也占据了该方向的主导地位。基于统计的自然语言处理为什么能发展这么好,有它的历史原因:互联网的高速发展,使得人们可以得到丰富的语料,而完善的语料库是统计自然语言处理成功地一个先决条件,还有就是硬件的发展也给该方向提供了强大的硬件支撑。
虽然目前基于统计的自然语言处理比基于规则的自然语言处理有很大优势,但是历史是发展的,我们谁也不能保障,在将来的某一天,基于规则的自然语言处理会不会因为具备了某种条件而再一次重获得历史的主角。