在自然语言处理发展的过程中,始终充斥着基于规则的理想主义方法和基于统计的经验主义方法之间的矛盾,自然语言处理也在这种矛盾中逐渐成长起来。
基于规则的理性主义方法
理想主义方法主张建立符号处理系统,由人工整理和编写初始的语言知识表示体系(通常为规则),构造相应的推理程序,系统根据规则和程序,将自然语言理解为符号结构——该结构的意义可以从结构中的符号的意义推导出来。
按照这种思路,在自然语言处理系统中,一般首先由词法分析器按照人编写的词法规则对输入句子的单词进行词法分析,然后,词法分析器根据人设计的语法规则对输入的句子进行词法结构分析,最后根据一套变换规则将词法结构映射到语义符号(如逻辑表达式、语义网络、中间语言等)。
理想主义方法的优点
- 基于规则的理性主义方法中的规则主要是语言学规则,这些规则的形式描述能力和形式生成能力都很强,在自然语言处理中有很好的应用价值。
- 基于规则的理性主义方法可以有效地处理句法分析中的长距离依存关系(long-distance dependencies)等困难问题,如句子中长距离的主语和谓语动词之间的一致关系问题(subject-verb agreement)、wh位移(wh-movement)问题。
- 基于规则的理性主义方法通常都是明白易懂的,表达得很清晰