0. 写在前面
从这一讲开始,我们开始进行计算语言学的正式讲解。
1. 自然语言处理?计算语言学?
关于自然语言处理,有多种说法,可以说自然语言生成,自然语言理解,自然语言处理,中文信息处理以及计算语言学。但这些说法都是有区别的,例如,自然语言理解是偏向于人工智能方向说的,但是其实自然语言理解是自然语言处理的一部分,自然语言要处理,首先要能够理解,其次才是生成,这是一个输入,一个输出的完整过程。因此我个人认为,自然语言处理包含了自然语言理解与自然语言生成。自然语言处理则是偏向应用方面的说法。中文信息处理则是特指中文的语言处理,而计算语言学则是从语言学的角度来说的。
2. 自然语言处理的历史
1. 创世纪
既然搞清楚了我们在说什么东西后,我们就来了解一下自然语言处理的历史。自然语言处理的发展和人工智能的发展密切相关,自然语言处理的起家之作,就是尝试进行机器翻译。早在二战时期,机器翻译的前身,谍战中的密码加密解密就已经广泛流行在各国的暗战之中。大名鼎鼎的,图灵之前在英国就是创造了这么一台广义上的计算机,用于破解德军的密码,从而大大减少了英军的损失。