目录
1 语言模型(Language Model)的定义
- 定义:语言模型是一个单纯的、统一的、抽象的形式系统,语言客观事实经过语言模型的描述,比较适合于电子计算机进行自动处理,因而语言模型对于自然语言的信息处理具有重大的意义。
- 数学角度理解:语言模型就是对于一个语素序列 ,计算出这个语素序列的概率,即: (语素指语言中最小的音义结合体,一般来说就是独立的词)
简单来说就是通过一些数学手段,计算出对于一个句子的概率大小,概率大这句话就是正确的,概率小这句话就是错误的。例如:,这里是存在语序的。
语言模型主要有三种类型:1. 生成性模型,2. 分析性模型,3. 辨识性模型。这里我的理解就是NLG和NLU,NLG就是根据意思生成文本或语音,NLU就是根据语音或文本理解它的意思,第三个是前两者的结合体从而实现更强大的功能。
2 N-gram
2.1 链式法则(chain rule)
首先需要知道链式法则:
把上面提到的语言模型带入可以得到:
其中