生成式模型并不是从自变量出发对北语测量搭建模型,他的建模理念是通过模型理解数据是如何产生的,并以此为基础,借助贝叶斯框架对位置数据做预测。模型过程更复杂。
三种从简单到复杂的模型:朴素贝叶斯,判别分析,隐马尔可夫模型
朴素贝叶斯模型假设性最强,它假设特征是条件独立的。虽然假设很牵强,但朴素贝叶斯在文本分类上的效果不错,它可做原子模型与其他模型进行联结组合成更加复杂的模型。
判别分析模型放松了特征条件的独立假设,允许自变量间相互关联。这些模型假设特征在类别已知条件下符合正太分布,它只能处理连续性的变量。在判别分析中常用的方法有两种:一是对数据降为,二是与其他模型组合成复杂的模型。
隐马尔可夫模型是一个复杂的模型,这类模型在其他简单模型的基础上加入了马尔可夫链,因此他能处理两类模型处理不了的序列数据。它可以处理监督式学和非监督式学习。在非监督式学习中,这模型似乎能够自动学习人类无法观测到的被预测量,有独立的智慧,这是人工智能吸引人的地方。