上一章讲了概率分类模型,对p(c1|x)进行计算,看属于哪一个类的概率高就属于哪一个类
最后的时候进行了贝叶斯公式的变形,将其变成了p(c1|x)=者其实就是逻辑回归函数
1.模型推导:
最后提到的缺陷(两个类别分布在两个对角线两端需要用特征转换)也就引出了下一节神经网络(一个逻辑回归的输入可以来源于其他逻辑回归的输出,这个逻辑回归的输出也可以是其他逻辑回归的输入。把每个逻辑回归称为一个 Neuron(神经元),把这些神经元连接起来的网络,就叫做 Neural Network(神经网络)。)
2.思考问题:
Q5判别方法不一定比生成方法好
生成方法的优势:
训练集数据量很小的情况;因为判别方法没有做任何假设,就是看着训练集来计算,训练集数量越来越大的时候,error会越小。而生成方法会自己脑补,受到数据量的影响比较小。 对于噪声数据有更好的鲁棒性(robust)。 先验和类相关的概率可以从不同的来源估计。比如语音识别,可能直观会认为现在的语音识别大都使用神经网络来进行处理,是判别方法,但事实上整个语音识别是 Generative 的方法,DNN只是其中的一块而已;因为还是需要算一个先验概率,就是某句话被说出来的概率,而估计某句话被说出来的概率不需要声音数据,只需要爬很多的句子,就能计算某句话出现的几率。
3.其他自己补充(康康就好)
关于生成模型和判别模型的网上资料: