【备忘】高斯判别分析(GDA)参数手推记录

高斯判别模型是通过最大化贝叶斯模型中的最大后验概率P(X|Y)P(Y)为目标进行训练模型,是一个非常典型的生成模型,假设P(X|Y)服从高斯分布,P(Y)服从伯努利分布,通过训练数据集来确定正态分布与伯努利分布中的各项参数完善模型。对于新的数据集来临时,计算其满足各个已有类别的后验概率,选择概率最高的类别认为新数据的所属类别。

参数的计算使用到了极大似然函数,需要对多维高斯分布表达式、伯努利分布表达式有所了解,需要知道矩阵求导基本公式,对于微积分中的偏导数求解熟练度要求较高。

多维高斯分布表达式:

伯努利分布表达式:P(X)=px + (1-p)(1-x)

求出四个参数后,将其代入高斯分布与伯努利分布表达式即可完成模型训练;之后有新的数据样本时,将其代入P(x|y=1)与P(x|y=0),比较两者的大小即可完成分类,我们把这种通过连续值得到分类类别的分类方式也叫做软输出。

©️2020 CSDN 皮肤主题: 1024 设计师:上身试试 返回首页