机器学习(十七)——高斯判别分析模型(The Gaussian Discriminant Analysis model)

高斯判别分析(GDA)模型适用于输入特征为连续值的分类问题,利用多元正态分布来建模。模型参数包括均值向量和共用的协方差矩阵。最大似然估计用于求取参数,算法通过拟合训练数据,形成两个类别的高斯分布,并确定决策边界。在边界上,两类别的预测概率相等。
摘要由CSDN通过智能技术生成

原文:http://cs229.stanford.edu/notes/cs229-notes2.pdf

当我们有一个输入特征x是连续值随机变量的分类问题时,我们可以使用高斯判别分析(GDA)模型,该模型p(x|y)使用多元正态分布。这个模式为:


写出它的展开形式,如下所示:


这里,我们的模型的参数是φ,Σ,µ0和µ1。(请注意,当存在两个不同的均值向量µ0和µ1时,通常只使用一个协方差矩阵Σ。)这些数据的对数似然为:


通过对参数进行最大化,我们发现参数的最大似然估计是:


从图片上看,该算法所做的工作如下所示:


图中显示的是训练集,以及两个高斯分布的轮廓,它们适合于这两个类中的每个类中的数据。请注意,这两个高斯分布的轮廓形状和方向是相同的,因为他们共享一个协方差矩阵Σ,但它们的均值分别是µ0和µ1。图中还显示了给出决策边界的直线,在这条直线上,p(y=1|x)=0.5。在边界的一边,我们预测y=1是最有可能的结果,而在另一边,我们预测y=0。

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值