【李宏毅2022机器学习】笔记二:Classification分类器(Gaussian,Maximum Likelihood)

4 Classification

首先分类问题还是属于机器学习模型,只不过输出不是连续的值,而是分类结果。我们用的同样是三步:选择function set→计算误差→选择模型。
在这里插入图片描述
假定有两类,我们要使用Regression的方法计算输出,设置一个值作为分类的标准。
不在计算误差距离,而是用分类不正确的次数作为误差。
并且因为误差次数是不可微分,所以我们要用别的方法优化(不能使用梯度下降)。

4.1 function set

第一步是可以对训练数据进行分类的模型。我们在概率论学到过,一个物品,我们计算它分为class1的概率,以及它分为class2的概率,…,显然概率更大的就是最后最可能的答案,即该类为预测结果。


简单了解一下概率模型

在这里插入图片描述
假设x表示抽出的球是蓝色
x|c1:从c1里面抽出的球是蓝色
c1|x:已知抽出了一个蓝色的球,这个球是从c1里面抽出来的概率
P(c1|x):数据类别被判定为类型c1的概率
所以我们只需要从训练数据中得出框框中的四个值,就可以分类一个x。【贝叶斯公式】
当我偶们能计算出每一个x出现的机率P(x),我们就可以知道他们的distribution,进而用这个分布预测新的x。【全概率公式】


运用到宝可梦分类的案例中
在这里插入图片描述
假设我们现在有一堆训练数据(特征是个二维向量),他们分为两类——79个是water+61个Normal。
画出分布图,我们发现water类的数据类似高斯分布(聚集在了一块)。于是就想用高斯分布的函数来作为我们模型分类的function。【当然可以不用高斯分布用别的】


高斯分布

在这里插入图片描述
高斯分布可以当作由参数均值μ【miu】和协方差Σ【sigma】决定的function。

于是乎,我们只要能通过训练数据找到属于water类的这个高斯分布的两个参数,我们就能预测一个新数据属于这个类的概率。


怎么计算高斯分布的参数?——最大似然估计

在这里插入图片描述
给我们两个参数,用最大似然估计计算这个高斯分布能产生这79个点的概率
这个函数L不是损失函数,是联合概率密度(这79个点是独立sample出来的)
在这里插入图片描述
当然我们可以对L做微分来求极值,但是没必要,因为这两个参数表示均值和协方差,所以就用公式直接算


现在我们计算出两个类的高斯分布参数
在这里插入图片描述


现在将模型运用到对测试数据的预测
在这里插入图片描述
进行测试的结果
在这里插入图片描述
坐标轴代表特征值,点是训练数据,蓝色是类别为C1,红色为C2
等高线为预测区域,越红表示预测为C1的概率越大
最后实验结果不太好——47%正确率,可能是因为特征数据太少


我们之前给两个类别的高斯模型都设置了不同μ和Σ
但是比较常见的作法是,不同的Gaussian可以用同一个协方差,因为它是跟feature size成平方正比,在哦数据量非常大的时候,增长是非常快的,参数量大,容易过拟合。
所以我们为了有效减少参数,我们可以给描述这两个class的feature分布的Gaussian强迫他们共用covariance matrix。这样就只需要较少的parameter。
在这里插入图片描述
就是把按之前算式分别算出来的Σ加权平均,得到共用的Σ

经过测试发现,共用Σ的模型跟像一个直线分类器
在这里插入图片描述


之前的做法是取了一个数据多个特征的高斯分布。
我们假设每个特征是相互独立的,当然我们也可以使用每一个特征单独算一维高斯分布。 这种方法也可以称为朴素贝叶斯分布。

在这里插入图片描述


4.2 后验概率的计算推导

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
从这就可以看出为什么我们的分类器结果像一个直线。

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值