【李宏毅机器学习笔记】02_Classification

最新推荐文章于 2022-10-02 23:32:53 发布

子因你太美

最新推荐文章于 2022-10-02 23:32:53 发布

阅读量903

点赞数

文章标签：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45268337/article/details/124001737

版权

Classification

regression方法不太使用于classification，因为regression希望output值接近于1或-1，因此也会惩罚那些比较大的值，会导致决策面偏离最佳的classification boundary。

Naive Bayes(Generative)

我们可以用下面的决策函数和损失函数来实现classification

在这里插入图片描述

Maximum Likelihood

计算出高斯分布的mean和covariance

在这里插入图片描述

为了减少参数，防止出现过拟合，当我们考虑一个二分类模型时，这两个高斯分布的Σ是共用的

在这里插入图片描述

当共用同样的Σ时，可以称为linear model，用不同的Σ时，则是nonlinear model。

基本步骤

在这里插入图片描述

在这里插入图片描述

通过数学推导可以知道，我们需要找的model是一个线性的model（当Σ取同样的值时）

在这里插入图片描述

直觉是，我们可以直接忽略上面的概率分布参数，直接计算w和b，因此提出了Logistics Regression

Logistics Regression(Discriminative)

Step 1：Function Set

sigmoid方程输出的值就是概率，介于0到1之间

在这里插入图片描述

线性regression的输出是z，因此输出值可能是任意值

Step2：Goodness of a Function

极大似然估计的计算方法，首先取对数，简化计算，然后将其改为分段函数的形式，根据data的label分段，实际上就是两个伯努利分布的交叉熵，这样当training data是class1或class2时，其中一项都会变为0，也就是变成其中一个class的交叉熵

在这里插入图片描述

Step3：Find the best function

在这里插入图片描述

最终的logistics regression的梯度下降参数更新方程与linear regression 一样

在这里插入图片描述

损失函数的选择

对于线性回归来说，Square error是很正确的；但对logistics regression来说，是不合适的，会出现不管在那个点上微分值都很小，因此梯度下降时移动速度非常慢，因此也无法判断自己是距离目标很近还是很远，

生成模型和判别模型的优劣

Multi-class Classification

softmax：对最大值做强化

在这里插入图片描述

limitation of logistics regression

Feature Transformation：使用特征转换将无法在特征空间中区分的数据转换到另一个可以区分的空间

logistics regression的链接可以构成neural network

子因你太美

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【李宏毅机器学习笔记】02_Classification

Classificationregression方法不太使用于classification，因为regression希望output值接近于1或-1，因此也会惩罚那些比较大的值，会导致决策面偏离最佳的classification boundary。Naive Bayes(Generative)我们可以用下面的决策函数和损失函数来实现classificationMaximum Likelihood计算出高斯分布的mean和covariance为了减少参数，防止出现过拟合，当我们考虑一个二分类模
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。