DW李宏毅机器学习笔记—Task05（四）—略看分类问题

最新推荐文章于 2024-07-19 16:33:18 发布

Dr'Dony

最新推荐文章于 2024-07-19 16:33:18 发布

阅读量140

点赞数

分类专栏：李宏毅机器学习文章标签：机器学习神经网络深度学习

本文链接：https://blog.csdn.net/m0_54546745/article/details/119983561

版权

李宏毅机器学习专栏收录该内容

12 篇文章 6 订阅

订阅专栏

文章目录

前言
分类是怎么做的
- 将分类转化为回归
- Softmax登场
分类问题的Loss
- 使用Cross-entropy的优点
总结

前言

这是我在Datawhale组队学习李宏毅机器学习的记录，既作为我学习过程中的一些记录，也供同好们一起交流研究，之后还会继续更新相关内容的博客。

分类是怎么做的

将分类转化为回归

在这里插入图片描述
回归就是输入一组数据，输出一个数。
分类的话就是输入一组数据，输出一个类别。
而将回归转化成分类的话是通过输出的数字来判别类别。

通过回归来分类，这要求神经网络输出是一个向量。这个向量中的每一个元素代表着对应类别的可能性。

Softmax登场

在这里插入图片描述
$R e g r e s s i o n 与 C l a s s i f i c a t i o n$ 在前半部分都是相同的，都是输入乘上权重加上偏移，再激活一下，然后连接起来，得到其中有各种值的向量 $y$ 。

但 $R e g r e s s i o n$ 在最后有个 $S o f t m a x$ 函数，将之前输出的向量 $y$ 转换成一个元素值都在0和1之间的向量 $y^{'}$ ，这样就可以转换成类别。

那 $S o f t m a x$ 函数具体又是怎么样的呢？
在这里插入图片描述
首先， $s o f t m a x$ 的输入不再叫 $i n p u t$ ，而是 $l o g i t$ ，然后经过上图的计算，转化成 $y'_i$ 。

这里的都是多分类问题，而二分类问题怎么样呢？二分类问题我们一般不用 $S o f t m a x$ 函数，而一般用 $s i g m o i d$ 函数。不过用 $S o f t m a x$ 函数和 $S i g m o i d$ 函数都一样，没什么区别。

分类问题的Loss

在这里插入图片描述
计算Loss第一种的方法就是之前提到的MSE，求均方差。
第二种方法就是求交叉熵。计算式在上图右下角，交叉熵在分类问题中被广泛应用，甚至在pytorch中Cross-entropy是和softmax绑定的，在前者函数中内建了softmax函数，在使用Gross-entropy时，softmax会被加到神经网络的最后一层。
注意：最小化交叉熵与极大似然式等价的。

使用Cross-entropy的优点

在这里插入图片描述
上图是将 $y_i$ 赋予不同的取值区间，经过softmax后分别使用MSE和Cross-entropy形成的Error Surface。左上角的红色区域表示Large Loss，右下角的蓝色区域表示Small Loss。

我们可以看到MSE形成的Surface，先是在起点处就是一大片几乎平坦的Large Loss，这会直接导致stuck，相较之下，Cross-entropy的起点处是梯度比较大的，更方便训练。

而且这也表明Loss Function的不同也会影响最优化的难度和最终训练的效果。

总结

本节主要讲授了分类问题是怎么去做，怎么去优化的，出现了Softmax和Cross-entropy，解释了使用的原因和优点。

Dr'Dony

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
DW李宏毅机器学习笔记—Task05（四）—略看分类问题

文章目录前言分类是怎么做的将分类转化为回归Softmax登场分类问题的Loss使用Cross-entropy的优点总结前言这是我在Datawhale组队学习李宏毅机器学习的记录，既作为我学习过程中的一些记录，也供同好们一起交流研究，之后还会继续更新相关内容的博客。分类是怎么做的将分类转化为回归回归就是输入一组数据，输出一个数。分类的话就是输入一组数据，输出一个类别。而将回归转化成分类的话是通过输出的数字来判别类别。通过回归来分类，这要求神经网络输出是一个向量。这个向量中的每一个元素代
复制链接

扫一扫