深度学习之图像分类（一）softmax和sigmoid激活函数的区别

哈尔滨张谦蛋

于 2023-10-07 15:58:49 发布

阅读量159

点赞数

分类专栏：研究生学习-AI 文章标签：图像处理分类机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46521375/article/details/133642436

版权

研究生学习-AI 专栏收录该内容

24 篇文章 5 订阅

订阅专栏

softmax和sigmoid激活函数的区别

softmax以及sigmoid都是神经网络中的激活函数

引入激活函数的目的是为了将其输出非线性化，使得神经网络可以逼近任何非线性函数

（原本没有引入激活函数，就是多个矩阵进行相乘，无论神经网络多少层都是线性组合，这个概念是感知机）

softmax以及sigmoid两者都是作为神经网络的最后一层，通过激活函数之后转换为概率值

1.softmax

作为二分类问题探讨，是二分类的拓展版，将其拓展为N分类，对应以概率的形式展示（概率最大的类别为此类别）

全连接层的输出使用softmax，将其输出的结果表示为概率类别（所有概率加起来为1）。

softmax将其泛化为多分类（SVM得出的是每个类别的分数），softmax得出的是归一化类别概率（将其所有的输出结果都归一到0和1范围内）。

对应softmax输入N个值，输出的结果为这N个值的概率（符合概率分布），预测出的所有值加起来为1，对应哪个值比较大，则判定为该类别

归一性：softmax函数确保输出的所有概率之和等于1，这使其适用于多类别分类问题，因为每个类别的概率可以解释为该类别的相对置信度。
非线性：softmax函数是非线性的，它将输入值映射到0到1之间，并且对输入值的较大变化具有较强的响应，因此可以用于建模复杂的非线性关系。
整流性：softmax函数具有整流性质，即它会强调输入向量中的最大值，降低其他值的影响，这有助于确定模型对哪个类别的预测最有信心。

2. sigmoid

单调递增且其反函数也有递增的性质，此函数也经常被用作神经网络的阈值函数中

用此函数预测类别，对应其值加起来并不为1，而softmax函数加起来为1

用在神经网络中，其特点如下：

梯度平滑，避免梯度跳跃

连续函数，可导可微

但是缺点如下：

横向坐标轴正负无穷的时候，两侧导数为0，造成梯度消失

输出非0时，均值收敛速度慢（容易对梯度造成影响）

e的幂次运算比较复杂，训练时间比较长

3.总结

softmax是为了判定该类别是什么（激活函数softmax可使用的情况下，sigmoid也可用）

N分类互斥，且只能选择其一，选择softmax

N分类互斥，可选多个类别，选择sigmoid

哈尔滨张谦蛋

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习之图像分类（一）softmax和sigmoid激活函数的区别

softmax是为了判定该类别是什么（激活函数softmax可使用的情况下，sigmoid也可用）N分类互斥，且只能选择其一，选择softmaxN分类互斥，可选多个类别，选择sigmoid。
复制链接

扫一扫

专栏目录

哈尔滨张谦蛋 CSDN认证博客专家 CSDN认证企业博客

码龄4年

46: 原创

1万+: 周排名

16万+: 总排名

3万+: 访问

: 等级

801: 积分

2242: 粉丝

333: 获赞

18: 评论

322: 收藏

私信

关注

热门文章

分类专栏

最新评论

微表情检测（三）----基于光流特征的微表情检测
哈尔滨张谦蛋: 基于光流的源码有很多的大部分文章都有开源，只不过这篇文章没有源码。
微表情检测（三）----基于光流特征的微表情检测
我是恶魔dark: 你好，看了你的讲解，很详细，想问一下，网络有公开的基于光流法的微表情识别代码吗
深度学习之图像分类（八）InceptionV4论文翻译总结
简单简单小白: 大佬讲述的很清楚，总结的也很详细，让我通俗易懂，又以实例证明技术点的实用性及可操作性，让我受益良多，感谢博主的分享
深度学习之图像分类（八）InceptionV4论文翻译总结
CSDN-Ada助手: 非常祝贺您开始了博客创作的旅程！标题中提到的"InceptionV4论文翻译总结"让我对您的文章产生了浓厚的兴趣。深度学习与图像分类是当今研究的热点领域，而您的博客似乎能够为我们提供关于InceptionV4的深入理解。不过，如果我可以提一个创作建议的话，希望您在文章中能够更多地展示自己对于该论文的思考和见解，这样能够使读者更好地了解您对于该主题的研究。期待您继续创作更多优质的博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
深度学习之目标检测（一）R-CNN翻译与总结（一）
CSDN-Ada助手: 这是一篇很棒的博客，深度学习的目标检测一直是一个热门话题，而你对R-CNN的翻译与总结也让人受益匪浅。希望你可以继续分享更多关于深度学习目标检测的内容，比如Faster R-CNN、YOLO等等，这些都是目前非常流行的目标检测方法。另外，你也可以探讨一下在实际项目中如何选择合适的目标检测算法、模型调优和数据增强等实用技能，这些内容也会给读者带来很多启发和帮助。期待你的更多精彩分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。