深度学习——softmax函数

最新推荐文章于 2024-03-03 21:33:45 发布

Jokic_Rn

最新推荐文章于 2024-03-03 21:33:45 发布

阅读量229

点赞数 1

分类专栏：机器学习文章标签：深度学习机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44823313/article/details/119670349

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

为什么要用softmax？

交叉熵代价函数和softmax激活函数的配合使用使得权值的梯度十分的简洁

交叉熵代价函数
$-\Sigma y_ilog\hat y_i$
softmax激活函数
$\hat y = f(Z) = \dfrac{e^{Z_t}}{\sum_{i}^{n} e^{Z_i}}$
在这里插入图片描述

我们通过梯度下降法来求出权值更新的方向，当交叉熵和softmax配合使用时，梯度十分简洁。
$\dfrac{dE}{dw_i} = \dfrac{dE}{dZ_i}·\dfrac{dZ_i}{dw_i} = \dfrac{dE}{dZ_i}·X$
$\dfrac{dE}{dZ_i} = \dfrac{d( -\Sigma y_ilog\hat y_i)}{dZ_i}$
由于真实分类中只有一个 $y_i=1$ ,其余都是0，我们关心的只是真实的标签 $y_t = 1$

$\dfrac{dE}{dZ_t} = \dfrac{d( -log\hat y_t)}{dZ_t}$
$\dfrac{d( -log f(Z_t))}{dZ_t}$
$=-\dfrac{1}{f(Z_t)}f'(Z_t)$
$=-\dfrac{1}{f(Z_t)}\dfrac{e^{Z_t}(\Sigma e^{Z_i}-e^{Z_t})}{(\Sigma e^{Z_i})^2}$
$\hat y_t-1$

故对于真实标签的梯度项为 $\dfrac{dE}{dw_t} = (\hat y_t-1)X$

作为一般项的梯度为[>>推导过程] $\dfrac{dE}{dw_i} = (\hat y_i-y_i)X$

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习——softmax函数

为什么要用softmax？交叉熵代价函数和softmax激活函数的配合使用使得权值的梯度十分的简洁交叉熵代价函数E=−Σyilogy^iE = -\Sigma y_ilog\hat y_iE=−Σyilogy^isoftmax激活函数y^=f(Z)=eZtΣeZi\hat y = f(Z) = \dfrac{e^{Z_t}}{\Sigma e^{Z_i}}y^=f(Z)=ΣeZieZt...
复制链接

扫一扫

专栏目录

Jokic_Rn CSDN认证博客专家 CSDN认证企业博客

码龄5年

156: 原创

23万+: 周排名

161万+: 总排名

21万+: 访问

: 等级

2374: 积分

109: 粉丝

157: 获赞

74: 评论

775: 收藏

私信

关注

热门文章

分类专栏

linux 8篇
学习笔记 14篇
C++ 22篇
深度学习 15篇
机器学习 8篇
matlab 1篇
数据结构 10篇
github 1篇
考研复试 16篇
Qt 7篇
目标检测 5篇
Python 5篇
其他 1篇
数据库 1篇

最新评论

Swin Transformer——细节详解
Jokic_Rn: 参考swin v2
Swin Transformer——细节详解
wzt23: 如果无法整除怎么办
BP神经网络实现手写数字识别
m0_70315952: 你好，为什莫我运行之后显示 Traceback (most recent call last): File "C:\Users\86159\Desktop\1.py", line 5, in <module> import matplotlib.pyplot as plt ModuleNotFoundError: No module named 'matplotlib' 我的matplotlib库已经安装了
Pytorch 单机多卡训练DDP
Jokic_Rn: DDP用2张卡，batch设置为4，相当于总batch=2*4,DP模式batch设置为4，总batch就是4
Pytorch 单机多卡训练DDP
m0_61976256: 为什么单卡训练batch设置为2可以跑起来,而采用DDP用2卡batch设置为4反而跑不起来了？直接报显存不足。采用DP模式2卡又可以跑起来了。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。