神经网络反向传播算法的推导

最新推荐文章于 2023-03-15 09:58:40 发布

pku_zzy

最新推荐文章于 2023-03-15 09:58:40 发布

阅读量1.6k

点赞数

分类专栏： Machine Learing

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/PKU_ZZY/article/details/60466793

版权

Machine Learing 专栏收录该内容

45 篇文章 1 订阅

订阅专栏

神经网络反向传播算法的推导

推导如下
这里写图片描述

其中考虑了代价函数 $C=C_1(L2范数),C_2(交叉熵),C_3(考虑权重L1范数的代价)$ 的情形，事实上对任意代价函数算法实现原理都一致，只需要实现算法时候更改调用的代价函数的关于对应 $a$ 的导数即可。

其中激活函数没有具体带入，可以是 $\sigma(x)=sigmoid(x)\ or\ tanh(x)或者再进行一次softmax(z)$ ，事实上对任意激活函数算法实现原理一致，只需要实现算法时候更改调用的激活函数及其导数导数即可。

另外关于交叉熵，再最下面有一个小的说明。

交叉熵可在神经网络(机器学习)中作为损失函数，p表示真实标记的分布，q则为训练后的模型的预测标记分布(注意q为 $s i g m o i d$ 的输出永远不会为0或者1，所以交叉熵一直有意义)，交叉熵损失函数可以衡量p与q的相似性。熵的本质就是香农信息量的期望，至于香农熵，对此定义比较清楚了，而且可以解函数方程解出唯一定义了，根据这个定义可以推出q分布的信息量的数学期望。

交叉熵作为损失函数还有一个好处是使用sigmoid函数在梯度下降时能避免均方误差损失函数学习速率降低的问题，因为学习速率可以被输出的误差所控制。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
神经网络反向传播算法的推导

神经网络反向传播算法的推导
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。