交叉熵代价函数得到的过程

最新推荐文章于 2020-05-03 23:30:39 发布

一只正在进阶的小小白

最新推荐文章于 2020-05-03 23:30:39 发布

阅读量777

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36231891/article/details/80595756

版权

机器学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

本文中部分内容为书《神经网络与深度学习》中的截取，后面的推导过程为根据自己理解的推导。

二次代价函数由于在误差较大的时候，学习缓慢，这与人类的学习过程是不相同的，人们总是在犯错误较明显的时候，学习迅速。

所以，根据上面的两个式子可以知道，影响学习速率的是σ′(z)，所以想要构造一个与σ′(z)无关的代价函数。

使得其对权重以及偏置求导得到的式子为：

由链式法则，有：

即σ′(z) = σ(z)(1 − σ(z)) = a(1 − a)，将该式子代入上一个式子的右边，代替σ′(z)，得到：

又根据

中的第二个式子，代入上述式子的左边，得到：

根据该式子，对a进行积分，即可得到C的函数

推导过程如下：

∫（a-y）/a(1-a)d a

=∫a/a(1-a) d a-y∫ 1/a(1-a) d a

=∫1/(1-a)d a-y∫1/a(1-a)d a

=ln|1-a|-y∫[1/a+1/(1-a)]d a

=ln|1-a|-y∫1/a d a-y∫1/(1-a) d a

=ln|1-a|-yln|a|-yln|1-a|+c

=-yln|a|+(1-y)ln|1-a|+c

因为0<a<1,所以代价函数就等于-ylna+(1-y)ln(1-a)+c,c为常数，所以，由此就得到了交叉熵代价函数。

一只正在进阶的小小白

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。