cross-entropy函数

最新推荐文章于 2023-11-29 16:41:14 发布

hang__19

最新推荐文章于 2023-11-29 16:41:14 发布

阅读量435

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hang__xiu2016acm/article/details/77936562

版权

机器学习专栏收录该内容

25 篇文章 1 订阅

订阅专栏

我们理想情况是让神经网络学习更快

假设简单模型: 只有一个输入,一个神经元,一个输出

简单模型: 输入为1时, 输出为0

初始 w = 0.6, b = 0.9 初始预测的输出 a = 0.82, 需要学习

学习率: 0.15

演示:

初始: w = 2.0, b = 2.0, 初始预测输出: 0.98, 和理想输出0差点很远
演示:

神经网络的学习行为和人脑差的很多, 开始学习很慢, 后来逐渐增快.

为什么?

学习慢 => 偏导数 ∂C/∂w 和 ∂C/∂b 值小

计算偏导数:

回顾之前学习的Cost函数:

对于一个x, y 和单个神经元:

分别对w和b求偏导数:

x = 1, y = 0

回顾sigmoid函数

当神经元输出接近1时, 曲线很平缓,

=>

很小, 所以学习很慢

如何增快学习?

介绍cross-entropy cost 函数

假设一个稍微复杂一些的神经网络

定义cross-entropy函数:

为什么可以用来做cost函数?

1. 函数值大于等于0 (验证)

2. 当a=y时, cost = 0

用sigmoid函数定义

推出:

代入上面的偏导, 得到:

学习的快慢取决于

也就是输出的error

好处: 错误大时,更新多,学得快. 错误小时,学习慢

对于偏向也类似:

用cross-entropy 演示:

w = 0.6, b = 0.9

w = 2.0, b = 2.0

与之前的二次cost比较

学习率=0.005, 但是不是重点, 主要是速度的变化率, 也就是曲线的形状不同.

以上是对于一个单个神经元的cost, 对于多层:

以上把输出层所有的神经元的值加起来

总结:

cross-entropy cost几乎总是比二次cost函数好

如果神经元的方程是线性的, 用二次cost函数 (不会有学习慢的问题)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
cross-entropy函数

我们理想情况是让神经网络学习更快假设简单模型: 只有一个输入,一个神经元,一个输出简单模型: 输入为1时, 输出为0初始 w = 0.6, b = 0.9 初始预测的输出 a = 0.82, 需要学习学习率: 0.15演示: 初始: w = 2.0, b = 2.0, 初始预测输出: 0
复制链接

扫一扫

专栏目录

hang__19 CSDN认证博客专家 CSDN认证企业博客

码龄8年

236: 原创

13万+: 周排名

165万+: 总排名

28万+: 访问

: 等级

5040: 积分

48: 粉丝

44: 获赞

23: 评论

141: 收藏

私信

关注

热门文章

分类专栏

最新评论

prim算法求最小生成树
代码飞毛腿: 终于找到了将lowst和mit数组讲清楚的了
MyBatis之输入(parameterType)与输出(resultType、resultMap)映射
Deep Learning小舟: 文章很赞，博主辛苦了!
数字三角形问题
小可爱Jamie: 运行通过✅
C语言向文件写入内容并读取显示
033066Yve: 请问Ctrl+Z 组合键表示结束是什么原理呀？还有就是我把输入信息的平均分改成输入字符型的地址后就出现错误了。可以麻烦您解答一下吗？
算术表达式的转换
tara_int: if(cmp(a[i]) < cmp(stack2[top2]))//比较运算优先顺序； { stack3[++top3]= stack2[top2--]; i++; } 前缀函数部分这个i++是什么含义呢怎么工作的？不懂求指教

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。