深度学习第三次课-梯度下降与反向传播

最新推荐文章于 2024-05-16 21:49:48 发布

约定写代码

最新推荐文章于 2024-05-16 21:49:48 发布

阅读量5.7k

点赞数

分类专栏：深度学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/flying_all/article/details/51559213

版权

深度学习笔记专栏收录该内容

14 篇文章 0 订阅

订阅专栏

梯度下降

损失函数可视化

得分函数 f=W*X

损失函数 c=W*X-y

目标损失函数最小最优化过程

可视化

一维

二维热力图

如果损失函数是一个凸函数，例如SVM。

凸函数正系数加和=凸函数

神经网络 costfunction 非凸因为系数有正有负。

凸优化与最优化

神经网络最优化方法是梯度下降。梯度下降策略有：

1 随机搜索。随机生成一组权重，与之前的loss相比，小了，就是更更好的权重。

2 随机局部搜索。在现有权重的周围随机生成一组权重。选择最优权重。

3 顺着梯度下滑。梯度方向是函数增长最快的方向。随意顺梯度下降，就是最快能到达最小值的方式。梯度下降是初始值敏感的，不同的初始值可能到达的最小值点不同。一般使用高斯分布的随机小值。

梯度下降

梯度下降有两种解决。数值梯度和解析梯度。

数值梯度是按照导数公式 f(x0)' = (f(x0+h) - f(x0))/h ,h是一个非常小的数。数值梯度解法简单，但是计算和参数呈线性关系，计算量大。

解析法：速度快，但是容易出错。利用f(x)导函数 f(x)' 计算梯度。

梯度下降的实现过程中有批处理、随机梯度、min-batch梯度下降。

梯度下降要理解梯度方向需要弄明白梯度方向三垂线几个概念。我记录一点杂乱的东西在这里。

梯度：函数增长最快的方向。

梯度方向是等值曲线的法向量。是函数在某一点的变化率和变化方向。在一维函数的时候，梯度方向和

反向传播

反向转播是一个求偏导的过程。

链式法则

把 f(x,y,z)=(x+y)*z 在给定一个具体值的时候画一个网络结构图试试吧。前向计算每一步的得分。向后计算每一步的导数。

Sigmoid例子和公式推导

这个公式推导真心没推导出来。继续加油。

约定写代码

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

约定写代码 CSDN认证博客专家 CSDN认证企业博客

码龄17年

281: 原创

3万+: 周排名

109万+: 总排名

33万+: 访问

: 等级

5064: 积分

147: 粉丝

160: 获赞

47: 评论

774: 收藏

私信

关注

热门文章

分类专栏

最新评论

总和最大区间问题
aganim: 这种情况的特点是：（1）大的整数集中在原始序列中间位置左右附近，（2）[p1,q1],[p2,q2]区间至少隔着4个数，即：p2-q1>4
总和最大区间问题
aganim: 这个例子，[8, -10, 7, 8, -9, 9]使用分治法，[p1,q1]为[0,0],[p2,q2]为[5,5],若使用上面三个候选区间，则最终结果为[5,5],但正确的结果为[2,3].
总和最大区间问题
aganim: 你这个文章参照了吴军写的计算之魂一书，坦率的讲，这本书中讲的分治法是错的，当p1,q1 与p2,q2两个区间存在间隔时，最大和侯选区间不止[p1,q1]，[p2,q2],[p1,q2]三个。自己可以用随机数试一试你这个是参照
知识图谱中三元组抽取
AlexisZhong: 请问这是哪个算法课程？可以提供链接吗？
用递归树求解递归算法时间复杂度
2301_76853147: 快速排序递归树最短路径怎么求

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。