深度学习Deep Learning学习笔记——网络设计技巧

最新推荐文章于 2022-08-24 15:26:53 发布

心有热烈_藏于俗常

最新推荐文章于 2022-08-24 15:26:53 发布

阅读量223

点赞数

文章标签：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_53554565/article/details/125830258

版权

源视频：https://www.bilibili.com/video/BV11K4y1S7AD?p=5

学习笔记总结

1 当损失函数随着参数更新而没有下降或者误差仍然很大，一般表示一阶偏微分梯度向量等于0。

此时判断方法：

二阶偏微分矩阵H来判断此时是否处于saddle pint；

在原有参数上加上对应的H矩阵负特征值对应的特征向量，从而逃离saddle point 继续寻找降低损失函数值。（计算量较大）

低维下找不到路径优化的损失函数放到高维空间也许很容易找到下降路径。

2 batch size

一次选取纳入训练的样本数，每读取一次batch size 计算一次梯度来更新参数，再读取下一个batch样本接着计算梯度更新参数，依次迭代。

一个epoch 是读取完一次所有batch。

有无并行运算决定了单次运行batch size的计算速度，通常来说越小batch size训练出来的模型效果越好，但计算时间越长，而越大的batch size则计算速度更快。

3 趋势项

类似惯性概念，在传统梯度下降方法中加入趋势项，从而赋予梯度下降法逃逸saddle point 局部最优解的能力。

每一次更新权重时加入上一次参数变化move向量，梯度向量和move向量两者合成出新的参数更新向量。

4 自适应学习率

平方根法则或RMSprop来根据计算的梯度大小来自适应调整学习率，结合预先制定的学习率变化策略和趋势变化项，从而更好完成梯度下降（Adagrad方法则是实现不同参数应用不同学习率）

5 批标准化

对网络输入层和隐藏层输出做归一化处理，让训练速度更快收敛

6 回归转化为多分类

利用softmax激活函数将回归值应用到多分类问题，一般会默认使用交叉熵作为损失函数来更新参数

心有热烈_藏于俗常

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习Deep Learning学习笔记——网络设计技巧

深度学习-网络设计学习笔记
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。