【DataWhale-李宏毅深度学习】Task05网络设计的技巧

最新推荐文章于 2024-09-20 22:08:40 发布

LucyFang2020

最新推荐文章于 2024-09-20 22:08:40 发布

阅读量291

点赞数

分类专栏：学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LucyLuo2020/article/details/118916216

版权

学习专栏收录该内容

18 篇文章 0 订阅

订阅专栏

参考链接：https://datawhalechina.github.io/leeml-notes
视频连接：https://www.bilibili.com/video/BV11K4y1S7AD?t=15

文章目录

一、梯度下降法的局限

局部最小值saddle point和鞍点local minima
优化（Optimization）损失函数失败的原因主要有2种：
1.局部最小值 (local minima)，无路可走。
2.鞍点 (saddle point)，还可以继续梯度下降。

在这里插入图片描述
最好先知道损失函数的形状，才能更好的解决上面的问题。

二、分批（Batch）和动力（Momentum）

2.1 Batch

分批处理(Batch)，也称为批处理脚本，是对某对象进行批量的处理，可以减少运算时间。
在这里插入图片描述

分批处理可以减少运行时间，快速达到目标。
在这里插入图片描述

在这里插入图片描述
每次分批训练有时优于一整批次训练，因为它可以快速找到目标。

四、分类

分类问题是得到一个一个的值，跟回归问题不一样。
在这里插入图片描述

在这里插入图片描述
通常会把数据进行归一化处理后再分类。

五、分批标准化

在这里插入图片描述

分批次训练模型时，若某批次数据很小，乘以一个大底系数，变化量也是很小的，若某批次数据很大，即使乘以一个非常小的参数，数据变化也是很大的，那么在一起训练时不好处理，所以先将数据标准化，那么数据就没有什么差异。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。