（李沐DL）数值优化

乐闻w

于 2023-04-18 20:14:19 发布

阅读量87

点赞数 1

文章标签：深度学习机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45675231/article/details/130230135

版权

神经网络的梯度
梯度 --》求偏导
向量对于向量的导数都是矩阵
梯度爆炸：梯度都是比一大的数
对于学习率敏感
学习率太大大参数值更多的梯度
如果学习率太小-》训练无进展

梯度消失：梯度小于一时
梯度值变成0 对于16为浮点数尤为严重
训练没有进展，不管如何选择学习率
对于底部尤为严重仅仅顶部训练的较好
无法让神经网络更深
数值过大或者过小都会导致数值问题
会对n个数累乘

sigmoid
relu = max（x，0）

让训练更加稳定
目标是让梯度值在合理的范围内【1e-6，1e3】
将乘法变加法
归一化，梯度裁剪
合理的权重初始和激活函数

权重初始化，在合理值区间里随机初始参数
#xavier 是常用权重的初始化方法
#kaiming初始化也是一个初始化方法
初始化对后面影响也不是很大

选取激活函数提升数值稳定性
准确率在50%左右权重参数有大问题不是单单能调整lr能解决的
nan一般是梯度爆炸

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
（李沐DL）数值优化

准确率在50%左右权重参数有大问题不是单单能调整lr能解决的。目标是让梯度值在合理的范围内【1e-6，1e3】#kaiming初始化也是一个初始化方法。梯度值变成0 对于16为浮点数尤为严重。权重初始化，在合理值区间里随机初始参数。#xavier 是常用权重的初始化方法。对于底部尤为严重仅仅顶部训练的较好。学习率太大大参数值更多的梯度。数值过大或者过小都会导致数值问题。梯度爆炸：梯度都是比一大的数。向量对于向量的导数都是矩阵。合理的权重初始和激活函数。梯度消失：梯度小于一时。nan一般是梯度爆炸。
复制链接

扫一扫

乐闻w CSDN认证博客专家 CSDN认证企业博客

码龄5年

23: 原创

119万+: 周排名

35万+: 总排名

8638: 访问

: 等级

267: 积分

28: 粉丝

26: 获赞

5: 评论

50: 收藏

私信

关注

热门文章

分类专栏

pytorch 12篇
算法导论 1篇
linux 2篇
python 2篇

最新评论

GAN笔记
CSDN-Ada助手: 非常棒的博客！感谢您与我们分享您的知识和经验。我们鼓励您继续探索深度学习的世界，并希望您可以分享更多关于GAN的技术知识和实践。我们建议您撰写一篇“使用GAN生成逼真图片”的博文，这将有助于那些想要学习GAN的初学者们。期待您的下一篇博客！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
python装饰器与闭包---装饰器
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。