TensorFlow 梯度下降算法

最新推荐文章于 2024-01-09 17:02:36 发布

Jerry_wo

最新推荐文章于 2024-01-09 17:02:36 发布

阅读量430

点赞数

文章标签：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Jerry_wo/article/details/108449567

版权

训练神经网络时，参数的初始值会很大程度影响最后得到的结果，只有当损失函数为凸函数时，梯度下降算法才能保证达到全局最优解。

优化点

参数初始值对结果影响很大，随机初始化

bacth梯度下降

设置学习率：太大参数容易摇摆，太小大大降低优化速度；
在这里插入图片描述

正则化

L1正则、L2正则、也可以同时使用。，刻画模型复杂度，表示所有参数，包括权重和偏置。一般来说模型复杂度只有权重决定。
TensorFlow中有两种方式来写，第一种如下，这样的方式可能导致损失函数loss的定义很长，可读性差易出错。TensorFlow提供了集合来解决这个问题。
在这里插入图片描述

滑动平均模型

在采用随机梯度下降法训练模型时，使用滑动平均模型在很多应用中都可以一定程度提高最终模型在测试数据上的表现。滑动平均值，是对参数的更新做一个改进。
在这里插入图片描述

总结

神经网络的结构(隐层、激活函数)对最终模型有本质性的影响；第二重要的是正则化损失函数；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
TensorFlow 梯度下降算法

训练神经网络时，参数的初始值会很大程度影响最后得到的结果，只有当损失函数为凸函数时，梯度下降算法才能保证达到全局最优解。优化点参数初始值对结果影响很大，随机初始化bacth梯度下降设置学习率：太大参数容易摇摆，太小大大降低优化速度；正则化L1正则、L2正则、也可以同时使用。，刻画模型复杂度，表示所有参数，包括权重和偏置。一般来说模型复杂度只有权重决定。TensorFlow中有两种方式来写，第一种如下，这样的方式可能导致损失函数loss的定义很长，可读性差易出错。TensorFlow提供了集合
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。