深度学习总结(十一)——early stopping

最新推荐文章于 2024-02-24 11:12:17 发布

VIP文章 manong_wxd

最新推荐文章于 2024-02-24 11:12:17 发布

阅读量2.2w

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/manong_wxd/article/details/78745145

版权

这里写图片描述

这里写图片描述

在训练中，我们希望在中间箭头的位置停止训练。而Early stopping就可以实现该功能，这时获得的模型泛化能力较强，还可以得到一个中等大小的w的弗罗贝尼乌斯范数。其与L2正则化相似，选择参数w范数较小的神经网络。

可以用L2正则化代替early stopping。因为只要训练的时间足够长，多试几个lambda。总可以得到比较好的结果。

Early stopping:
优点：只运行一次梯度下降，我们就可以找出w的较小值，中间值和较大值。而无需尝试L2正则化超级参数lambda的很多值。

缺点：不能独立地处理以上两个问题，使得要考虑的东西变得复杂。举例如下：

最低0.47元/天解锁文章

关注

1
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
深度学习总结(十一)——early stopping

在训练中，我们希望在中间箭头的位置停止训练。而Early stopping就可以实现该功能，这时获得的模型泛化能力较强，还可以得到一个中等大小的w的弗罗贝尼乌斯范数。其与L2正则化相似，选择参数w范数较小的神经网络。可以用L2正则化代替early stopping。因为只要训练的时间足够长，多试几个lambda。总可以得到比较好的结果。Early stopping: 优点：只运行一次梯度下降，我们
复制链接

扫一扫

专栏目录

manong_wxd CSDN认证博客专家 CSDN认证企业博客

码龄9年

34: 原创

73万+: 周排名

151万+: 总排名

38万+: 访问

: 等级

2661: 积分

313: 粉丝

116: 获赞

35: 评论

458: 收藏

私信

关注

热门文章

分类专栏

PyTorch 13篇
CUDA 5篇
python 1篇
深度学习 11篇
机器学习 3篇
论文翻译 1篇

最新评论

PyTorch学习总结(三)——ONNX
AI似懂非懂: 哎，真不是人能看懂的东西
PyTorch学习总结(七)——自动求导机制
鹰立如睡: 这是输入一条数据，如果输入一个batch呢，用哪条数据求梯度？
莫烦PyTorch学习笔记(二)——回归
唯爱……: x的平方
深度学习总结(一)——参数初始化
Deng_zhilin: 您好，我想请教一下为什么初始化参数要用到权重的size来计算分布范围呢? 例如:[code=python] def reset_parameters(self): # 参数随机初始化函数 stdv = 1. / math.sqrt(self.weight.size(1)) self.weight.data.uniform_(-stdv, stdv) # weight在区间(-stdv, stdv)之间均匀分布随机初始化 if self.bias is not None: self.bias.data.uniform_(-stdv, stdv) [/code]
PyTorch学习总结(三)——ONNX
weixin_41157922: 请问onnx支持torch.nn.PixelShuffle吗？谢谢。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。