深度学习入门笔记 Day10/15 与学习相关的技巧（二）

最新推荐文章于 2024-09-24 09:49:39 发布

eowyn0406

最新推荐文章于 2024-09-24 09:49:39 发布

阅读量234

点赞数

分类专栏：深度学习入门文章标签：深度学习入门笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/eowyn0406/article/details/90550793

版权

深度学习入门专栏收录该内容

9 篇文章 0 订阅

订阅专栏

一、如何使用Weight Decay权值衰减或者Dropout技术缓解过拟合？

过拟合现象是指在训练集中表现优秀，但是在其他未知的数据集上表现很差的现象。

由于很多过拟合原本就是因为权重参数取值过大才发生的。Weight Decay权值衰减法是通过最小化权值的二范数，使得所有权值都为最小。

如果网络的模型变得很复杂，只用权值衰减就难以应对了。在这种情况下，我们经常会使用 Dropout 方法。Dropout 是一种在学习的过程中随机删除神经元的方法。训练时，随机选出隐藏层的神经元，然后将其删除。被删除的神经元不再进行信号的传递。

二、什么是验证数据？

之前我们使用的数据集分成了训练数据和测试数据，训练数据用于学习，测试数据用于评估泛化能力。由此，就可以评估是否过度拟合了训练数据（是否发生了过拟合），以及泛化能力如何等。

用测试数据确认超参数的值的“好坏”，就会导致超参数的值被调整为只拟合测试数据。

调整超参数时，必须使用超参数专用的确认数据。用于调整超参数的数据，一般称为验证数据（validation data）。我们使用这个验证数据来评估超参数的好坏。

根据不同的数据集，有的会事先分成训练数据、验证数据、测试数据三部分，有的只分成训练数据和测试数据两部分，有的则不进行分割。在这种情况下，用户需要自行进行分割。

三、如何使用验证数据选择好的超参数？

步骤 0

设定超参数的范围。

步骤 1

从设定的超参数范围中随机采样。

步骤 2

使用步骤 1 中采样到的超参数的值进行学习，通过验证数据评估识别精度（但是要将 epoch 设置得很小）。

步骤 3

重复步骤 1 和步骤 2（100 次等），根据它们的识别精度的结果，缩小超参数的范围。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

eowyn0406

CSDN认证博客专家 CSDN认证企业博客

码龄7年

39: 原创

2万+: 周排名

127万+: 总排名

6万+: 访问

: 等级

1005: 积分

22: 粉丝

92: 获赞

42: 评论

224: 收藏

私信

关注

分类专栏

最新评论

Bellman Equation 贝尔曼方程
m0_69388475: 关于bellman方程的起源、背景和稳态的意义，作者参考了哪些资料呀，跪求
如何用四元数表示姿态差
eowyn0406: 是为了推导出Y=WX中的W啊，写成另一种形式就是Y=XW了，想写成哪种形式根据您的需求来就好了。
如何用四元数表示姿态差
eowyn0406: 我觉得可能没有实际的物理意义，就理解为从一个姿态变化到另一个姿态的映射就好了。通过距离四元数，可以将第一个姿态的四元数转换为第二个姿态的四元数。或者，理解为三个角度差的模也行。——理解不一定对，仅供参考。
如何用四元数表示姿态差
找不到服务器zhn: 表示两个坐标系的变换，可以看我的推导https://blog.csdn.net/qq_34288751/article/details/134590957
如何用四元数表示姿态差
找不到服务器zhn: 开头因为所以那段太牵强了，$q_2=q_2(q_1^{-1}q_1)$，为什么不写成 $q_2=(q_1q_1^{-1})q_2$？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。