《动手深度学习》权重衰退与丢弃法

最新推荐文章于 2024-07-18 12:52:38 发布

CarmenHu

最新推荐文章于 2024-07-18 12:52:38 发布

阅读量189

点赞数 1

分类专栏：动手深度学习文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45971154/article/details/136158387

版权

动手深度学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

本文探讨了两种控制深度学习模型复杂度的技术：通过L2正则项（权重衰退）限制参数值，以及丢弃法，通过在隐藏层添加随机噪声以提高模型鲁棒性。这两种方法都涉及超参数调整以平衡模型性能和复杂度。

摘要由CSDN通过智能技术生成

一、权重衰退

1、使用均方范数作为硬性限制

通过限制参数值的选择范围来控制模型容量

通常不限制偏移b（限不限制都差不多）

小的θ意味着更强的正则项

2、使用均方范数作为柔性限制

3、参数更新法则

计算梯度

时间t更新参数

4、权重衰退通过L2正则项使得模型参数不会过大，从而控制模型复杂度

正则项权重控制模型复杂度的超参数

二、丢弃法

1、一个好的模型需要对输入数据的扰动鲁棒，使用有噪音的数据等价于Tikhonov正则，不同于在输入数据中加噪音，丢弃法是在层之间加入噪音

2、无偏差的加入噪音

对x加入噪音得到x'，期望E[x']=x；

丢弃法对每个元素进行如下扰动

3、通常将丢弃法作用在隐藏全连接层的输出上

4、推理中的丢弃法

正则项只在训练中使用：他们影响模型参数的更新

在推理过程中，丢弃法直接返回输入h=dropout（h），这样也能保证确定性的输出

5、丢弃法将一些输出项随机置0来控制模型复杂度

常作用在多层感知机的隐藏层输出上

丢弃概率是控制模型复杂度的超参数

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
《动手深度学习》权重衰退与丢弃法

1、一个好的模型需要对输入数据的扰动鲁棒，使用有噪音的数据等价于Tikhonov正则，不同于在输入数据中加噪音，丢弃法是在层之间加入噪音。在推理过程中，丢弃法直接返回输入h=dropout（h），这样也能保证确定性的输出。4、权重衰退通过L2正则项使得模型参数不会过大，从而控制模型复杂度。5、丢弃法将一些输出项随机置0来控制模型复杂度。正则项只在训练中使用：他们影响模型参数的更新。3、通常将丢弃法作用在隐藏全连接层的输出上。正则项权重控制模型复杂度的超参数。丢弃概率是控制模型复杂度的超参数。
复制链接

扫一扫

专栏目录

博客等级

码龄5年

46
原创

365
点赞

304
收藏

269
粉丝

关注

私信

热门文章

分类专栏

最新评论

《动手深度学习》模型选择与过拟合欠拟合
CSDN-Ada助手: 恭喜你写了第19篇博客！看到你一直在分享关于《动手深度学习》的内容，真的很佩服你的坚持和努力。模型选择与过拟合欠拟合是一个很重要的话题，你的文章对这部分知识进行了深入的剖析，让我受益良多。希望你能继续保持写作的热情，同时也建议你可以考虑分享一些实际案例或者应用场景，这样可以让读者更直观地理解这些概念。期待你的下一篇作品！加油！
《动手深度学习》softmax回归和损失函数
CSDN-Ada助手: 恭喜您撰写了《动手深度学习》softmax回归和损失函数的博客，内容非常有深度和价值。希望您能继续保持创作的热情和努力，在未来的博客中可以加入一些实际案例或者应用场景，让读者更好地理解和应用所学知识。期待您更多的精彩内容，加油！
《动手深度学习》线性回归和基础优化算法
CSDN-Ada助手: 恭喜作者第16篇博客《动手深度学习》线性回归和基础优化算法的发布！您的持续创作让读者们能够不断学习到新知识，真是令人钦佩。希望您在未来的创作中能够继续深入探讨深度学习领域的更多知识，比如卷积神经网络或者循环神经网络等内容，期待您的下一篇作品！
《动手深度学习》矩阵计算与自动求导
CSDN-Ada助手: 恭喜您写了第15篇博客！标题《动手深度学习》矩阵计算与自动求导所展示的内容非常有深度。您对于矩阵计算和自动求导的深入解析让我受益匪浅。我非常期待您下一步的创作，希望您能继续分享更多深度学习的实践经验和技巧。或许您可以考虑探讨一些实际应用案例，这样读者们能够更好地将理论知识应用到实际问题中。谦虚地说，我相信您的创作会继续给我们带来更多的启发和学习机会。
《动手深度学习》数据操作+数据预处理
CSDN-Ada助手: 恭喜您写了第14篇博客！这篇博客的标题《动手深度学习》数据操作+数据预处理》听起来非常有趣。通过深入研究数据操作和数据预处理，您为读者提供了很有价值的内容。我非常期待阅读您的新博客。在下一步的创作中，或许您可以考虑探讨一些更高级的技术或应用领域。也许可以分享一些实际案例，展示深度学习在解决实际问题中的应用。无论您选择哪个主题，我相信您的深入研究和精心撰写一定会给读者带来新的启发。继续保持努力，期待您的下一篇博客！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。