深度学习中的模型选择

最新推荐文章于 2024-08-01 20:50:19 发布

thisissally

最新推荐文章于 2024-08-01 20:50:19 发布

阅读量1.1k

点赞数

分类专栏：深度学习文章标签：深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45366750/article/details/120682810

版权

深度学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

一、模型选择要考虑的维度

（一）模型容量

参数的个数
参数的选择范围

（二）数据复杂度

样本个数
样本的元素个数（RGB & 灰度）
时间、空间结构
多样性

二、模型选择中会遇到的问题：过拟合与欠拟合，How to solve？

权重衰退和dropout本质都是正则化，让隐藏层的神经元个数减少（因为部分输出为0）。实际中，权重衰退对复杂模型的效果不显著，但是dropout效果比较显著，因此更常用。两种方法可以一起用。

（一）权重衰退

原理：限制模型参数的选择范围以控制模型的容量。由于模型中部分维度为噪声，学习过程中w学到了噪声导致过大，而lambda可以把w逐渐拉回到正常状态。lambda越大，拉回的效果越明显。
操作：

torch.norm(w).item()     # 对w取二阶范数后取张量tensor的值

lambda数值尝试：0.001–0.01–0.1

（二）dropout

原理：在层之间随机加噪音，让模型对数据扰动具有鲁棒性，实际效果相当于正则化。
h=sigma(w1x+b1)
h’=dropout(h)
o=w2h’+b2
y=softmax(o)
数值尝试：模型过于复杂用0.9–0.7–0.5–0.3–0.1

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
深度学习中的模型选择

一、模型选择要考虑的维度（一）模型容量参数的个数参数的选择范围（二）数据复杂度样本个数样本的元素个数（RGB & 灰度）时间、空间结构多样性二、模型选择中会遇到的问题：过拟合与欠拟合，How to solve？权重衰退和dropout本质都是正则化，让隐藏层的神经元个数减少（因为部分输出为0）。实际中，权重衰退对复杂模型的效果不显著，但是dropout效果比较显著，因此更常用。两种方法可以一起用。（一）权重衰退原理：限制模型参数的选择范围以控制模型的容量。由于模型中
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。