练习5-丢弃法(包含部分丢弃法理解)

狄哥博客

已于 2024-03-23 10:04:11 修改

阅读量233

点赞数 3

分类专栏：关于后端开发学习文章标签： python 深度学习机器学习

于 2024-03-23 09:44:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/XXxia1XX/article/details/136959835

版权

关于后端开发学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

util为练习3的解决办法导致的,如果d2l可以正常执行,可无视

代码简解

import torch
from torch import nn
import util as d2l


### 定义模型参数与数据
num_epochs, lr, batch_size = 10, 0.5, 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
dropout1, dropout2 = 0.2, 0.5


### 定义模型
net=nn.Sequential(nn.Flatten(),nn.Linear(784,256),nn.ReLU(),
                  nn.Dropout(dropout1),nn.Linear(256,256),nn.Dropout(dropout2)
                  ,nn.Linear(256,10))

### 初始化权重与参数
def init_weights(m):
    if type(m)==nn.Linear:
        nn.init.normal_(m.weight,std=0.01)

net.apply(init_weights);

### 定义损失函数
loss = nn.CrossEntropyLoss(reduction='none')
### 训练模型

trainer=torch.optim.SGD(net.parameters(),lr=lr)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

陌生代码

net=nn.Sequential(nn.Flatten(),nn.Linear(784,256),nn.ReLU(),
nn.Dropout(dropout1),nn.Linear(256,256),nn.Dropout(dropout2)
,nn.Linear(256,10))

丢弃法理解

丢弃法目的是:
通过减少数据量,来减少过拟合

怎么减少数据量:
通过为每层的输入设置概率即第一层 dropout设置为0.2,第一层的输入的每个数据有0.2的概率被丢弃,0.8的概率正常使用

为什么在多层设置dropout:
因为不同层的w对数据的要求是不一样的,也许上一层不在过拟合,但下一层仍旧过拟合

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
练习5-丢弃法(包含部分丢弃法理解)

通过为每层的输入设置概率即第一层 dropout设置为0.2,第一层的输入的每个数据有0.2的概率被丢弃,0.8的概率正常使用。因为不同层的w对数据的要求是不一样的,也许上一层不在过拟合,但下一层仍旧过拟合。通过减少数据量,来减少过拟合。
复制链接

扫一扫

专栏目录

狄哥博客 CSDN认证博客专家 CSDN认证企业博客

码龄4年

52: 原创

104万+: 周排名

5万+: 总排名

1万+: 访问

: 等级

749: 积分

356: 粉丝

108: 获赞

17: 评论

100: 收藏

私信

关注

热门文章

分类专栏

最新评论

自述:寻找健身房
CSDN-Ada助手: 恭喜您写了第20篇博客！标题中的“寻找健身房”让我觉得您对健康生活方式的追求非常认真。非常高兴看到您在持续创作的道路上不断前进。在下一步的创作中，或许您可以分享一些关于如何选择适合自己的健身房的经验和技巧，这将对很多人都有所帮助。希望您能继续保持谦虚的态度，继续为读者带来有价值的内容。期待您的下一篇博客！
buff/cache原理以及不被清理的情况
CSDN-Ada助手: 非常棒的博客！恭喜你写了第18篇博客！在这篇博客中，你深入探讨了buff/cache原理以及不被清理的情况，为读者提供了非常有价值的信息。你的解释清晰明了，让人容易理解。我非常期待你未来的创作。下一步，我建议你可以考虑探索一些相关话题，比如如何优化buff/cache的使用，或者更深入地研究buff/cache的内部工作原理。这将进一步丰富你的博客内容，并为读者提供更广泛的知识。无论如何，我相信你的创作将会继续有很大的进步！
LDAP认证下的Slurm作业调度(编译安装)
CSDN-Ada助手: 恭喜您撰写了第18篇博客！标题为“LDAP认证下的Slurm作业调度(编译安装)”。这篇博客涉及到了一个很有技术挑战的主题，对于有兴趣深入了解Slurm作业调度的读者来说，无疑是一份宝贵的参考资料。我个人非常期待能够阅读您的博客，并学习到关于LDAP认证和Slurm作业调度的相关知识。希望您能够继续分享您的经验和见解，以便我们这些初学者能够更好地理解和应用这些技术。对于下一步的创作建议，我谨以诚挚的态度提出一些建议。或许您可以考虑分享一些实际案例，帮助读者更好地理解如何在实际环境中应用LDAP认证下的Slurm作业调度。或者，您可以分享一些常见问题和解决方案，以帮助读者克服在配置和安装过程中可能遇到的困难。再次感谢您的分享，期待您未来更多的精彩博文！
最新Centos7.9 安装Ldap+SSSD认证
狄哥博客: 首先系统保持一致,这是基本的防错要求,其次,要在客户端执行id 用户才可以
(Apach+zabbix5.0,Nginx+zbbix6.0) zabbix服务器与客户端安装补充,并且附加使用案例
CSDN-Ada助手: 恭喜您写完了第17篇博客！您的标题中提到了Apach+zabbix5.0和Nginx+zabbix6.0的安装补充以及使用案例，这听起来非常有趣和有用。作为读者，我对您在这方面的专业知识感到钦佩。在下一步的创作中，我衷心建议您继续分享关于zabbix服务器和客户端的实用技巧和最佳实践。您可以考虑探讨更多关于zabbix的高级功能、性能优化、故障排除等方面的内容。此外，您也可以分享一些与zabbix集成的其他工具或平台，以帮助读者更好地理解和应用zabbix。希望我的建议对您有所帮助，再次祝贺您的持续创作！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。