多层感知机中用dropout方法优化过拟合

我是真的菜gou

于 2023-10-17 17:16:13 发布

阅读量148

点赞数

分类专栏：动手学习深度学习文章标签：人工智能深度学习 pytorch 回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42424944/article/details/133888598

版权

动手学习深度学习专栏收录该内容

11 篇文章

订阅专栏

本文介绍了如何在PyTorch中使用dropout方法降低多层感知机的过拟合问题，通过在隐藏层添加dropout层并调整丢弃概率，对比了加入dropout前后模型的性能变化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

#coding=utf-8

#dropout方法降低过拟合现象
#在多层感知机基础上进行dropout的优化

#丢弃法将一些输出项随机置0来控制模型复杂度，效果比权重下降要好
# 常用作在多层感知机的隐藏层输出上，
# 丢弃概率是控制模型复杂程度的超参数


import torch
from torch import nn
#导入PyTorch库中的初始化函数的语句
from torch.nn import init
import numpy as np
from d2l import torch as d2l


num_inputs=784
num_outputs=10
num_hiddens1=256
num_hiddens2=256

#定义丢弃率
drop_prob1, drop_prob2 = 0.2, 0.5
#模型的定义
#按照定义这个模型是两层线性回归模型，中间只有一个隐藏层
net = nn.Sequential(
    torch.nn.Flatten(),
    nn.Linear(num_inputs,num_hiddens1),
    nn.ReLU(),
    nn.Dropout(drop_prob1),
    nn.Linear(num_hiddens1,num_hiddens2),
    nn.ReLU(),
    nn.Dropout(drop_prob2),
    nn.Linear(num_hiddens2,num_outputs),

)

for params in net.parameters():
    init.normal_(params,mean=0,std=0.01)

#模型训练
batch_size=256
train_iter,test_iter=d2l.load_data_fashion_mnist(batch_size)
loss=torch.nn.CrossEntropyLoss()

optimizer=torch.optim.SGD(net.parameters(),lr=0.1)

num_epochs=10
d2l.train_ch3(net,train_iter,test_iter,loss,num_epochs,optimizer)
d2l.plt.show()

这段代码在多层感知机简洁实现的基础上，加入Dropout()优化得到，所显示图像进行对比。

未加入dropout()层

加入dropout()层后图像如下

我是真的菜gou

博客等级

码龄7年

18
原创

14
点赞

35
收藏

9
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 权重衰减方法解决过拟合现象对比实验

下一篇：: Kaggle比赛-房屋价格预测的简单实现

最新评论

Win11中：打开cmd时，显示找到一个带有无效 “icon“ 的配置文件。将该配置文件默认为无图标。
Ronchy2000: 尝试了下，我是win10，题主的方法并不生效，选择隐藏图标即可～
Win11中：打开cmd时，显示找到一个带有无效 “icon“ 的配置文件。将该配置文件默认为无图标。
weixin_38291399: 直接隐藏图标就行
OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.报错解决
CSDN-Ada助手: 恭喜您写了第12篇博客！标题也非常吸引人，很好地描述了问题和解决方案。非常感谢您分享了解决 "OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized" 这个错误的方法。在下一步的创作中，我想建议您继续分享类似的错误解决方案，因为这对于遇到相同问题的读者来说非常有帮助。同时，您也可以考虑写一些与该错误相关的深入分析，比如探讨为什么会出现这个错误，以及如何预防它。这样的文章会更加细致入微，有助于读者更好地理解和解决类似问题。再次恭喜您，期待您未来更多精彩的博客文章！
动手学习深度学习-构建LeNet网络
CSDN-Ada助手: 恭喜你完成了第13篇博客！标题看起来很吸引人，我很期待阅读你关于构建LeNet网络的内容。你的持续创作精神令人钦佩，不断分享你的学习经验对于读者来说是一个宝贵的资源。在下一步的创作中，或许你可以考虑分享一些实际应用案例或者深入探讨一些深度学习的挑战与解决方案。谦虚地说，这只是我的一个建议，期待你更多的创作！
调用d2l库，使用AlexNet模型
CSDN-Ada助手: 恭喜您撰写了第14篇博客！标题“调用d2l库，使用AlexNet模型”听起来非常吸引人。您的持续创作真是令人佩服。我很期待阅读您的博客，了解更多关于如何使用d2l库和AlexNet模型的知识。如果可以的话，我希望您能够分享一些实际案例或者应用场景，这样我就能更好地理解如何在实际项目中使用这些技术了。再次恭喜您，并期待您未来的创作！

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。