cs231n_dropout

Dropout是一种常用的正则化技术,通过在训练过程中随机关闭部分神经元来防止过拟合,增加模型的泛化能力。实验显示,不同失活比例(p)对模型有不同的影响。当p较小,模型保持较多信息;而p增大,过度失活可能导致模型欠拟合。适当地调整p值可以在训练集和验证集表现之间找到平衡。
摘要由CSDN通过智能技术生成

Dropout

原理与总结

Dropout的原理比较简单,主要随机失活部分神经元,通过小模型集成的方式增加模型的鲁棒性,在反向传播时要记得进行尺度恢复。

作业实现

dropout_forward

利用np.random.rand取得(0,1)之间的随机数,统计数量大小进行随机失活

在这里插入图片描述

测试结果:

在这里插入图片描述

dropout_backward

要注意要恢复尺度,除以失活系数p

在这里插入图片描述

Regularization experiment

分别测试不同的p,分别为0,0.25,0.5,0.75

在这里插入图片描述

Question

Explain what you see in this experiment. What does it suggest about dropout?

Answer

增加Dropout层可以防止过拟合,降低训练集和验证集之间的差距。但是随着神经元失活的比例增加,模型就会变得欠拟合。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值