Dropout 训练、测试

最新推荐文章于 2024-08-17 01:13:32 发布

一个偶像

最新推荐文章于 2024-08-17 01:13:32 发布

阅读量681

点赞数 1

文章标签：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a1159477889/article/details/130912976

版权

文章讨论了在深度学习中使用Dropout技术时，如何在训练和测试阶段调整神经元的输出。训练时，模型以概率p丢弃神经元，导致输出减小。处理方式包括在训练时除以(1-p)使期望输出保持不变，或者在测试时乘以(1-p)以匹配训练阶段的分布。这两种方法旨在确保训练和测试阶段的一致性。

摘要由CSDN通过智能技术生成

我们假设模型在训练时以p概率丢弃神经元，则训练、测试时的情况如下所述。

神经元的输入：x
神经元的输出：p*0 + (1-p)*x=(1-p)x 因为模型以概率p丢弃神经元，以概率1-p保留神经元，所以其总体输出为p0 + (1-p)*x=(1-p)*x。可以看出(1-p)*x相比于神经元输入x变小了，所以此时有两种处理方式：
1).训练期间对所有输出均除以(1-p)，使其输出的期望仍为x。因为测试的时候所有的神经元均激活，假设测试时神经元的输入为x，则输出也为x。
2).训练期间除随机丢弃神经元，不做其他操作，则总体输出为(1-p)*x。因为测试的时候所有的神经元均激活，假设测试时神经元的输入为x，则此时神经元输出为x，明显大于(1-p)*x，且分布也变化了。为了让测试阶段抵消这种差异，对测试的输出要乘以(1-p)，这样测试输出结果也为(1-p)*x，大小、分布与训练阶段统一了。

这是我理解的dropout训练、测试阶段的使用缩放系数的情况，理解有误的话请评论指正，感谢！

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Dropout 训练、测试

2).训练期间除随机丢弃神经元，不做其他操作，则总体输出为(1-p)*x。因为测试的时候所有的神经元均激活，假设测试时神经元的输入为x，则此时神经元输出为x，明显大于(1-p)*x，且分布也变化了。因为测试的时候所有的神经元均激活，假设测试时神经元的输入为x，则输出也为x。x 因为模型以概率p丢弃神经元，以概率1-p保留神经元，所以其总体输出为p。，这样测试输出结果也为(1-p)*x，大小、分布与训练阶段统一了。神经元的输出：p*0 + (1-p)*x=(1-p)
复制链接

扫一扫

一个偶像 CSDN认证博客专家 CSDN认证企业博客

码龄8年

5: 原创

35万+: 周排名

61万+: 总排名

6523: 访问

: 等级

158: 积分

3: 粉丝

8: 获赞

0: 评论

21: 收藏

私信

关注

热门文章

分类专栏

最新评论

Dropout 训练、测试
CSDN-Ada助手: 恭喜你写出了第5篇博客，非常感谢你分享这些有价值的内容。我非常期待你的下一篇博客，也许你可以写一下如何使用深度学习模型进行图像分类或者文本分类。谢谢你的分享！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。