测试时的dropout

最新推荐文章于 2024-05-11 01:06:03 发布

larkii

最新推荐文章于 2024-05-11 01:06:03 发布

阅读量3.6k

点赞数 4

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44795555/article/details/105875231

版权

训练的时候dropout的作用就是通过引入噪声，防止模型过拟合。所以其实测试的时候是不能关闭dropout的（关闭的话训练的模型和测试的模型就不同了）。

不关闭dropout，我们得到的就是一个随机的网络，给定x，得到的预测值y是服从一定的分布的。不关闭dropout的情况下，单次预测就是从这个分布中采样一次。多次采样就可以得到y的均值，也就是最终的预测值。但是多次采样会带来较大的计算开销。这时我们假设（这个假设在大多数情况下时成立的，但也有不成立的情况），平均参数（关闭dropout）得到的模型的预测值近似等于上面说的多次采样的平均值。

所以这个时候就有了训练开dropout，预测时关闭的做法。

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
测试时的dropout

训练的时候dropout的作用就是通过引入噪声，防止模型过拟合。所以其实测试的时候是不能关闭dropout的（关闭的话训练的模型和测试的模型就不同了）。不关闭dropout，我们得到的就是一个随机的网络，给定x，得到的预测值y是服从一定的分布的。不关闭dropout的情况下，单次预测就是从这个分布中采样一次。多次采样就可以得到y的均值，也就是最终的预测值。但是多次采样会带来较大的计算开销。这时我...
复制链接

扫一扫

larkii CSDN认证博客专家 CSDN认证企业博客

码龄5年

128: 原创

25万+: 周排名

65万+: 总排名

11万+: 访问

: 等级

1710: 积分

14: 粉丝

47: 获赞

18: 评论

128: 收藏

私信

关注

热门文章

分类专栏

最新评论

BDPK: Bayesian Dehazing Using Prior Knowledge （翻译）
棫菀: 很多信息领域的论文都可以去IEEE Xplore官网找，这篇论文可以在上面找到：https://ieeexplore.ieee.org/document/8464077
场景文本识别模型综述
Mr.Q: TPS是真的慢，推理一张图片要1-5s
BDPK: Bayesian Dehazing Using Prior Knowledge （翻译）
蓝格路: 你好，请问一下https://www.researchgate.net/profile/Can_Ding3/ 这个网址它我打不开你们能吗
P(A,B|C) and P(A|B,C)
蹦的一下就没了: 请问博主这个内容是转载于哪个资料呀？对条件独立有些疑惑想多看看
理解RNN的输入
八岁爱玩耍: 能再好好理解一下再发出来吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。