Drop_path及其在Vit中的应用和Pytorch代码实现

最新推荐文章于 2024-10-29 21:14:59 发布

taoqick

最新推荐文章于 2024-10-29 21:14:59 发布

阅读量336

点赞数

CC 4.0 BY-SA版权

文章标签： pytorch 深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/taoqick/article/details/130321123

文章介绍了DropPath函数的实现，它在训练神经网络时用于dropout操作。当dropout概率为p时，神经元的输出期望值调整为(1-p)a。DropPath类在PyTorch中用于在训练时应用dropout，确保模型的期望输出与无dropout时一致。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

def drop_path(x, drop_prob: float = 0., training: bool = False):
    if drop_prob == 0. or not training:
        return x
    keep_prob = 1 - drop_prob
    shape = (x.shape[0],) + (1,) * (x.ndim - 1)
    random_tensor = keep_prob + torch.rand(shape, dtype=x.dtype, device=x.device)
    random_tensor.floor_() 
    output = x.div(keep_prob) * random_tensor
    return output

引用：

假设一个神经元的输出激活值为a，在不使用dropout的情况下，其输出期望值为a。
如果使用了dropout，神经元就可能有保留和关闭两种状态。
把它看作一个离散型随机变量，它就符合概率论中的0-1分布，其输出激活值的期望变为(1-p)*a+p*0= (1-p)a。
此时若要保持期望和不使用dropout时一致，就要除以 (1-p)。

而在pytorch中，VIT的实现时

调用此即可：

class DropPath(nn.Module):
    def __init__(self, drop_prob=None):
        super(DropPath, self).__init__()
        self.drop_prob = drop_prob

    def forward(self, x):
        return drop_path(x, self.drop_prob, self.training)

博客等级

码龄13年

478
原创

1345
点赞

2704
收藏

655
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: FGSM网络对抗攻击

下一篇：: 对抗攻击（HopSkipJumpAttack）

最新评论

图片视频抹除算法总结Inpaint
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
分析transformer模型的参数量、计算量、中间激活、KV cache、bf16、fp16、混合精度训练
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
LeetCode 1032. Stream of Characters 4行Trie树
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性；(3)增加条理清晰的目录。
旋转式位置编码Rotary Position Embedding（RoPE）
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
量化QAT QLoRA OBD OBS GPTQ
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。

大家在看

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。