pytorch:关于GradReverseLayer实现的一个坑

最新推荐文章于 2024-02-24 23:45:00 发布

清三

最新推荐文章于 2024-02-24 23:45:00 发布

阅读量1.1k

点赞数 4

文章标签： pytorch

本文链接：https://blog.csdn.net/supermarian/article/details/115254187

版权

最近在做一个domain adaptation的项目，用到了gradreverselayer：`class GradReverse(Function):

def forward(ctx, x, alpha, **kwargs:None):
    ctx.alpha = alpha

    return x.view_as(x)

def backward(ctx, grad_output):
    output = grad_output * -ctx.alpha
  
    return output, None

看起来没有问题，但是一直报错：

在这里插入图片描述
我搞了好久都没搞定，于是做了个愚蠢的决定，我加了一个：

src_domain_loss=torch.tensor(src_domain_loss, requires_grad=True)

结果错误居然消失了，我就乐呵呵地用了这个傻*代码用了两个月，结果实验结果一直不理想，直到今天检查训练梯度，发现梯度一直是零！！！

在这里插入图片描述
无语子，肯定是这段代码的锅，但是没有它就会报错，我搜遍了网络的每一个角落，都没有发现解决办法，还付费向人咨询了（哭）。

结果，灵光一闪，发现我梯度翻转层的代码少了些什么：

class GradReverse(Function):
    @staticmethod
    def forward(ctx, x, alpha, **kwargs:None):
        ctx.alpha = alpha 
        
        return x.view_as(x)
    @staticmethod
    def backward(ctx, grad_output):
        output = grad_output * -ctx.alpha
  
    return output, None`

发现了吗？@staticmethod！！！我一直以为这是一段注释，直接删掉了，大无语事件，气死！！！
其实这是在声明一个静态方法！
希望各位引以为戒。（哭）

清三

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
2
评论
pytorch:关于GradReverseLayer实现的一个坑

最近在做一个domain adaptation的项目，用到了gradreverselayer：`class GradReverse(Function):def forward(ctx, x, alpha, **kwargs:None): ctx.alpha = alpha return x.view_as(x)def backward(ctx, grad_output): output = grad_output * -ctx.alpha return outp
复制链接

扫一扫