Long-Tailed Classification by Keeping the Good and Removing the Bad Momentum Causal Effect个人理解

Long-Tailed Classification by Keeping the Good and Removing the Bad Momentum Causal Effect

M
X
D
Y

M代表torch中实现SGD中的momentum算法。momentum算法引入了动量的概念,类似于惯性,其目的是让梯度下降的更加稳定;但是它随着训练过程一直累积着,相当于LSTM的时序信息一样,将其他batch继承了过来,影响着参数的调整,从而影响特征提取的过程,从而影响X。
D表示特征X在向head的特征的方向上偏离的投影。M是影响X在向head的特征偏移的元凶,由于X在向head的特征偏移所以导致Y对于long-tail的loss很大。

计算 P ( Y ∣ X ) P(Y|X) P(YX)时存在一条后门路径X<-M->D->Y,因此需要 d o ( X ) do(X) do(X)来消除后门路径的影响。

P ( Y = i ∣ d o ( X = x ) ) = ∑ m ∈ M ( Y = i ∣ X = x , M = m ) P ( M = m ) = ∑ m ∈ M P ( Y = i , X = x ∣ M = m ) P ( X = x ∣ M = m ) \begin{aligned} P(Y=i|do(X=x))&=\displaystyle \sum_{m \in M}(Y=i|X=x,M=m)P(M=m) \\ &=\displaystyle \sum_{m \in M}\frac{P(Y=i,X=x|M=m)}{P(X=x|M=m)} \end{aligned} P(Y=ido(X=x))=mM(Y=iX=x,M=m)P(M=m)=mMP(X=xM=m)P(Y=i,X=xM=m)

d o ( X ) do(X) do(X)后的因果图是:

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值