Generalizing Gaze Estimation with Rotation Consistency CVPR 2022 目标域部分无标注样本

原文链接
概述:本文约束源域、目标域均满足旋转一致性约束。
在这里插入图片描述

旋转一致性 ( R g ) − 1 ∗ ( F ( R I ) ) = F ( I ) (R^g)^{-1}*(F(RI)) = F(I) (Rg)1(F(RI))=F(I)
其中I为输入图像,F为视线估计网络, R = [ c o s θ − s i n θ s i n θ c o s θ ] R= \begin{bmatrix}cos\theta & -sin\theta \\ sin\theta & cos\theta\\ \end{bmatrix} R=[cosθsinθsinθcosθ]图像旋转矩阵 R g R^g Rg视线逆旋转矩阵 θ \theta θ为旋转后图像子标签。
在这里插入图片描述

具体来说,源域训练损失包括两部分:
1.传统视预测线准确性损失 a r g m i n θ L 1 ( g ^ i ∗ , g i ∗ ) argmin_\theta L_1(\hat{g}^*_i, g^*_i) argminθL1(g^i,gi)
2.旋转一致性损失 L D L_D LD则包括两部分: L m e a n = 1 K ∑ k = 1 K L k ( g ′ , g ) L_{mean}=\frac{1}{K}\sum^K_{k=1}L_{k}(g',g) Lmean=K1k=1KLk(g,g)以及 L s t d = ∑ k = 1 K ( g ′ − { g ′ } ‾ ) K L_{std}=\sqrt{\frac{\sum^K_{k=1}(g'-\overline {\{g'\}})}K} Lstd=Kk=1K(g{g})
其中 { g ′ } = { ( R g ) − 1 } { g ^ } \{g'\}=\{{(R^g)}^{-1}\}\{\hat g\} {g}={(Rg)1}{g^}为一组旋转增强得到的K张图像组{I}逆旋转后的预测视线,g为原图像的真值标签。

对于目标域域适应:
首先根据图像组{I}的预测标签计算伪标签 g n = M e a n ( { ( R g ) − 1 } F ‾ ( { I } ) ) g^n=Mean(\{{(R^g)}^{-1}\}\overline F(\{I\})) gn=Mean({(Rg)1}F({I})),然后根据伪标签计算旋转一致性损失 L m e a n = 1 K ∑ k = 1 K L k ( g ′ , g ) L_{mean}=\frac{1}{K}\sum^K_{k=1}L_{k}(g',g) Lmean=K1k=1KLk(g,g)以及 L s t d = ∑ k = 1 K ( g ′ − { g ′ } ‾ ) K L_{std}=\sqrt{\frac{\sum^K_{k=1}(g'-\overline {\{g'\}})}K} Lstd=Kk=1K(g{g})

算法流程为

在这里插入图片描述
实验
在±90度的范围内随机旋转,在源域旋转扩充次数为5,目标域为20。
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值