Generalizing Gaze Estimation with Rotation Consistency CVPR 2022 目标域部分无标注样本

driverw

已于 2023-04-03 17:16:54 修改

阅读量146

点赞数 1

分类专栏：视线估计文章标签：深度学习 big data

于 2023-04-03 17:03:00 首次发布

本文链接：https://blog.csdn.net/weixin_43841776/article/details/129931505

版权

视线估计专栏收录该内容

19 篇文章 5 订阅

订阅专栏

原文链接
概述：本文约束源域、目标域均满足旋转一致性约束。
在这里插入图片描述

旋转一致性： $R^g)^{-1}*(F(RI)) = F(I)$
其中I为输入图像，F为视线估计网络， $\begin{bmatrix}cos\theta & -sin\theta \\ sin\theta & cos\theta\\ \end{bmatrix}$ 为图像旋转矩阵， $R^g$ 为视线逆旋转矩阵， $\theta$ 为旋转后图像子标签。
在这里插入图片描述

具体来说，源域训练损失包括两部分：
1.传统视预测线准确性损失 $argmin_\theta L_1(\hat{g}^*_i, g^*_i)$
2.旋转一致性损失 $L_D$ 则包括两部分： $L_{mean}=\frac{1}{K}\sum^K_{k=1}L_{k}(g',g)$ 以及 $L_{std}=\sqrt{\frac{\sum^K_{k=1}(g'-\overline {\{g'\}})}K}$
其中 $\{g'\}=\{{(R^g)}^{-1}\}\{\hat g\}$ 为一组旋转增强得到的K张图像组{I}逆旋转后的预测视线，g为原图像的真值标签。

对于目标域域适应：
首先根据图像组{I}的预测标签计算伪标签 $g^n=Mean(\{{(R^g)}^{-1}\}\overline F(\{I\}))$ ,然后根据伪标签计算旋转一致性损失 $L_{mean}=\frac{1}{K}\sum^K_{k=1}L_{k}(g',g)$ 以及 $L_{std}=\sqrt{\frac{\sum^K_{k=1}(g'-\overline {\{g'\}})}K}$