RepNet: Weakly Supervised Training of an Adversarial Reprojection Network
for 3D Human Pose Estimation
题目:《用于3DHPE的对抗性重投影网络的弱监督训练》
作者:Bastian Wandt and Bodo Rosenhahn
Leibniz Universität Hannover
Hannover, Germany
wandt@tnt.uni-hannover.de
来源:CVPR 2019
研究内容:
单目-单人-弱监督
现有技术:
常用技术:神经网络(但对未知运动和相机位置的推广不好-泛化性能差)
本文:在神经网络中推出3D POSE,忽略由2D投影至3D的过程,以此解决过拟合问题,允许弱监督训练,避免对训练数据的记忆。
本文架构:
RepNet
RepNet网络分为三部分:
①生成器网络:2D观测生成匹配的3D姿态,学习输入到输出的映射
②判别器网络:放宽对训练特定数据3D姿态,学习3D资源分布
③重投影网络:预测相机参数,将其估计3D姿态投影至2D姿态
(注:①区分GT与生成样本,提出用于鉴别评估鉴别器质量的KCS(正向链接运动)启发关节长度+角度;在①②中,当生成器样本被判别器预测为真时,鉴别器参数被固定,生成器网络与鉴别器网络交替训练-作为终止条件)
网络结构:
数据集:
(1)Human 3.6M数据集:
用于训练网络,包含2D-3D直接的对应关系,但在本文中以弱监督为特点,忽略2D-3D之间的对应关系
评价性能:MPJPE;PA-MPJPE;PCK3D
(2)MPI-INF-3DHP数据集
用于评估算法
评价性能:3DPCK;AUC;MPJPE
(3)LSP数据集
对异常姿势和相机角度,其姿势种类多。计算上臂、下臂和腿骨长度,对于每个关节设置最大误差,对身体左右两侧,所有匹配骨骼的绝对值差求和计算出对称误差在一个合理范围
在高斯噪声范围(0~N)在GT 2D关节对鉴别器提升选出最优结果。