论文: 《The devil is in the details: Delving into unbiased data processing for human pose estimation》
GitHub地址: https://github.com/HuangJunJie2017/UDP-Pose
解决问题
1、标准的数据处理主要包括坐标系统转换以及关键点格式转换,作者发现常规翻转后结果与原始推理结果不一致;
2、并且在关键点格式转换中存在统计误差。
创新点
为了从源头上解决这两个问题,作者提出无偏数据处理(UDP),包括无偏坐标系变换和无偏关键点格式变换。
算法原理
坐标转换
当发生反转增强时,会出现坐标误差。比如:
图片尺寸:
W
∗
H
=
12
∗
12
W*H=12*12
W∗H=12∗12
特征图尺寸:3*3
降采样倍数s:4
关键点坐标g:(4,4)
1、原图翻转gf:(7,7)
2、网络降采样:gfr:(7/4,7/4)
3、假设网络完全拟合,特征层坐标翻转,pr:(5/4,5/4)
4、预测坐标映射回原图,p:(5,5)
预测坐标与真值产生偏差。
根因分析:
由于坐标映射出现偏差,坐标11,映射到坐标11/4,坐标3无原图映射点,下采样后坐标不应为除4,应为(12-1)/(4-1),即坐标11映射到坐标3.经过纠正后,误差可消除。
无偏关键点格式转换
无偏关键点格式转换;其中有两种方案:
1、结合分类与回归偏移;其中分类分支为圆形区域,回归分支为x、y两方向坐标偏置。
2、分类格式。生成高斯map。测试时,复用DARK中decoding模块,如式38,进行坐标矫正,可参考之前文章.
实验结果
适用于bottom-up方法以及top-down方法,在bottom-up方法上耗时有提升;top-down方法上耗时无影响。
总结
从数据无偏角度出发,有效提升算法性能。