《AWR Adaptive Weighting Regression for 3D Hand Pose Estimation》研读与实践

本文深入探讨了《AWR: Adaptive Weighting Regression for 3D Hand Pose Estimation》一文,该研究结合检测与回归方法,利用3D热力图估计手部21个关键点的三维坐标。通过自适应权重回归解决深度学习中手部关键点定位的挑战,尤其是在深度值缺失和自遮挡情况下。作者提出的AWR模型具备端到端训练和连续可微特性,改善了传统方法的局限。实验结果显示,AWR在3D手势识别上表现出色。
摘要由CSDN通过智能技术生成

《AWR: Adaptive Weighting Regression for 3D Hand Pose Estimation》略读与实践

这是一篇深度图手部关键点坐标估计的文章(以下简称AWR),目的是利用带有关键点深度坐标的所谓3D heatmap来直接回归出21个手部关键点的三维坐标,相当于所谓结合detection-based和 regression-based 两种方法。至于说什么adaptability,其实就是所谓可微的heatmap,类似文章之后介绍SRN就知道了。

官方代码:

https://github.com/Elody-07/AWR-Adaptive-Weighting-Regression

先上一张给出的会意图,方便理解:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2dYBQMdn-1594736515246)(awr1.png)]

AWR文章作者认为直接采用神经网络回归手部关键点坐标的方案可以捕获全局特征,尤其在极端角度,比如自遮挡这种情况,效果有所保证,但是考虑到最后是将特征图转为全连接层的形式,会破坏掉之前的空间结构信息,使其坐标想达到特别精确变得困难。采用基于检测的方案(heatmap或者偏移向量场方案)然后通过求最大值位置或者mean-shift找出每个通道特征图所代表的关键点坐标值,即全卷积网络没有全连接层,认为这样可以保留空间结构信息,还能更好地利用局部特征,但是这种方案问题在于后处理(求最大值)与模型不是end-to-end的,在模型训练的时候只是直接求特征图输入与固定计算的权重分布的loss。作者认为这样学习固定的权重分布会使得模型性能减弱且当关键点附近有深度值缺失时,表现不稳定。所以提出AWR具有end-to-end训练的特点,连续可微,使得权重分布或者说是局部感受野区域自适应。

再来看整体网络结构与流程:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-i8r2JXs8-1594736515248)(awr2.png)]

作者在想设计这个heatmap的格式,所以考虑距离手部关键点坐标距离近的点应该比距离远的拥有更高的权重,而且,如果手部关键点附近有些深度值缺失,甚至严重缺失,权重分布的范围应该更扩大一些才好(这就是所谓的自适应),所以就有以下公式:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VV2gsnsS-1594736515250)(awr3.png)]

上图就是本文的核心概括,这样一来输入数据是深度图,手部关键点坐标标签还是xyz或uvd,heatmap只存在于中间数据格式的转换。至于说先预训练所谓dense representation supervision then finetune the network with joint supervision.效果比直接训练好,使用smooth L1 loss等等,这都不重要了。

有个需要注意也是大家得出一般结论的细节:学习偏移量比直接回归标签值效果好。

其实还有个细节就是网络结构图里也能看出来,就是使用了深度图提取了mask,相当于嵌入先验约束。

至于效果什么的,我贴几张自己感兴趣的官方模型的实测结果:

在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

接下来给上一段核心代码(也就是之所以能发论文的代码):

    def offset2joint_softmax(self, offset, img
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值