姿态估计之CPN(Cascaded Pyramid Network)

这篇是face++2017年coco keypoint benchmark 数据集冠军的文章。主要提出了基于CPN(Cascaded PyramidNetwork)结构的人体关键点检测框架。


Top-down pipeline


整体框架采用Top-down自上而下的检测策略。首先使用行人检测框架,先检测出行人候选框。然后使用本文的CPN网络对每一个检测出来的行人候选框进行人体关键点的回归,进而输出最终结果。最终实现coco tes-dev 73 map,coco test-challengedataset 72.1map。

 

Motivation:

首先对于可以看见的easy 关键点直接预测得到,对于不可见的关键点,使用增大感受野来获得关键点位置,对于还未检测出的点,使用上下文context进行预测。

 

整体网络结构:

网络整体结构采用CPN(CascadedPyramid Network)结构,Cascaded指的是级联的意思,代表了网络级联了2个类似的模块(GolbalNet和RefineNet),Pyramid指的是类似于FPN的金字塔网络结构。

其中,GolbalNet负责网络所有关键点的检测,重点是对比较容易检测的眼睛,胳膊等部位的关键点预测效果较好,采用的损失函数为L2 loss。其中在每一个elem-sum操作之前,都对featuremap使用了1*1的卷积操作。

RefineNet指的是对GolbalNet预测的结果进行修正的网络。GolbalNet对身体部位的那些遮挡,看不见,或者有复杂背景的关键点预测误差较大,RefineNet则专门修正这些点。主要还是基于shortcut的思想。在该阶段的训练中,还使用了类似OHEM的online hard keypoints mining难例挖掘策略。

 

主要训练trick:

(1)数据增强,提升0.4map

训练数据的处理上使用了随机翻转,(-45度,45度)的随机旋转,(0,7,1.35)的随机尺度变换。

(2)大batch的训练,主要针对检测框架,提升0.4-0.7map

(3)在行人检测框架中使用soft NMS取代hard NMS,提升0.3map

soft NMS指的是将重叠较大的框中分数较小的那个框的分数拉到很低,但是不会去除到这个框,这样召回率相对较高。
hard NMS就是传统的NMS,直接将IOU大于一定阈值的框中得分较低的框直接去掉,相对召回率较低。

在人体关键点检测中,使用soft NMS会因为人体框召回率的提高而得到较高的分数。


(4)随着检测map的提高,关键点的map提升非常有限

(5)online hard keypoints mining
在coco数据集中有17个关键点需要预测,GolbalNet预测所有的17个点,并计算所有17个点的loss,RefineNet也预测所有的17个点,但是只计算其中最难的8个点的loss。在训练中还使用了类似OHEM的OHKM策略。


(6)多模型融合集成,提升1.1-1.5map在coco minval数据集上


References:
Cascaded Pyramid Network for Multi-Person Pose Estimation

  • 10
    点赞
  • 55
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
RGBD 三维人体姿态估计是指利用RGB和深度图像数据进行人体姿态估计的技术。RGBD 人体三维重建数据集通常包含多组RGB和深度图像,每组图像对应不同的视角或姿态。这些数据集被用于训练和评估人体三维姿态估计算法,以在计算机视觉应用中使用。人体姿态估计可以作为其他算法的辅助环节,如动画、游戏运动捕捉系统和行为理解。在人体姿态估计中,可以使用深度学习模型建立单目RGB图像到3D坐标的映射,也可以先获取2D信息,然后再将其提升到3D姿态。不同的方法和网络架构可以用于实现RGBD 三维人体姿态估计,如Hourglass、CPN等。此外,还可以使用预训练好的2D姿态网络来辅助3D姿态估计。总的来说,RGBD 三维人体姿态估计需要复杂的网络架构和充足的训练样本,同时还需要考虑背景、光照和人的穿着等因素的影响。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* [RGBD人体三维重建数据集](https://blog.csdn.net/weixin_35750747/article/details/129567009)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [3D人体姿态估计总结](https://blog.csdn.net/weixin_43125047/article/details/108690088)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [2D/3D人体姿态估计 (2D/3D Human Pose Estimation)](https://blog.csdn.net/MyArrow/article/details/104581761)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值