openmmlab训练营-关键点检测理论部分

本文介绍了人体关键点检测的各个方面,包括2D姿态估计的两种思路——基于回归和基于热力图的方法,详细阐述了自顶向下、自底向上和单阶段的检测策略。此外,还提及了3D关键点检测的挑战和解决方案,以及人体表面mesh重建的技术。
摘要由CSDN通过智能技术生成

训练营第二课人体关键点检测

1. 整体概要

目录

2. 具体内容

2.1 2D姿态估计

主要任务目标为计算图片中人体的2d关键点坐标;
两种思路:
在这里插入图片描述

基于回归基于热力图
算法网络输出直接回归关键点的坐标值根据关键点标注生成热力图作为监督
优点直接输出期望结果,计算消耗小网络学习压力小
缺点直接回归坐标值难度较大不好学涉及热力图与坐标值的转换,计算消耗大

其中热力图到关键点的生成可以采用argmax或者求期望得到,但是取极大值不可导,而求期望可以求导,可以设计为端到端输出的形式;

2.1.1 自顶向下

基本做法是先在图像中用检测模型分出人物实例,然后在实例检测框的基础上做关键点检测。特点是与检测强相关,速度受到图片中人物数量的影响,而精度受到检测精度影响。

基于回归
经典做法为直接计算回归的关键点和真值之间的二范数损失,但是这样的计算方法隐含了关键点符合高斯分布的假设,但是实际的关键点分布可能并不符合这样的假设,所以RLE对先验分布做了显式建模:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
基于热力图

在这里插入图片描述
多尺度融合残差连接,输出为热力图形式;

2.1.2 自底向上

基本思路就是先计算所有的关键点,然后对所有关键点做聚类,属于相同肢体或者人体实例的聚类在一起构建连接关系;
在这里插入图片描述
预测了所有的关键点和方向信息;
在这里插入图片描述在这里插入图片描述
根据亲和力计算公式以及K部图匹配进行聚类;

2.1.3 单阶段

在这里插入图片描述
基本思路就是直接输出多个向量,通过预测一个关键点以及其它节点与之的向量来实现;主要难点在于人体不同位置关键点的分布差异较大,不好训练,所以会有工作将人体分区域定义多个根节点以及周围参考点与之的相对向量分别预测。最终损失函数对应多个关键位置以及位移图损失的加权和。

2.1.4 基于Transformer

在这里插入图片描述
初始化关键点作为查询单位,在图像中查询特征回归关键点;当然也可以类似TransPose同时设计视觉和pose的token交互一起做任务。
在这里插入图片描述

2.2 3D关键点检测

主要难点在于2D图像中缺失深度信息,解决方式可以是直接估计深度进行计算或者利用视频进行计算;

2.3 人体表面mesh重建

引入人体表面建模的参数化模型然后分别用网络拟合各部分参数;

2.4 评估指标

。。。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值