【姿态估计文章阅读】Single-Stage Multi-Person Pose Machines【依图科技】

一、今年ICCV2019刚出炉的文章,颜水成教授团队的,非官方代码:https://github.com/murdockhou/Single-Stage-Multi-person-Pose-Machines

二、这篇文章核心思想

      1、点评了下目前多人姿态估计中的现状:大多数人都在多two-stage,很多模型都是但人姿态估计结合上人体检测,这也是这两年的主要内容,效果虽然好,但是缺点也是很明显“效率低”;one-stage也有不少工作,但是类似于pif,paf,embedding之类,也是在逐年提升,embedding的方法出来之后,不少团队把这个用于目标检测提升了one-stage的目标检测结果。

      2、提出了一个算是全新的结构:single-stage的多人姿态估计模型,不同于以往的one-stage,本文的模型没有复杂的后续处理(比如openpose需要后续处理利用paf生成图,做2部图的划分,再组装成每个人),本文的直接会预测人。(这里也推荐下另一篇文章ECCV2018的,pose proposal Network)去年自己也想这么做,可惜~~~

      3、对提出的结构进行优化,减轻网络预测的难度,提升“打跨度”关键点之间的预测能力。

      4、这个方法可以直接用到3D多人姿态估计中,只需要增加一个坐标位置就ok。

三、算法的总体结构

                    

    这个图可能不太清楚,但是结构还是那么回事,正常的回归。Root Conf.Map 还是我们熟悉的Heatmap,只不过这个用来回归一个叫root joint的关键点,可以理解成“人物中心”用来代表每个人物instance!而且是多人的,因此肯定是使用的NMS了。Joint DisP.Map 是偏移量,可以当成offset,因为我们知道了root joint的位置,然后在root joint这个位置上去取对应关节的offset,加到root joint的x,y上面就能得到比如肩膀的x,y了。一个一个加就能得到每个instance的全部pose了。

四、Structured pose representation (SPR)和 Hierarchical SPR

    在“三”里面,我们说的其他全部关键点的推理建立在 root joint+对应offset的基础之上,算是SPR,这种虽然可以解决问题,但是不能很好的解决,因为有的身体关键点偏离root joint较远,这对网络来说自然是有难度的直接去回归。

    对于这个问题,作者提出了Hierarchical SPR,看下图可以一目了然:

      文章中分了四个等级:Here, the root joint is placed in the first hierarchy; torso joints including neck, shoulders and hips are in the second one; head, elbows and knees are put in the third; wrists and ankles are put in the fourth.这样一来的好处就是减轻了网络预测的压力,关键点依赖于他相邻的关节,一层套一层,因此这里的offset也是一层套一层,因此可以简化成如下的公式:

     

      从这里可以看出,这个模型,除了root joint是直接预测外,其他的都是预测的偏移。

   这里网络模型采用的是hourglass * 8.

五、实验设置

  label的生成,root joint依然是采用的2d 高斯 heatmap,sigma=7.其他的关键点都是offset,直接预测的值了:

    这个tao其实就是一个label的范围限制,对应热度图中热度稍微高的地方有label,其他地方就没有了。

   这个是用来解决同一个位置可能有多个关键点的的话,利用这个公式进行平均。

   第一部分用的MESLoss,第二部分就是smooth L1了,采用了每个stage都有中继监督,用于防治梯度消失。

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
### 回答1: "Single-Stage 6D Object Pose Estimation"算法是一种用于估计实物物体的三维位置和姿态的机器视觉算法。它可以帮助机器人和自动化系统准确地定位和定位实物物体,从而更好地执行物体抓取和放置任务。它是一种单阶段算法,可以在一次传感器观测中估计出物体的精确三维位置和姿态。 ### 回答2: “Single-Stage 6D Object Pose Estimation”(单阶段6D物体姿态估计)算法是一种用于计算机视觉领域的算法,它旨在准确地估计物体在三维空间中的位置和姿态。 这个算法的关键思想是通过分析和理解物体在图像中的特征和形状信息来推断物体的姿态。相比于传统的多阶段姿态估计算法,这个算法不需要人工设定特征点或者先验知识,而是通过深度学习的方式自动地学习和提取特征。 在实施过程中,首先使用卷积神经网络(Convolutional Neural Network,CNN)对输入的图像进行特征提取。然后利用这些特征,结合传统的计算机视觉方法,推断物体的位置和姿态。具体地说,算法会以端到端的方式学习物体的边界框、姿态和置信度等关键信息。 “Single-Stage 6D Object Pose Estimation”算法的一个重要特点是能够处理多物体姿态估计问题。它可以同时估计多个物体在图像中的位置和姿态,而不会受到物体之间相互干扰的影响。这一特性使得该算法在实际应用中非常有价值,例如在机器人视觉、增强现实和自动驾驶等领域。 总之,“Single-Stage 6D Object Pose Estimation”算法以其准确性和高效性在计算机视觉领域引起了广泛关注,并为物体识别、场景理解和自动导航等任务提供了一种新的解决方案。 ### 回答3: “Single-Stage 6D Object Pose Estimation”算法是一种用于物体姿态估计的单阶段算法。姿态估计是计算机视觉领域的一个重要任务,目标是确定物体在三维空间中的位置和方向。 传统的物体姿态估计算法通常需要多个阶段的处理,例如物体检测、关键点提取和姿态回归等。而“Single-Stage 6D Object Pose Estimation”算法通过一阶段的处理直接输出物体在三维空间中的姿态信息,简化了整个过程。 该算法的核心是深度学习模型,通常使用卷积神经网络(CNN)进行物体检测和姿态估计。首先,通过输入图像,使用CNN模型进行物体检测,获取物体的二维边界框和关键点。然后,通过卷积和全连接层,提取特征表示并将其传递给下一个阶段。 接下来,使用姿态回归网络从特征表示中预测物体的三维位姿。这个回归网络通常由多个全连接层组成,将特征表示映射到物体的位置和方向。最后,根据预测得到的姿态信息,可以确定物体在三维空间中的位置和朝向。 相比于传统的多阶段方法,“Single-Stage 6D Object Pose Estimation”算法具有训练和预测速度快的优势,并且能够提供准确的姿态估计结果。这种算法在许多实际应用中具有重要意义,如机器人操作、增强现实和自动驾驶等领域。这种算法的发展为物体姿态估计提供了更高效、更精确的解决方案。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值