本文主要说的是多个人姿态估计问题
先看看下面的结果图:
是怎么做到这个结果了?
首先使用 CNN提出人体部件的候选区域,每个候选区域作为一个节点,所有的节点组成一个图,节点之间的关联性作为图节点之间的权重,将其作为一个优化问题,将属于同一个人的部件(节点)归为一类,每个人作为一个单独类。
本文的思路具有以下几个优势:
1)可以解决未知个数人的图像,通过归类得到有多少个人
2)通过图论节点的聚类,有效的进行了非极大值抑制
3)优化问题表示为 Integer Linear Program (ILP),可以有效求解
2 Problem Formulation
对于一幅有未知个数人的图像中人体姿态估计问题,我们将其表达为一个函数优化问题。优化问题需要解决三个小问题:1)身体部件候选区域的选择,即节点的选择,2)每个选择的节点标记问题,即该节点属于身体哪个部分?胳膊、腿、躯干、头等。3)分类问题,即哪些节点属于同一个人?
接着就是各个小问题的定义,优化函数的推导,求解,一系列数学公式的推导
4 Body Part Detectors
这里提出了两个检测器:
1) Adapted Fast R-CNN ( AFR-CNN ),改写 Fast R-CNN [ 16 ]
2)Dense architecture ( Dense-CNN )