![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
人体姿态估计
青青韶华
计算机在读
关注机器学习(深度学习),图像处理,计算机视觉
联系方式:qqshblog@126.com
展开
-
论文阅读:《Flowing ConvNets for Human Pose Estimation in Videos》ICCV 2015
概述本文主要用CNN网络来进行人体姿态估计,加入了temporal 信息以提高精度。本文的四个贡献: 1. 提出了一个更深的CNN网络(相比于Alex-Net),不同于之前的回归坐标,而是回归heatmap,这样可以提高关节点定位的鲁棒性,并且更利于在训练过程中的可视化观察。 2. 提出一种空间融合层,用来学习隐式空间模型,即用来提取关节点之间的内在联系 3. 使用光流信息,用来对准原创 2017-10-23 17:06:55 · 7138 阅读 · 5 评论 -
人体姿态估计数据集整理(Pose Estimation/Keypoint)
LSP地址:http://sam.johnson.io/research/lsp.html 样本数:2K关节点个数:14全身,单人FLIC地址:https://bensapp.github.io/flic-dataset.html样本数:2W关节点个数:9全身,单人MPII地址:http://human-pose.mpi-inf.mpg.de/样本数:25K关节点个数:16原创 2017-10-24 17:32:31 · 34001 阅读 · 3 评论 -
论文阅读:《RMPE: Regional Multi-Person Pose Estimation》ICCV 2017
概述论文地址:https://arxiv.org/abs/1612.00137v3 项目主页:RMPE: Regional Multi-person Pose Estimation这篇论文是上海交大和腾讯优图的论文,被 ICCV 2017接收。它对于多人姿态估计的方法采用传统的自顶向下的方法,即先检测人,再识别人体姿态。检测使用的是SSD-512,识别人体姿态使用的是state-of-the-ar原创 2017-10-24 16:08:13 · 10491 阅读 · 2 评论 -
论文阅读:《Associative Embedding:End-to-End Learning for Joint Detection and Grouping》
概述论文提出了一种single-stage,end-to-end的关节点检测和分组方法,这不同于以往的multi-stage的关节点检测方法,在MPII和COCO数据集上达到新的state-of-the-art的效果,超越最近的Mask RCNN和Google GMI。从人体姿态估计方法上属于bottom-up的方法,即先检测关节点,再对关节点进行分组。在COCO测试集上mAP达到0.655。尽管论原创 2017-10-23 19:58:05 · 4270 阅读 · 0 评论 -
论文阅读:《Towards accurate multi-person pose estimation in the wild》CVPR 2017
网络框架论文采用top-down的结构,分为两个阶段: 第一阶段使用faster rcnn做detection,检测出图片中的多个人,并对bounding box进行image crop; 第二阶段采用fully convolutional resnet对每一个bonding box中的人物预测dense heatmap和offset; 最后通过heatmap和offset的融合得到关键点的精原创 2017-10-23 19:49:37 · 7541 阅读 · 0 评论 -
论文阅读:《Mask R-CNN》ICCV2017
概述Mask R-CNN是用于目标检测分割的框架,即对一张图片,既输出图片中已有的目标,还能为每一个实例生成一个高质量的分割掩码。一句话概括object instance segmentation = object detection + semantic segmentation。特点 1.mask R-CNN是在faster R-CNN的基础上,在每一个RoI都增加一个预测分割的 mask,原创 2017-10-23 19:38:50 · 4717 阅读 · 0 评论 -
论文阅读:《Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields》CVPR 2017
概述本文承接CMP论文的框架结构,最大的创新点在于提出了一种PAF的方法,能够有效的针对多人进行姿态估计,同时在保证精度的情况下,可以做到实时的效果。传统的方法采用top-down的方法,即先检测人,然后对每一个人进行姿态估计,但是当人离得比较近的时候,检测人体的方法无效;并且人数越多,检测所花的时间约多,不能做到实时效果。因此本文采用bottom-up的方式,但是也利用了全局上下文信息。PAF文章原创 2017-10-23 19:24:22 · 11668 阅读 · 1 评论 -
论文阅读:Deepcut&Deepercut:Joint Subset Partition and Labeling for Multi Person Pose Estimation
引言本篇一起介绍两篇相关文章—— 《DeepCut: Joint Subset Partition and Labeling for Multi Person Pose Estimation》 CVPR 2016 《DeeperCut: A Deeper, Stronger, and Faster Multi-Person Pose Estimation Model》 ECCV 2016Deep原创 2017-10-23 18:32:43 · 10681 阅读 · 7 评论 -
论文阅读:《Structured Feature Learning for Pose Estimation》CVPR 2016
概述本文仍然是使用CNN,其创新点在于如何对关节之间的依赖进行建模,解决方法是在卷积层使用几何变换核。此外还提出了双向的树结构模型,这样每个关节的特征通道都可以接受其他关节点信息。 网络架构/算法流程输入是一张RGB静态图片。经过CNN(论文中采用的CNN是VGG Net),得到和关节个数数量相同的heatmap,然后这些heamap通过信息传递进行refined。信息传递的方式是使用双向树结构,按原创 2017-10-23 18:20:12 · 2401 阅读 · 0 评论 -
论文阅读:《Stacked Hourglass Networks for Human Pose Estimation》ECCV 2016
概述本文仍然是使用全卷积神经网络,对给定的单张RGB图像,输出人体关键点的精确像素位置,使用多尺度特征,捕捉人体各关节点的空间位置信息。网络结构形似沙漏状,重复使用top-down到bottom-up来推断人体的关节点位置。每一个top-down到bottom-up的结构都是一个stacked hourglass模块。沙漏网络 Motivation:使用沙漏网络的目的是为了反复获取不同尺度下图原创 2017-10-23 18:07:03 · 11678 阅读 · 5 评论 -
论文阅读:《Convolutional Pose Machines》CVPR 2016
概述本文使用CNN进行人体姿态估计,它的主要贡献在于使用顺序化的卷积架构来表达空间信息和纹理信息。顺序化的卷积架构表现在网络分为多个阶段,每一个阶段都有监督训练的部分。前面的阶段使用原始图片作为输入,后面阶段使用之前阶段的特征图作为输入,主要是为了融合空间信息,纹理信息和中心约束。另外,对同一个卷积架构同时使用多个尺度处理输入的特征和响应,既能保证精度,又考虑了各部件之间的远近距离关系。 网络结构原创 2017-10-23 17:25:20 · 13797 阅读 · 15 评论 -
人体姿态估计综述(Human Pose Estimation Overview)
Part1:Single Person Pose Estimation2015 年之前的方法都是回归出精确的关节点坐标( x,y ),采用这种方法不好的原因是人体运动灵活,模型可扩展性较差。《Flowing ConvNets for Human Pose Estimation in Videos》ICCV 20152015 年 flow convnet 将姿态估计看作是检测问题,输出是 heatm原创 2017-10-23 16:50:50 · 58545 阅读 · 22 评论