一、DeepPose
DeepPose:Human pose estimation via deep neural networks
使用7层CNN级联,不像以往设计图模型和部分检测器的模式,它使用了整个图作为一个整体输入网络
二、Learning human pose estimation features with networks
使用CNN部分检测器和MRF马尔科夫随机场空间模型联合训练
三、Mask RCNN
它可以做分割、分类、行人检测
分割的网络有:
1. MNC:
2015 COCO segmentation challenge champion
2. 全卷积实例分割Fully convolutional Instance-aware Semantic Segmentation
因为卷积具有移不变性,所以相同的像素点具有相同的响应,与它在语义中所处的位置无关。然而,实例感知的语义分割需要在区域级别上操作,不同区域的相同像素应该有不同的语义。单一的全卷积分割无法完成这个过程,需要一个移变特性的网络来解决这一问题。
现有语义分割网络弊端:
分割和分类单独分开进行;
分割子网络没有考虑同类物体不同实例的差异;
对于每一个ROI运行一次分割子网络,每个ROI网络计算并没有共享;
ROI Pooling应该使用更精确的对齐方式。
(a)传统的FCN做语义分割,对每个类别有一个score map;
(b)InstanceFCN 网络,对实例分割候选目标使用3*3的score map进行位置信息编码,后续使用专门的分类网络对分割候选框进行分类
(c)FCIS使用对内外位置信息敏感的score map同时得出mask 预测和类别分类。
……………………