源地址:http://blog.csdn.net/sheng_ai/article/details/39022229
一.文献名字和作者
PANDA: Pose Aligned Networks for Deep Attribute Modeling, Ning Zhang, Manohar Paluri, Marc’Aurelio Ranzato, Trevor Darrell, Lubomir Bourdev, CVPR2014
二.阅读时间
2014年11月25日
三.文献的目的
解决人的属性分类问题,同时,也解决使用CNN进行训练时需要大量训练样本的问题。
四.文献的贡献点
文献提出了一种结合CNN和Part-base方法的人体属性分类算法,通过将图片划分为小块,从而使得CNN能够更加方便地训练,从而可以从较小的数据集中学习到强大的形态归一化的特征。
五.解决的问题
1.part-based方法只能在图像块中使用底层特征,作者提出了使用CNN作为特征提取器,从而能够学到高层次的特征;
2.CNN需要大量的训练样本进行训练,为了解决这个问题,作者使用每一个poselet的激活值作为一个单独的训练样本;
3.由于人体的不同部分对于相同的信号有不同的反应,因此,使用局部块获得的信息不能表征人的属性,为了解决这个问题,作者在使用局部块获得特征之后,在最后又将这些特征组合起来。
4.由于postlet不能覆盖这个图片以及一些退化的图片而已,拥有较少的poselets检测器,为了解决这个问题,作者提出了将图片中整个人体区域的bounding box区域作为最终的姿态归一化特征的输入。
5.在实验的过程中,作者发现使用整个人体区域的话,需要一个复杂的CNN,因此,作者使用用Imagenet训练的CNN作为整个人体区域的特征提取器。
六.作者提出的方法
作者提出了一种使用CNN作为局部区域的特征提取器,然后将提取到的特征进行融合,最后使用线性SVM作为分类器,从而产生属性分类器。
七.实验结果
八.使用的数据库
1.The Berkeley Human Attributes Dataset
2.Attributes 25K Dataset