Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

最新推荐文章于 2019-05-04 15:17:00 发布

_menglan_Zi

最新推荐文章于 2019-05-04 15:17:00 发布

阅读量1.8k

点赞数

分类专栏： cvpr Deep Learning 文章标签： classification fine-graind

本文链接：https://blog.csdn.net/zimenglan_sysu/article/details/71436579

版权

cvpr 同时被 2 个专栏收录

36 篇文章 0 订阅

订阅专栏

Deep Learning

29 篇文章 1 订阅

订阅专栏

笔者最近在关注fine-grained方面的paper，发现有以下的方面去做：

1 part-based

2 weakly-supervised的，如second-orderless pooling（Compact Bilinear Pooling）等

3 还是weakly-supervised的，但用上了proposals/grids/regions（如selective search）等，在网络中同时做classification和detection。

该论文Improving Facial Attribute Prediction using Semantic Segmentation, In arXiv， 2017.04.同样是怎么利用image-level的labels，如人脸属性来做人脸属性分类的。

本博文除了该论文，还会涉及到另外一篇论文Weakly Supervised Deep Detection Networks. In CVPR, 2016.

废话少说，当然细节的东西还是各自看论文去。

由于这次的重点不是说论文里面的face parsing。至于怎么做face parsing的，还是看论文去。上面的图1的一个前提条件是，已经训练好face parsing net的了，而且由这个net来提供face的parsing maps。在做face attr分类时，parsing maps直接resize到对应conv feature maps的大小。

图1的b）和c）挺有意思的，但是从论文上看SSG的作用不大。不管怎样，SSG和SSP的目的是，利用parsing的结果来refine分类模型学到的feature map，使得模型能够充分利用spatial information（一般的做法是在最后一层做global pooling，这显然是spatial orderless的）：即每个feature map只响应一个对应part region（这里用parsing来表示）。

笔者比较感兴趣的是SSP，所以在这里就说下Weakly Supervised Deep Detection Networks. In CVPR, 2016.

  这里需要弄清楚的一个概念是，detection branch，其实和classification branch是没有太大区别，区别在于如何做softmax的： 

  classification的目的是，判断该region会是哪个类别，而detection的目的是，判断某个类别会在哪些region出现，非常make sense。 

  这个就是网络的架构图，具体的细节看论文去。 

  整体上，这样做都是为了学到更好的特征，而且是在weakly-supervised的约束下。 

  至于有没有效果，就看你怎么用了。 

  ===== 

  如果这篇博文对你有帮助，可否赏笔者喝杯奶茶？ 

_menglan_Zi

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Improving Facial Attribute Prediction using Semantic Segmentation, in arxiv 2017.04

笔者最近在关注fine-grained方面的paper，发现有以下的方面去做：1 part-based2 weakly-supervised的，如second-orderless pooling（Compact Bilinear Pooling）等3 还是weakly-supervised的，但用上了proposals/grids/regions（如selective search）等
复制链接

扫一扫