论文阅读笔记之——《Bilinear CNNs for Fine-grained Visual Recognition》

双线性定义:包含两个特征提取器,其输出经过外积(外积WiKi)相乘、池化后获得图像描述子。

通常情况下,在精细化的分类问题中,有两种方法:一是part-based model,通过定位关键部位并提取特征。二是holistic models,这种方式在整张图片上构造特征。

the accuracy of deep networks can be improved significantly by using two orders of magnitude more training data obtained by querying category labels (查询类别标签) on search engines.

 second-order aggregation of features from two different layers of a CNN is effective at fine-grained recognition.

(对于高阶特征,目前所看的paper几乎都是说有效,但是并没有给出深入的分析~~~)

这篇文章的主要思想是对于两个不同图像特征的处理方式上的不同。传统的,对于图像的不同特征,我们常用的方法是进行串联(连接),或者进行sum,或者max-pooling。论文的主要思想是,研究发现人类的大脑发现,人类的视觉处理主要有两个pathway, the ventral stream是进行物体识别的,the dorsal stream 是为了发现物体的位置。论文基于这样的思想,希望能够将两个不同特征进行结合来共同发挥作用,提高细粒度图像的分类效果。论文希望两个特征能分别表示图像的位置和对图形进行识别。论文提出了一种Bilinear Model。下面就是bilinear cnn model的示意图

 

 

参考资料:

https://blog.csdn.net/qq_32768091/article/details/84145088

 

 

 

 

 

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值