Bilinear CNN Models for Fine-grained Visual Recognition 通过双线性CNN的细粒度模式识别

最新推荐文章于 2024-08-21 08:51:36 发布

陈煜嵘Yurong

最新推荐文章于 2024-08-21 08:51:36 发布

阅读量630

点赞数

本文链接：https://blog.csdn.net/weixin_43120238/article/details/109567076

版权

Abstract
双线性模型包括了两个特征提取网络，图像的特征表达随后通过对这两个特征提取网络的输出做外积然后池化而得到。该方法能更好地提取对细粒度分类有用的local pairwise特征。

Introduction

第一段：细粒度识别任务的挑战。

第二段：常用的方法包括检测目标的不同部位；缺点：标注比收集image更难/手工选取的part不是optimal的。

第三段：另一种方法：使用robust image representation，如VLAD、Fisher vector等。尽管这些方法不需要part-based label，但是精度很低。此外，这些方法还没有实现end-2-end训练。

第四段：我们提出的方法能很好的解决以上问题，模型包括了两个feature extractors，随后对这两个输出的feature maps的每一个location使用outer product/pooled而获得image descriptor。
Outer product可以caputre不同channel间的pairwise correlations，对model part-feature interaction是有帮助的。例如：一个extractor用于提取part，而另一个用于提取local feature，我们的方法能很好的将其两者结合。

第五段：实验。

Bilinear models for image classification

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

陈煜嵘Yurong

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

细粒度分类：B-CNN论文笔记——Bilinear CNN Models for Fine-grained Visual Recognition

qq_50001789的博客

06-23

615

论文题目：《Bilinear CNN Models for Fine-grained Visual Recognition》本文主要提出了用于聚合二阶统计数据的B-CNN架构，以矩阵外积的形式组合一幅图片的两种特征，使网络充分探索零件特征之间的交互关系，从而使网络更好地理解图像，进一步提高模型性能。

细粒度分类：Cross-X论文笔记——Cross-X Learning for Fine-Grained Visual Categorization

qq_50001789的博客

06-23

298

论文题目《Cross-X Learning for Fine-Grained Visual Categorization》本文提出了一种用于细粒度分类的Cross-X网络结构，通过探索不同图像、不同层特征之间的联系，来学习稳定的细粒度特征。通过围绕“相同语义部分的特征虽然来自不同类别的不同图像，但应该比不同语义部分的特征更相关”这一思想，设计了C3S正则化器来优化网络语义特征的提取能力，并且设计了CL损失来让网络学习更稳定的特征，提高了鲁棒性。

参与评论您还未登录，请先登录后发表或查看评论

Bilinear CNN Models for Fine-grained Visual Recognition

qq_41200212的博客

02-06

786

本文提出了双线性CNN，一种有效地将图像表示为两个CNN特征的池化外积的架构，该架构能有效用于细粒度识别任务中。这些模型捕获了局部的部件特征交互，类似于基于部件的模型，但也可以看作是一种无序的纹理表示。基于这种观察，本文提出了一类端到端可训练的双线性模型，这类模型在经典的图像表示上进行推广，如二阶池化、Fisher向量、局部聚合描述符和视觉词袋。这允许通过近似反演对学习到的模型进行特定领域的微调和可视化。通过大量的实验，本文展示了这些模型在各种细粒度、纹理和场景识别数据集上提供了更好的精度、速度和内存权衡。

双线性卷积神经网络（Bilinear CNN）实践指南

最新发布

gitblog_00618的博客

08-21

745

双线性卷积神经网络（Bilinear CNN）实践指南 bilinear-cnnPyTorch implementation of bilinear CNN for fine-grained image recognition项目地址:https://gitcode.com/gh_mirrors/bi/bilinear-cnn 项目介绍 双线性卷积神经网络，由HaoMood/bilinear-...

论文笔记之： Bilinear CNN Models for Fine-grained Visual Recognition

a1424262219的博客

05-30

1042

Bilinear CNN Models for Fine-grained Visual Recognition CVPR 2015 　　　　本文提出了一种双线性模型( bilinear models)，一种识别结构，该结构由两个特征提取器产生，两个输出是图像每一个位置的外积(outer product)，然后进行 pool，得到最终的图像描述算子。这种结构可以对局部 ...

Bilinear CNN Models for Fine-grained Visual Recognition论文总结

DBG的博客

11-16

9027

双线性定义：包含两个特征提取器，其输出经过外积(外积WiKi)相乘、池化后获得图像描述子。 -作者思路局部模型高效性的原因：本文中，作者声称局部推理的高效性在于其与物体的位置及姿态无关。纹理表示通过将图像特征进行无序组合的设计，而获得平移无关性。纹理表征性能不佳的思考：基于SIFT及CNN的纹理表征已经在细粒度物体识别上显示出高效性，但其性能还亚于基于局部模型的方法。其可能原因就是纹理表示的...

论文笔记--Bilinear CNN Models for Fine-grained Visual Recognition

qq_45542288的博客

01-09

258

在不使用边框信息的CUB-200-2011的训练结果上，加入平方根+l2归一化的准确率为75.1%，仅使用l2归一化时为71.7%，不进行归一化时为69.3%，具有巨大的性能差异，值得之后思考和实验尝试。具体的网络架构中，作者将两组不同的CNN分别称为M-Net和D-Net。在网络的前向传播过程中，输入图像在经过卷积网络，sum-pooling，square-root和l2归一化后，D-Net的输出大小为28x28，M-Net的输出大小为27x27。为了方便之后的合并，作者舍去了D-Net的一行和一列。

[2015-ICCV].Bilinear CNN Models for Fine-grained Visual Recognit

08-03

在细粒度视觉识别领域，Bilinear CNN Models for Fine-grained Visual Recognition提出了一种简单而有效的架构，称为Bilinear Convolutional Neural Networks（B-CNNs）。这种网络通过两个CNN提取的特征之间的外积...

Hierarchical Bilinear Pooling for Fine-Grained Visual Recognition论文笔记

DBG的博客

01-09

3459

大概多少

bilinear cnns for fine-grained visual recognition

04-06

《Bilinear CNNs for Fine-Grained Visual Recognition》是一篇用于细粒度视觉识别的研究论文。论文中提出了一种双线性卷积神经网络（B-CNN）的方法，可以在限制训练数据的情况下，有效地对具有较小视觉差异的目标...

Bilinear CNN Models for Fine-grained Visual Recognition-笔记

雪碧橙子

05-01

1621

我们提出一个新的识别结构：bilinear CNN，它是由两个特征提取器组成，它们的输出在对应的位置进行外积相乘，形成最好的图像表示。

matlab代码sqrt-bcnn:B-CNN：双线性CNN，用于细粒度的视觉识别

05-23

Matlab代码sqrt B-CNN：双线性CNN，用于细粒度的视觉识别由林宗玉，Aruni RoyChowdhury和Subhransu Maji在麻省大学阿默斯特分校创建介绍该存储库包含用于在B-CNN [ICCV 2015]和改进的B-CNN [BMVC 2017]论文中重现结果的代码： @inproceedings{lin2015bilinear, Author = {Tsung-Yu Lin, Aruni RoyChowdhury, and Subhransu Maji}, Title = {Bilinear CNNs for Fine-grained Visual Recognition}, Booktitle = {International Conference on Computer Vision (ICCV)}, Year = {2015} } @inproceedings{lin2017impbcnn, Author = {Tsung-Yu Lin, and Subhransu Maji}, Booktitle = {British Machine Visi

15-ICCV-Bilinear CNN Models for Fine-grained Visual Recognition

weixin_44742887的博客

04-02

955

Bilinear CNN（双线性） 1、特征学习方式：两个网络学习同一张图片 2、特征融合方式：对应位置的两个特征描述符求外积，所有位置求和池化（SCDA视角类似）传统的特征融合方法： sum/avg：只用了一阶信息。bilinear pooling 用了二阶统计信息，意在当一阶信息相同的时候利用二阶信息的不同来做分类。 feature concatenation：从代数上可以看做direct sum。 bilinear pooling可以看做direct product。特

论文笔记 | 基于双线性CNN模型的细粒度视觉识别

kangdk 视其所以，观其所由，察其所安。

01-11

1万+

细粒度视觉识别之双线性CNN模型 [1] Lin T Y, RoyChowdhury A, Maji S. Bilinear cnn models for fine-grained visual recognition[C]//Proceedings of the IEEE International Conference on Computer Vision. 2015: 1449-1457.

Bilinear CNN 《Bilinear CNNs for Fine-grained Visual Recognition》

jessican_uestc的博客

10-23

3258

Bilinear CNN 《Bilinear CNNs for Fine-grained Visual Recognition》深度学习成功的一个重要精髓，就是将原本分散的处理过程，如特征提取，模型训练等，整合进了一个完整的系统，进行端到端的整体优化训练。不过，在以上所有的工作中，我们所看到的都是将卷积网络当做一个特征提取器，并未从整体上进行考虑。最近，T.-Y. Lin、A.RoyChow...

深度学习图像处理：双线性CNN (Bilinear cnn)- 细粒度图像分类模型

qq_16236875的博客

03-07

1万+

定义:双线性CNN 包括两个特征提取器，其输出经过外积相乘，池化后获得图像描述子优点: 以平移不变的方式，对局部的对级(pairwise)特征交互建模；能够泛化多种顺序无关的特征描述子，如Fisher向量，VLAD（局部聚合向量，把图像表示为向量），O2P(使用二阶池化方法描述特) 。在实验中CNN 作为特征提取器的双线模型。 双线性形式简化了梯度计算，能够对两个网络在...

双线性卷积神经网络模型（Bilinear CNN)