![751b10e24002993b32994b4ae1d95091.png](https://i-blog.csdnimg.cn/blog_migrate/28c0d1816eb450141509b99d89614bd5.jpeg)
最近看了一系列bilinear pooling相关的文章,感觉有些文章写得比较抽象。费了不少功夫总算理顺了这些文章的关系,这里简单写个笔记记录一下~
- 简介
bilinear pooling在2015年于《Bilinear CNN Models for Fine-grained Visual Recognition》被提出来用于fine-grained分类后,又引发了一波关注。bilinear pooling主要用于特征融合,对于从同一个样本提取出来的特征
如果特征
原始的Bilinear Pooling存在融合后的特征维数过高的问题,融合后的特征维数=特征
![43eaf040a4ee24884bf5f60011063e79.png](https://i-blog.csdnimg.cn/blog_migrate/9aa2041843d8b5cb3d02ab1619a2e1dd.jpeg)
本文将包括以下内容:
- 对bilinear pooling进行详细介绍,便于读者理解原文;
- 建立bilinear pooling到bilinear model的联系,便于读者理解以MLB为核心的bilinear model相关文章。
- 快速介绍对bilinear pooling的各种改进形式。
- bilinear pooling详解
这里参考《Bilinear CNN Models for Fine-grained Visual Recognition》,CVPR 2015一文,给出bilinear pooling的详细定义。
对于图像
直观上理解,所谓bilinear pooling,就是先把在同一位置上的两个特征双线性融合(相乘)后,得到矩阵
![c1c2b70ab480a0399ae167862a711db1.png](https://i-blog.csdnimg.cn/blog_migrate/a22a795bcdfa177bef5c4968f958414e.jpeg)
对于我们熟悉的图像特征,