最近在看细粒度识别相关的东西,主要记录下Bilinear Pooling 相关的东西
1. Bilinear CNN Models for Fine-grained Visual Recognition
篇幅和解释很多,实际上核心内容就是一个公式,
\begin{equation} \theta \label{eq:当前公式名} \end{equation}
文章里面写的用的是两个模型,实际上在大多数操作以及开源实现里面都是用的一个模型,即fa = fb,
1.1 Bilinear Pooling的意义
就是对于卷积出来的feature map, 和他的转置进行矩阵
1.2 Bilinear Pooling为什么有用
论文里面也解释了很多,关键词:pairwise interactions, orderless