双线性池化_用于细粒度识别的双线性论文阅读汇总(实时更新)

1.简介

双线性池化是 2015 年在《Bilinear CNN Models for Fine-grained Visual Recognition》首次用于细粒度识别,随后更是出现了一系列双线性算法的改进。双线性池化主要用于特征融合,对于同一样本提取的特征 x 和 y,通过 bilinear pooling 融合特征获得更具有表征能力的特征描述符。如果 x 和 y 来自于不同特征提取器,则称之为多模双线性池化,如果来自同一个特征提取器则称之为同源双线性池化或者二阶池化。

2.各种双线性池化

2.1 原始 bilinear pooling——《Bilinear CNN Models for Fine-grained Visual Recognition》

语言描述就是在说对两个特征在每个 location 上(共有 h*w 个 location)的 c 维向量做外积融合得到矩阵 b,对所有 location 上的 b 做和池化得到矩阵\phi,为什么是和池化而不是最大或平均池化应该是因为最大池化损失的信息量最少,再把\phi拉伸成c_ac_b维向量 x,记为 bilinear vector。最后对 x 做符号平方根运算得到 y,对 y 做 L2 归一化得到最终特征 z 输入到分类网络进行分类。

总结:bilinear pooling 之所以取得了不错的效果是融合了一阶特征得到高维的二阶特征从而包含更多的信息量,由于是对所有 location 做和池化所以还具有平移不变性但由于其巨大的维度导致性能低下无法在实际中应用,比如原文的 feature map 通道数为 512,那么最后的特征有 26K 的维度。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值