B-CNNS算法重点内容理解

本文是对论文Bilinear CNNs for Fine-grained Visual Recognition重点内容的理解,由于本人小白,不当之处请指出。

  • B-CNN architecture
    网络CNN streamA擅长对物体/部件进行定位,局部区域检测,CNN streamB对A检测到的物体进行特征提取。两个网络相互协调作用,完成了细粒度图像分类过程中两个最重要的任务:物体、局部区域的检测与特征提取。
    B-CNN的架构如下:
    在这里插入图片描述如上图所示,模型Β由一个四元组组成:
    在这里插入图片描述
    其中,fA,fB代表特征提取函数,即图中的CNN streamA ,CNN streamB;P是一个池化函数(Pooling Function);C则是分类函数。特征提取函数f (•)的作用可以看作一个函数映射:
    在这里插入图片描述
    输入为图像I ∈ I 和 locationL∈ L,输出为KXD的feature。

Pooling Function函数P将所有位置的Bilinear特征汇聚成一个特征,表示Φ(I)。
在这里插入图片描述
fA,fB的特征是K × M 和 K × N,Φ(I)的特征是M × N。Bilinear特征是一种通用的图像表示,可以与分类器C一起使用。

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值