论文阅读笔记之——《Compact Bilinear Pooling》

感觉跟之前看过的论文《实验笔记之——《Multi-scale Location-aware Kernel Representation for Object Detection》复现》很类似,通过kernel的近似来实现高维特征的提取

虽然bilinear 模型取得较好的performance,但是它的成本高(运算量、存储量)。为此作者提出一种紧凑型的bilinear model

Our proposed compact bilinear methods rely on the existence (存在) of low dimensional feature maps for kernel functions.

 

 

下面公式给出了bilinear pooling属于二阶的证明,但作者最终也仅仅说,二阶kernel的机制可以提升性能。跟大多数的高阶特征的paper一样。没有办法给出为什么高阶特征可以提升performance。所以对于高阶特征这个问题,一直都认为可解释性差。但从另外一个角度来说,高阶特征,特征的阶数越高,求梯度时,可以保留的信息越多?

作者通过kernel近似来实现降维

 

 

 

 

 

 

 

 

 

 

### 回答1: 紧凑双线性池化是一种用于计算机视觉中图像特征提取的技术。它可以将两个特征向量进行双线性池化,从而得到一个紧凑的特征向量,这个向量可以用于图像分类、目标检测等任务。相比于传统的双线性池化方法,紧凑双线性池化可以大大减少特征向量的维度,从而提高计算效率。 ### 回答2: Compact Bilinear Pooling(紧凑双线性池化)是一种用于图像分类和视觉问答等计算机视觉任务的高效特征融合技术。它可以将两个特征向量通过双线性映射方式快速融合为一个固定长度的特征向量,从而充分保留了两个特征向量中的所有信息。 Compact Bilinear Pooling是由微软研究院的维克托·拉津斯基等人提出的。在实际应用中,它可以提高模型的分类性能,同时减少了模型的计算和存储开销。 Compact Bilinear Pooling主要包括两个步骤:特征映射和特征池化。在特征映射阶段,对于两个输入特征向量,分别采用随机映射的方式将它们映射为高维空间中的特征图。在此基础上,采用双线性池化的方式将这两个特征图相乘并压缩成一个固定长度的向量,即为紧凑双线性池化后的特征向量。具体而言,双线性池化可以通过在空间和通道维度上应用矩阵乘法的方式来实现。 相对于其他特征融合方法,Compact Bilinear Pooling具有以下优点:1)保留输入特征向量的全部信息;2)能够快速生成紧凑的特征向量,减少了计算和存储开销;3)还可以通过改变随机映射的方式来进一步提高模型性能。但是,Compact Bilinear Pooling也存在一些局限性,比如需要大量的计算资源和训练数据支持。 ### 回答3: Compact bilinear pooling 是一种计算视觉特征的技术,它的主要目的是将原始的图像特征矩阵转换成一种紧凑的、固定维度的表示形式,从而能够更好地提高特征的表达能力。 这种技术的核心思想是将两个视觉特征图像进行双线性插值计算,从而得到一个紧凑的、固定维度的特征表示。具体来说,只需要对两个特征进行外积运算,然后将结果压缩成一个特征向量即可。在计算中,为了避免高维向量的计算和存储困难,通常会使用低秩矩阵分解的方法。 compact bilinear pooling 技术有很多的优点。首先,它比传统的卷积神经网络更具有表达能力。通过使用这种技术,可以更好地保留原始图像特征之间的交互作用,从而能够更好地捕捉图像中的细节信息。其次,它具有更小的存储空间需求。通过将特征压缩成固定长度的向量,可以大大减少存储空间和计算成本。 使用 compact bilinear pooling 技术可以对图像进行更好的特征提取和分类,因此在图像识别、人脸识别等领域具有广泛的应用前景。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值