Is Second-order Information Helpful for Large-scale Visual Recognition?

本文探讨了在大规模视觉识别任务中,除了深度和宽度网络结构外,二阶信息的重要性。研究发现,一阶信息处理在某些场景下不足,而二阶信息能够提供更丰富的统计和几何信息。文章提出了一种名为MPN-COV的方法,通过矩阵幂归一化协方差来改进分类,并在ImageNet 2012数据集上进行了验证。尽管推导过程复杂,但该工作揭示了二阶信息可能带来的性能提升。
摘要由CSDN通过智能技术生成

Is Second-order Information Helpful for Large-scale Visual Recognition?
这篇文章指出,目前state of art都在探寻又深又宽的网络结构,鲜少探究feature分布的信息,对feature做pooling等等只是对于一阶信息的处理,它往往快速有效,但对于所有情况并不适用。比如我们的有些选择需要方差小的样本,但是一阶信息并不能给出而feature的分布信息,所以这里需要二阶信息。
这里主要有三点贡献:

  1. 第一批尝试利用高于一阶的统计量来改进大规模分类的人。提出了一种矩阵幂归一化协方差法,给出了非线性矩阵函数的正向和反向传播公式,实现了端到端MPN-COV网络。
  2. 从统计、几何和计算的角度对MPN-COV进行了解释,解释了MPN-COV能够应对上述挑战的潜在机制。
  3. 在ImageNet 2012数据集上,我们对MPN-COV进行了深入的评估,验证了我们的数学推导和理解。

额,这篇论文涉及很多矩阵论以及概率论的东西,我断断续续看了快两周,真滴菜,还是没整明白,最后放弃推导了,大家知道有这么个操作就完事了(?‍♀️)
总而言之,他对feature map做了协方差,而且对这个协方差做了一个norm的操作,这里就是求
在这里插入图片描述

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值