深度学习中的高阶特征

  • 由于自己研究方向为基于高阶的图像分类,故在这里对相关论文做一个简单的划分和总结。
  • 按照计算高阶的层,位于卷积神经网络的位置划分,可以分为:
    • 网络末端
    • 网络中部
2022-05-24 update
  • (CVPR 2022) Deep Brownian Distance Covariance for Few-Shot Classification Project | code | pdf

网络末端

B-CNN(ICCV 2015)
  • 这个直接看论文中的图,就很容易看懂原理,高阶主要体现在bilinear vector的获得,计算的feature map的二阶操作。
    B-CNN
MPN-COV(Matrix Power Normalization covariance pooling)(ICCV 2017)
  • 这篇工作主要是着眼于大规模的数据集情况下,使用高阶信息。如果只看方法图的话,也比较容易理解,但是因为要考虑到End-To-End,所以高阶特征的反向传播,需要自己推导,因为这个深度学习框架目前没有实现。
  • 后续工作:Fast-MPN(CVPR 2018) 通过 iterative matrix square root normalization method 实现在GPU上快速地计算SVD或者EIG.
    MPN-COV
G 2 ^2 2DeNet

网络中部

SORT: Second-Order Response Transform for Visual Recognition(ICCV 2017)
  • 这篇论文工作,看方法图,比较简单。
    SORT
Global Second-order Pooling Convolutional Networks(CVPR 2019)
  • 这篇工作相当于将高阶和注意力机制在网络中部地方结合起来,即简单又有效。
    GSoP

最近顶会看高阶

ICCV 2019
Mixed High-Order Attention Network for Person Re-Identification
  • 该篇工作主要亮点是结合注意力机制高阶两者
  • 具体高阶用法:
    在这里插入图片描述
Second-order Non-local Attention Networks for Person Re-identification
  • 该工作主要结合Non-local attention和second order做re-identification,可以更加有效地对long-range relationships建模
  • 主要方法框架为:
    在这里插入图片描述
CVPR 2019
Second-order Attention Network for Single Image Super-Resolution
  • 如果仔细阅读论文,就会发现所有的操作是无比的熟悉😅
  • 该工作主要是将B-CNN,SENet和Fast-MPN-COV结合起来应用在生成高清图像上
  • 主要方法框架为:
    在这里插入图片描述

当然,还有很多工作,我这里并没有给出,有些论文也有相关源码,我会在后续中给出,不过GitHub上也都能搜到。有啥不足和改进之处,还请指出!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值