论文浏览(20) Video Classification with Channel-Separated Convolutional Networks


0. 前言

  • 相关资料:
  • 论文基本信息
    • 领域:行为识别
    • 作者单位:FAIR
    • 发表时间:ICCV 2019

1. 要解决什么问题

  • group convolution 在 2D 卷积中能够在不大幅度降低性能的前提下减少计算量。那么:
    • 在3D卷积神经网络中,group convolution 还起作用吗?
    • 3D group convolution 中什么参数最重要?
    • 使用3D group convolution 时,如何在计算量与准确率之间做平衡。

2. 用了什么方法

  • 提出了 Channel-Separated Convolution Network
    • 简单说,该网络只包含 1*1*1 普通3D卷积以及 k*k*k depthwise 卷积。
    • 如何理解:
      • 普通3D卷积同时实现了 channel interactions 和 local interactions。
        • 前者就是指融合 input 多个通道的信息得到 output。
        • 后者值得就是 2D 卷积中的 spatial 信息或3D卷积中的 Spatiotemporal 信息。
      • 而 Channel Separation 的目标就是将 channel interactions 与 local interactions 分开来处理,
      • 1*1*1 普通3D卷积用来处理 channel interactions,k*k*k depthwise 卷积用来处理 local interactions。
  • 新设计的 bottleneck 结构,分为两种:
    • interaction-preserved channel-separated bottleneck block,即保留了 channel interactions 的结构,如下图b所示。
    • interaction-reduced channel-separated bottleneck block,减少了 channel-interactions 的结构,如下图c所示。
    • image_1ed6v25meu901kl98iu1cipdi9.png-124.5kB
  • 另外一些卷积结构以及对应的变形结构(即使用了group convolution或depthwise convolution)
    • 下面这些设计其实借鉴了 ResNeXt(4b)、shufflenet(4d)、xception(3c)
    • image_1ed6vgl8ie59169s15ecjugl4l2t.png-78.3kB
    • image_1ed6vgt8d1su019g6110g14nq1rhe3a.png-103.5kB
  • 实验用的3d-resnet基本结构
    • image_1ed6vv9pq1dbc1vds1pou3p0vql44.png-113.9kB

3. 效果如何

  • 使用普通resnet以及CSN结构,对比性能
    • image_1ed6v6uq01js11me276v1p18hsem.png-90.6kB
    • 与当时的SOTA对比(结论就是,在accuracy比之前的结构好或持平的情况下,计算量减少2-3倍)
    • image_1ed6va77096lm3v1iljqdg1gb323.png-68.2kBimage_1ed6vafcn1emk15if1ae5g3e1sfo2g.png-168kB
  • 为什么 CSN 结构有效果?
    • 从下图给出的结果看,CSN的训练误差增加,但验证集误差减小,这是正则化的效果。
    • image_1ed6vom8c681dq4ngpkviluv3n.png-53.1kB

4. 还存在什么问题

  • 实验型论文,不多说话,就是做各种测试,说实话没什么创新性,但很实用,是我喜欢的类型。

  • 有复现,但slowfast/mmaction 中暂时没有(mmaction2即将开源CSN)。

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值