【没有哪个港口是永远的停留~ 论文简读】SlowFast

code:https://github.com/facebookresearch/SlowFast 

论文:SlowFast Networks for Video Recognition

没打算研究,但看到了何凯明三个大拼音,闪瞎了我的狗眼

 一、模型长啥样?

 很直观

以 ResNets 为例,展示怎么设置网络结构

 很明显,转化的特点是:

  • Slow/Fast可以是不同的任何模型
  • 找尺寸相同的靠后层做几个侧链接,res4&res5  (前面层的加上不准)
  • Fast要快,所以模型要小,Slow就正常就行
  • slow:每16帧取1帧,fast:  每2帧取1帧

Slow 和 Fast 是怎么融合的?

  • Time-to-channel: {αT, S2,βC} -> {T, S2, αβC},也就是原来多出来的时间维度,都当成通道了
  • Time-strided sampling:  {αT, S2, βC} -> {T, S2, βC},取α帧中的一帧来跟slow融合
  • Time-strided convolution: stride = α的3D卷积。卷积核5x1x1 ,通道数=2βC

后面接分类结构就是分类模型。接检测结构就是个检测的模型 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值