视频分类 S3D(separable 3D convolutions)模型及代码分析
S3D(separable 3D CNN)是ECCV 2018发表的关于视频分类模型,核心思想就是将原来的C3D网络替换为时域和空间域分离进行卷积的S3D网络,相比C3D网络,不仅模型参数量得到大幅减少,而且性能也得到提升。原文Rethinking Spatiotemporal Feature Learning:Speed-Accuracy Trade-offs in Video ClassificationIntroduction第一段,概述视频分类问题和现有数据集Sports-1M [5], Ki
原创
2020-08-11 16:51:50 ·
5873 阅读 ·
3 评论