Aggregated Residual Transformations for Deep Neural Networks
- CVPR 2017
- ResNet网络的升级版ResNeXt。
- Facebook的Ross Girshick;Kaiming He
用于识别任务.
Inception 系列网络有个问题:网络的超参数(核大小、通道数等)设定的针对性比较强,当应用在别的数据集上时需要修改许多参数,因此可扩展性一般。
增加 cardinality(基数,即NIN的数目,模型split-transform-merge的集合的数目,一个block里面,branches或者paths的个数) 比增加深度和宽度更有效。
创新点是 aggregrated transformations,用一种平行堆叠相同拓扑结构的blocks(对输入group)代替原来 ResNet 的三层卷积的block,在不增加参数量的情况下提升了模型的准确率,同时由于拓扑结构相同,超参数也减少了,便于模型移植。
SwGridNet: A Deep Convolutional Neural Network based on Grid Topology for Image Classification
- 2017年9月
-
- Tohoku Gakuin University(东北大学)【日】
用于分类;多径体系结构(先split,再通过不同unit,最后join)。
High-Resolution Shape Completion Using Deep Neural Networks for Global Structure and Local Geometry Inference
- 2017年9月
- LSTM-CF;3D-FCN;3D编码-解码器;高分辨率形状补全
- 香港大学;马萨诸塞大学【美】
3D形状重建(区别于场景重建,这个是单个实例的重建)。
AffordanceNet: An End-to-End Deep Learning Approach for Object Affordance Detection
-
- AffordanceNet;检测+box内的语义分割
- 阿德莱德大学(The University of Adelaide)【澳】;IIT【意大利】
解卷积层次序列,强大的调整大小策略和多任务损失函数。
SegFlow: Joint Learning for Video Object Segmentation and Optical Flow
- 2017年9月
-
- 清华;加州大学美熹德分校(简称为UCM)
同时预测视频中的语义分割和光流;双分支结构。
分割分支基于FCN,光流分支利用了FlowNet模型。引入光流提高了分割的性能,反之亦然。
Open Source Dataset and Deep Learning Models for Online Digit Gesture Recognition on Touchscreens
-
- 开源数据集
-
智能手机触摸屏上的数字数据集;用于Gesture Recognition(手势识别)。
Squeeze-and-Excitation Networks
- 2017年9月
- SENet
- Momenta(自动驾驶初创公司);牛津
提出SE模块,可用于大部分网络;其实就是给每个通道一个scale,该scale是由训练得到的。
Detecting the Moment of Completion: Temporal Models for Localising Action Completion
- 2017年10月
-
- 布里斯托大学【英】
行为检测中的检测完成时刻的模型;有两种,即HMM和LSTM;每一帧都是前段有一个CNN,后段更着一个HMM或LSTM;能将输入分为pre和post。