热点和趋势(2018-5)
卷积核方面
1)大卷积核用多个小卷积核代替(如1个55被2个33代替)。 既可以减少参数量,又可以增加网络的深度
2)单一尺寸卷积核用多尺寸卷积核代替(如Inception结构中,不同并行的分支用不同尺寸的卷积核)。
3)固定形状卷积核趋于使用可变形卷积核(包括dilate、Deformable)。
4)使用1×1卷积核(bottleneck结构,降低参数量)。
5)用卷积下采样代替Pooling层。
卷积层通道方面
1)标准卷积用depthwise卷积代替(来自Xception,就是将一个卷积操作分为一个空间的卷积核一个channel间的11卷积)。
2)使用分组卷积(Group conv。比如当input channel为256,output channel也为256,kernel size为33,不做group的conv参数为25633256,若group为8,每个group的input channel和output channel均为32,参数为83233*32,是原来的八分之一)。
3)分组卷积前使用channel shuffle(来自ShuffleNet);
4)通道加权计算(来自SEnet)。
卷积层连接方面
1)使用skip connection,让模型更深(如resnet)。
2)densely connection,使每一层都融合上其它层的特征输出(来自DenseNet)。
整体构架方面
1)全卷积网络(FCN)。
2)LSTMs/GRUs/RNN+CNN。
3)Siamese网络。
4)编码-解码器网络。
5)级联
流行的技术
1)ResNets/各种轻量网络。
2)GANs。
3)归一化(主要就是BN)。
4)度量学习
任务和研究方向
1)image segmentation。
2)image captioning。
3)Style Transfer/图像生成。
4)reinforcement learning。
5)加速训练的算法。
6)医疗
7)自动驾驶
前沿课题
1)算法越来越向全自动的方向发展,例如自适应的batch、自适应梯度…
2)主流研究是3D技术,包括3D人脸、3D姿态、3D手势等;
3)2D方面,在目标检测、分类等任务上,主要是对特定场景或对原先的网络进行修改,没有突破性进展。
4)文档图像处理、图像超分辨率
5)人脸方面,3D、编码解码模型、GAN的网络,表情
6)DL与传统机器学习趋于融合
例如:能谈一下你对Deep learning 和MRF、图模型或者贝叶斯结合这个方向的看法吗?
Deep learning和MRF以及图模型相结合的工作现在已经广泛运用于semantic segmentation和pose estimation等任务中。但现有的图模型仅仅局限于对于可观察变量(observable factors)的推理,比如pixel之间或者landmark/part之间的关系。
7)下一个前沿课题是NLP
AI最基本的两个要素是感知和认知,感知中的视觉和语言进展飞速,认知和语言理解却发展速度有限