深度卷积神经网络的发展及其在计算机视觉领域的应用(综述型论文)
(简单总结)
作者:张顺,龚怡宏、王进军
摘要:本文主要讲了①卷积神经网络的发展历史,②深度卷积神经的原理,③卷积神经网络的代表性成果(分别从增加网络层数方面,增加数据集规模方面,改进训练方法方面介绍),④针对计算机视觉领域,介绍卷积神经网络在图像分类、目标检测、人脸识别、行人再识别、图像语义分割、图片标题生成、图像超分辨率、人体动作识别以及图像检索等方面的最新研究成果。
关键词:类脑智能;神经网络;深度学习;计算机视觉;视觉认知
DCNN相关技术:
1、增加网络层数:AlexNet -> ZF-net -> VGG net -> GoogleNet
2、增加训练数据集规模:增加训练样本数量;Data Augmention
3、正则化:L2正则化;Dropout;DropConnect和Maxout
4、其他改进训练的学习方法:
- 改进激活函数(Sigmoid函数,Tanh函数,ReLU,LReLU,PReLU);
- 定义不同的损失函数(Hinge损失,Contrastive损失);
- 其他常用技术(Batch Normalization)。
方向:
1、图像分类;2、目标检测;3、图像语义分割;4、图像标题生成;5、人脸识别;
6、行人再识别;7、图像超分辨率;8、人体动作识别;9、图像检索