6.2 ResNet
ResNet(Residual Neural Network)是由微软研究院何恺明等人提出的,该算法获得了2015年大规模视觉识别挑战赛的冠军。不仅如此,在ImageNet Detection、ImageNet Localization、COCO Detection等多项竞赛中,该模型也都获得过冠军。截止到本书写作为止,提出ResNet的文章已有约两万次的引用,有评价说,ResNet是过去几年中计算机视觉和深度学习领域最具开创性的工作,影响了这之后深度学习在学术界和工业界的发展方向。
6.2.1ResNet网络结构
在讲解ResNet网络结构之前,先介绍ResNet中的重要结构:残差学习模块。
0 1 ResNet的残差学习模块ResNet声名鹊起的一个很重要的原因是,它提出了残差学习的思想。图6.8为ResNet的一个残差学习模块,该模块包含多个卷积层,多个卷积层对这个残差学习模块的输入数据进行的变化,同时原始输入信息跳过多个卷积层直接传导到后面的层中,最终将的整体作为输入,并用激活函数激活,从而得到这个残差学习模块的输出结果。所以本质上是输出结果和输入结果之间的差值,即残差。ResNet学习的就是,因此ResNet又叫作残差网络。
图6.8 原论文中对残差学习模块的图解
0 2 残差学习模块的优势传统的卷积神经网络或者全连接网络,在信息传递时,或多或少会存在信息丢失、损耗等问题,同时还会导致梯度消失或梯度爆炸,使得很深的网络无法训练。ResNet通过提出残差学习的思想,在一定程度上解决了这个问题。通过将输入信息X“绕道”传导到输出,极大保护了信息的完整性,整个网络只需要学习输入、输出和残差部分,即