经典网络模型-ResNet

背景

对于常规网络,随着网络层级的不断增加,模型精度不断得到提升,而当网络层级增加到一定的数目以后,训练精度和测试精度迅速下降,这说明当网络变得很深以后,深度网络就变得更加难以训练了。由于神经网络在反向传播过程中要不断地传播梯度,而当网络层数加深时,梯度在传播过程中会逐渐消失(假如采用Sigmoid函数,对于幅度为1的信号,每向后传递一层,梯度就衰减为原来的0.25,层数越多,衰减越厉害),导致无法对前面网络层的权重进行有效的调整。


简介

ResNet引入了残差网络结构(residual network),通过这种残差网络结构,可以把网络层弄的很深(据说目前可以达到1000多层),并且最终的分类效果也非常好,残差网络的基本结构如下图所示

通过“shortcut connections(捷径连接)”的方式,直接把输入x传到输出作为初始结果,输出结果为H(x)=F(x)+x,ResNet相当于将学习目标改变了,不再是学习一个完整的输出,而是目标值H(X)和x的差值,也就是所谓的残差F(x) := H(x)-x,因此,后面的训练目标就是要将残差结果逼近于0,使到随着网络加深,准确率不下降。

  • 实线的Connection部分,表示通道相同,如上图的第一个粉色矩形和第三个粉色矩形,都是3x3x64的特征图,由于通道相同,所以采用计算方式为H(x)=F(x)+x
  • 虚线的的Connection部分,表示通道不同,如上图的第一个绿色矩形和第三个绿色矩形,分别是3x3x64和3x3x128的特征图,通道不同,采用的计算方式为H(x)=F(x)+Wx,其中W是卷积操作,用来调整x维度的。

除了两层残差学习单元,还有三层的残差学习单元,如下图所示: 

两种结构分别针对ResNet34(左图)和ResNet50/101/152(右图),其目的主要就是为了降低参数的数目。左图是两个3x3x256的卷积,参数数目: 3x3x256x256x2 = 1179648,右图是第一个1x1的卷积把256维通道降到64维,然后在最后通过1x1卷积恢复,整体上用的参数数目:1x1x256x64 + 3x3x64x64 + 1x1x64x256 = 69632,右图的参数数量比左图减少了16.94倍,因此,右图的主要目的就是为了减少参数量,从而减少计算量
对于常规的ResNet,可以用于34层或者更少的网络中(左图);对于更深的网络(如101层),则使用右图,其目的是减少计算和参数量。

 

ResNet在ILSVRC2015竞赛中惊艳亮相,将网络深度提升到152层,将错误率降到了3.57,在图像识别错误率和网络深度方面,比往届比赛有了非常大的提升,ResNet毫无悬念地夺得了ILSVRC2015的第一名 。

 

 参考链接:大话深度残差网络(DRN)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
BiT-ResNet网络模型和ResNet网络模型都是深度卷积神经网络,用于提取图像特征,但BiT-ResNet网络模型对ResNet网络模型进行了改进。 首先,我们来了解一下ResNet(残差网络模型。在传统的神经网络中,随着网络深度的增加,梯度消失和梯度爆炸等问题可能会变得更加严重。为了解决这些问题,ResNet提出了残差模块(Residual Block)和残差路径(Residual Path)的概念。在残差模块中,通过引入恒等映射(identity mapping)的思想,在网络中插入了一个恒等的非线性变换,使得输入可以直接通过网络而不需要进行参数化。这种设计可以有效地解决梯度消失和梯度爆炸问题,使得深度神经网络可以更好地学习到图像的特征。 在提取图像特征时,ResNet模型通过残差模块将输入图像映射到原始特征图上,同时保留了原始特征图的信息。通过这种方式,ResNet模型可以有效地提取出图像中的特征信息,并且可以更好地处理深度较大的神经网络。 接下来,我们来看一下BiT-ResNet网络模型对ResNet网络模型的改进。BiT-ResNet模型主要通过以下几种方法对ResNet模型进行了改进: 1. 改进了残差模块的设计:在BiT-ResNet模型中,对残差模块进行了改进,采用了局部残差模块(Local Residual Block)的设计,通过使用局部感受野和跨层连接等机制,更好地捕捉图像的局部特征和深度信息。 2. 提出了批量归一化技术:BiT-ResNet模型在残差模块中引入了批量归一化技术,以进一步改善模型的性能。批量归一化技术可以有效地改善模型的训练过程,提高模型的稳定性、收敛速度和精度。 3. 优化了模型的架构:BiT-ResNet模型对ResNet模型的架构进行了优化,例如采用了更小的卷积核和跳跃连接等机制,以更好地捕捉图像的局部和全局特征。 综上所述,BiT-ResNet网络模型通过对残差模块、批量归一化技术和模型架构的改进,进一步提高了ResNet模型在提取图像特征方面的性能。这些改进有助于更好地捕捉图像的局部和全局特征,提高模型的泛化能力和精度。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值