深度学习之——ResNet算法

最新推荐文章于 2024-09-14 22:29:06 发布

Shudsa

最新推荐文章于 2024-09-14 22:29:06 发布

阅读量1.1k

点赞数 15

文章标签：深度学习 cnn 神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Shudsa/article/details/134678233

版权

ResNet是2015年ImageNet比赛冠军，解决了深度神经网络层数增加导致训练误差上升的问题。通过残差结构，使网络能够有效学习，避免梯度消失。ResNet包含卷积批归一化块ConvBNLayer和残差块BottleneckBlock，通过1x1、3x3卷积层及批量归一化实现。模型结构设计包括短路机制，允许信息直接传递，提高了深层网络的训练效果。

摘要由CSDN通过智能技术生成

ResNet是2015年ImageNet比赛的冠军，将识别错误率降低到了3.6%，这个结果甚至超出了正常人眼识别的精度。

在神经网络模型的发展中，模型的层数逐渐增多，但是在增加模型层数后对应的训练误差并没有一直减小，反而出现了训练误差不降反升的现象。

因此提出了残差网络ResNet来解决这个问题。

ResNet的思想模型：

原模型为y=F(x)表示增加网络时将x映射成y=F(x)输出，但是对原模型改进为y=F(x)+x，只要将x的参数设为0，则与原模型一致。改进后F(x)=y-x,叫做残差项。

2.残差单元的构建

在构建残差单元时通过在进入指定卷积层如3*3的卷积层之前利用1*1的卷积层处理来减少通道数，然后在经过该3*3卷积层之后再通过一个1*1的卷积层来恢复通道数。先这样256->64->256这样类似一个瓶颈的形状，所以被称为“BottleNeck”。

首先要构建一个卷积批归一化块ConvBNLayer包含卷积层和BatchNorm层。

def __init__(self,
num_channels,
num_filters,
filter_size,
stride=1,
groups=1,
act=None):
super(ConvBNLayer, self).__init__()
# 创建卷积层
self._conv = nn.Conv2D(
in_channels=num_channels,
out_channels=num_filters,
kernel_size=filter_size,
stride=stride,
padding=(filter_size - 1) // 2,
groups=groups,
bias_attr=False)

通过初始化函数_init_来接受了了一些参数 num_channels,（卷积层的输入通道数）num_filters,（卷积层的输出通道数），stride（卷积层的步幅）groups（分组卷积的组数）然后用这些数据构建了一个二维卷积层

self._batch_norm = paddle.nn.BatchNorm2D(num_filters)
self.act = act

接着创建了一个BatchNorcm2D层对卷积层的输出进行批归一化操作。

def forward(self, inputs):
y = self._conv(inputs)
y = self._batch_norm(y)
if self.act == 'leaky':
y = F.leaky_relu(x=y, negative_slope=0.1)
elif self.act == 'relu':
y = F.relu(x=y)
return y

在传播函数forward中，它首先将输入inputs通过卷积层和批归一化层进行计算，并将结果保存到变量y中。然后根据激活函数类型act的不同选择使用LeakyReLU或ReLU函数对y进行激活。最后返回激活后的结果y。

卷积批归一化块ConvBNLayer构建完成后，就可以定义残差块BottleneckBlock：

首先初始化函数，用来接收参数num_channels（输入通道数）,num_filters（卷积核步数），stride（步长），shortcut=True

def __init__(self,
num_channels,
num_filters,
stride,
shortcut=True):
super(BottleneckBlock, self).__init__()

然后分别创建三个卷积层：

# 创建第一个卷积层 1x1
self.conv0 = ConvBNLayer(
num_channels=num_channels,
num_filters=num_filters,
filter_size=1,

最低0.47元/天解锁文章

关注

15
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Shudsa CSDN认证博客专家 CSDN认证企业博客

码龄1年

15: 原创

138万+: 周排名

27万+: 总排名

6356: 访问

: 等级

213: 积分

36: 粉丝

63: 获赞

7: 评论

58: 收藏

私信

关注

热门文章

最新评论

机器学习之——支持向量机
CSDN-Ada助手: 首先恭喜您写了第15篇关于机器学习支持向量机的博客，您对这个领域的深入研究和总结让人印象深刻。接下来，我建议您可以考虑在博客中加入一些实际案例或者应用场景，这样可以帮助读者更好地理解支持向量机的实际应用。同时也希望您能继续坚持创作，分享更多有价值的内容，期待您的下一篇博客！
深度学习之——目标检测基础
CSDN-Ada助手: 恭喜你写了第12篇博客！你对深度学习目标检测的基础知识有着很好的理解，文章内容清晰易懂，让我受益匪浅。希望你可以继续保持创作的热情，可以考虑写一些深度学习目标检测的实际应用案例，或者深入探讨一些相关算法的原理，这样可以让读者更加全面地了解这个领域。期待你的下一篇作品！
深度学习之线性回归实现
CSDN-Ada助手: 恭喜您撰写了关于深度学习中线性回归实现的博客，内容详实，让人受益匪浅。希望您能继续分享更多关于深度学习的知识，比如其他常见的模型或者实际应用案例，这样可以让更多人受益。期待您的下一篇作品！
深度学习之——MLP实现
CSDN-Ada助手: 恭喜你在博客上分享了关于深度学习中MLP实现的文章！我非常欣赏你对这个话题的深入探讨和分享。不过在下一篇博客中，我希望你可以进一步深入探讨MLP实现中的一些挑战和解决方案，这样可以为读者提供更多有用的信息。期待你的下一篇精彩文章！
基于hough变换的图像边缘提取
CSDN-Ada助手: 恭喜作者在博客中分享了基于hough变换的图像边缘提取的内容，这是一个非常有趣和实用的技术。希望作者能够继续坚持创作，分享更多关于图像处理和计算机视觉方面的知识。或许下一步可以探讨一些实际案例，展示如何将这些技术运用到实际项目中，让读者更好地理解和应用。期待作者的下一篇作品！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。