残差网络--概念、作用、原理、优缺点以及简单的示例代码

最新推荐文章于 2024-08-13 19:58:57 发布

Ambition_LAO

最新推荐文章于 2024-08-13 19:58:57 发布

阅读量520

点赞数 7

文章标签：深度学习神经网络

本文链接：https://blog.csdn.net/GDHBFTGGG/article/details/141162838

版权

概念

残差网络（Residual Network，简称ResNet）是一种深度神经网络架构，由Kaiming He等人在2015年提出。其核心思想是通过引入"快捷连接"（skip connection）或称为"残差连接"（residual connection）来解决深度神经网络训练中的退化问题。

作用

随着神经网络层数的增加，训练深层网络会遇到退化问题，即网络层数增加并不能提高性能，甚至导致训练误差变大。残差网络通过引入残差连接，使得网络能够更容易地训练深层网络，从而有效地解决了退化问题。具体来说，残差连接可以让网络的层学到输入和输出之间的"残差"，使得信息可以直接从前一层传递到后一层，而不会被后续层所影响。

原理

在普通的深度神经网络中，假设某一层的输入为x，网络经过一个变换（如卷积、批归一化、激活等）后得到输出F(x)。在残差网络中，这一层的输出变为F(x) + x，其中x是输入，F(x)是通过某些层的计算得到的变换。这个形式称为"残差块"（residual block）。

残差块的主要思想是，通过快捷连接将输入x直接传递到输出，这样网络实际上学到的是一个残差函数F(x)，而不是直接学到y = H(x)。这样做的好处是，如果这个残差非常小，网络可以自动调整为接近恒等映射，从而减轻了深层网络中梯度消失和梯度爆炸的问题。

优缺点

优点：

易于训练深层网络：通过引入残差连接，深层网络的训练变得更加容易，能够训练比以往更深的网络结构。
避免梯度消失和梯度爆炸：残差网络在一定程度上缓解了梯度消失和梯度爆炸问题。
提高性能：在多个计算机视觉任务中，残差网络都表现出了优越的性能。

缺点：

复杂性增加：虽然残差连接可以改善训练效果，但它也增加了网络的复杂性，尤其是在超参数调优方面。
潜在的冗余：网络在某些情况下可能会出现冗余，即在某些层中，残差可能并未真正被利用。
计算开销增加：虽然残差连接能加速训练，但也可能增加计算开销，尤其是在非常深的网络中。

代码示例

以下是一个简单的PyTorch代码示例，用于构建一个包含残差块的网络：

import torch
import torch.nn as nn
import torch.nn.functional as F

class BasicBlock(nn.Module):
def __init__(self, in_channels, out_channels, stride=1):
super(BasicBlock, self).__init__()
self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size=3, stride=stride, padding=1, bias=False)
self.bn1 = nn.BatchNorm2d(out_channels)
self.conv2 = nn.Conv2d(out_channels, out_channels, kernel_size=3, padding=1, bias=False)
self.bn2 = nn.BatchNorm2d(out_channels)

# 如果输入和输出的通道数不一致或者stride不为1，使用1x1卷积调整
if stride != 1 or in_channels != out_channels:
self.shortcut = nn.Sequential(
nn.Conv2d(in_channels, out_channels, kernel_size=1, stride=stride, bias=False),
nn.BatchNorm2d(out_channels)
)
else:
self.shortcut = nn.Sequential()

def forward(self, x):
out = F.relu(self.bn1(self.conv1(x)))
out = self.bn2(self.conv2(out))
out += self.shortcut(x) # 残差连接
out = F.relu(out)
return out

class ResNet(nn.Module):
def __init__(self, num_classes=10):
super(ResNet, self).__init__()
self.layer1 = self._make_layer(3, 64, stride=1)
self.layer2 = self._make_layer(64, 128, stride=2)
self.layer3 = self._make_layer(128, 256, stride=2)
self.layer4 = self._make_layer(256, 512, stride=2)
self.fc = nn.Linear(512, num_classes)

def _make_layer(self, in_channels, out_channels, stride):
return nn.Sequential(
BasicBlock(in_channels, out_channels, stride),
BasicBlock(out_channels, out_channels, stride=1)
)

def forward(self, x):
out = self.layer1(x)
out = self.layer2(out)
out = self.layer3(out)
out = self.layer4(out)
out = F.avg_pool2d(out, 4)
out = out.view(out.size(0), -1)
out = self.fc(out)
return out

# 创建网络实例
net = ResNet(num_classes=10)

# 打印网络结构
print(net)

代码说明

BasicBlock类实现了残差块，包括卷积层、批归一化层和快捷连接。
ResNet类是一个简单的残差网络，它包含了4个残差层和一个全连接层，用于分类任务。
forward函数实现了前向传播过程，包括残差连接的应用。

这个代码示例展示了如何使用PyTorch构建一个基本的残差网络结构，能够用于简单的分类任务。根据实际需求，残差网络的深度和复杂度可以进一步调整。

Ambition_LAO

关注

7
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
残差网络--概念、作用、原理、优缺点以及简单的示例代码

残差网络（Residual Network，简称ResNet）是一种深度神经网络架构，由Kaiming He等人在2015年提出。其核心思想是通过引入"快捷连接"（skip connection）或称为"残差连接"（residual connection）来解决深度神经网络训练中的退化问题。
复制链接

扫一扫