ResNet的特点?BN层的目的?模型验证的时候可以用BN吗?

ResNet(残差神经网络)

残差思想:主要目的是为了解决深度神经网络训练过程中的梯度消失和梯度爆炸问题,同时帮助网络更好地学习到特征表示,突出微小的变化,提高网络的性能和泛化能力。从而突出微小的变化

可以被用来训练非常深的网络

亮点

超深的网络结构

提出residual模块

使用Batch Normalization加速训练(丢弃dropout)

Residual结构
  1. 将原本的输入和经过卷积后的输出相加,要注意主分支与shortcut的输出特征矩阵shape必须相同

  2. 残差结构分为好几种,一种为不改变矩阵的长和宽,只改变深度;另外一种为改变矩阵的长和宽,也改变深度。对于不改变矩阵长宽和深度的,只需要直接把输入和输出相加就可以,如果改变了,则输入也要经过卷积后为同样形状方可加减。

Batch Normalization(数据标准化)

BN层的目的是使我们的一批feature map满足均值为0,方差为1的分布规律,从而可以加速收敛

  • 原本我们在输入数据的时候,比如图片处理像素特征,我们会对他进行归一化,使其满足某一分布规律,但经过层层的卷积后,feature map就不一定满足某一分布规律了,而数据标准化(BN)层的目的就是使输入的一批(batch)数据的 feature map满足均值为0,方差为1的分布规律
  • 注意事项:
    1. 训练时候将traning参数设置为true,验证时将trainning参数设置为False,因为训练的时候要统计均值和方差,trainning的时候就要使用之前统计的均值和方差。均值和方差是在正向传播过程中统计得到, γ β在反向传播中统计得到
    2. batch size 尽可能设置大点,设置小后表现可能很糟糕,越大求的均值核方差越接近整个训练集的均值和方差。
    3. 建议将bn层放在卷积层和激活层之间,且卷积层不要使用偏置bias,因为没有用。
迁移学习
  1. 能够快速训练出一个理想结果
  2. 当数据集较小时也能训练出理想效果

注意: 使用别人预训练模型参数时,要注意别人的预处理方式。

ResNeXt

更新了block模块,

通过对卷积过程改进,减少了参数量。

  • 10
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在PyTorch中,在迁移网络中添加Batch Normalization(BN)层的代码实现如下: 首先,我们假设已经加载了一个预训练的模型,现在需要在模型的某些层中添加BN层。下面是一个示例,假设我们要在模型的第一个卷积层后添加BN层: ```python import torch import torch.nn as nn import torchvision # 加载预训练的模型 model = torchvision.models.resnet18(pretrained=True) # 冻结模型的参数,只迁移权重 for param in model.parameters(): param.requires_grad = False # 在模型的第一个卷积层后添加BN层 model.conv1 = nn.Sequential( model.conv1, nn.BatchNorm2d(64) ) # 替换最后一层分类器(全连接层) num_features = model.fc.in_features model.fc = nn.Linear(num_features, num_classes) # 将模型发送到设备(如GPU) model = model.to(device) # 优化器和损失函数的定义 optimizer = torch.optim.SGD(model.parameters(), lr=0.001) criterion = nn.CrossEntropyLoss() # 训练和验证循环 for epoch in range(num_epochs): # 训练 model.train() for images, labels in train_loader: images = images.to(device) labels = labels.to(device) # 前向传播 outputs = model(images) loss = criterion(outputs, labels) # 反向传播和优化 optimizer.zero_grad() loss.backward() optimizer.step() # 验证 model.eval() with torch.no_grad(): correct = 0 total = 0 for images, labels in val_loader: images = images.to(device) labels = labels.to(device) # 前向传播 outputs = model(images) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() accuracy = 100 * correct / total print(f"Epoch {epoch+1}/{num_epochs} - Validation accuracy: {accuracy:.2f}%") ``` 在这个示例中,我们首先加载了一个预训练的ResNet-18模型。然后,我们冻结了所有参数,只迁移了权重。接下来,我们使用`nn.Sequential`将BN层添加到模型的第一个卷积层之后。然后,我们将最后的分类器层替换为具有正确输出数量的线性层。最后,我们定义优化器和损失函数。 在训练和验证循环中,我们首先将模型设置为训练模式,然后对于每个训练图像批次,进行前向传播、计算损失、反向传播和优化。然后,我们将模型设置为评估模式,并对验证集进行前向传播来计算准确度。最后,我们打印出每个epoch的验证准确度。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值