python 正则化_Python学习笔记：正则化,pytorch

最新推荐文章于 2024-05-06 23:59:04 发布

weixin_39658474

最新推荐文章于 2024-05-06 23:59:04 发布

阅读量177

点赞数

文章标签： python 正则化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39658474/article/details/113642809

版权

本文介绍了PyTorch中L2正则化、Dropout和Batch Normalization的使用。Dropout通过在训练时随机失活部分神经元增强网络泛化能力，Batch Normalization则对数据进行标准化处理，以0均值1方差为目标，同时通过gama和beta参数允许网络自我调整数据是否需要标准化。文中通过实例展示了nn.BatchNorm1d、nn.BatchNorm2d和nn.BatchNorm3d的运行过程。

摘要由CSDN通过智能技术生成

1、L2正则化(权重衰减)

2、Dropout

相当于训练了多个网络，测试时综合了多个网络的结果，使得网络泛化能力更强

需要注意的一点是测试时需要对网络输出乘以(1-失活概率P)，可以理解为假设训练时有30个神经元失活，因此训练时的输出为70个神经元的加权和，而测试时所有的100个神经元均会参与运算，那么数据的输出尺度发生了变化，因此需要乘以一项来抵消数据输出尺度的变化。

3、Batch Normalization

将一批数据的特征分布标准化为0均值1方差

引入gama和beta是为了提高模型的capacity ，可以让网络自己判断数据是否需要标准化，比如如何γ=标准差，β=均值，则相当于没有做任何处理。

分母修正项：为了避免分母为0产生错误

import torch

import numpy as np

import torch.nn as nn

from tools.common_tools import set_seed

set_seed(1) # 设置随机种子

# ======================================== nn.BatchNorm1d

# flag = 1

flag = 0

if flag:

batch_size = 3

num_features = 5

momentum = 0.3

features_shape = (1)

feature_map = torch.ones(features_shape) # 1D

feature_maps = torch.stack([feature_map*(i+1) for i in range(num_features)], dim=0) # 2D

feature_maps_bs = torch.stack([feature_maps for i in range(batch_size)], dim=0) # 3D

print("input data:\n{} shape is {}".format(feature_maps_bs, feature_maps_bs.shape))

bn = nn.BatchNorm1d(num_features=num_features, momentum=momentum)

running_mean, running_var = 0, 1

for i in range(2):

outputs = bn(feature_maps_bs)

print("\niteration:{}, running mean: {} ".format(i, bn.running_mean))

print("iteration:{}, running var:{} ".format(i, bn.running_var))

mean_t, var_t = 2, 0

running_mean = (1 - momentum) * running_mean + momentum * mean_t

running_var = (1 - momentum) * running_var + momentum * var_t

print("iteration:{}, 第二个特征的running mean: {} ".format(i, running_mean))

print("iteration:{}, 第二个特征的running var:{}".format(i, running_var))

# ======================================== nn.BatchNorm2d

flag = 1

# flag = 0

if flag:

batch_size = 3

num_features = 6

momentum = 0.3

features_shape = (2, 2)

feature_map = torch.ones(features_shape) # 2D

feature_maps = torch.stack([feature_map*(i+1) for i in range(num_features)], dim=0) # 3D

feature_maps_bs = torch.stack([feature_maps for i in range(batch_size)], dim=0) # 4D

print("input data:\n{} shape is {}".format(feature_maps_bs, feature_maps_bs.shape))

bn = nn.BatchNorm2d(num_features=num_features, momentum=momentum)

running_mean, running_var = 0, 1

for i in range(2):

outputs = bn(feature_maps_bs)

print("\niter:{}, running_mean.shape: {}".format(i, bn.running_mean.shape))

print("iter:{}, running_var.shape: {}".format(i, bn.running_var.shape))

print("iter:{}, weight.shape: {}".format(i, bn.weight.shape))

print("iter:{}, bias.shape: {}".format(i, bn.bias.shape))

# ======================================== nn.BatchNorm3d

# flag = 1

flag = 0

if flag:

batch_size = 3

num_features = 4

momentum = 0.3

features_shape = (2, 2, 3)

feature = torch.ones(features_shape) # 3D

feature_map = torch.stack([feature * (i + 1) for i in range(num_features)], dim=0) # 4D

feature_maps = torch.stack([feature_map for i in range(batch_size)], dim=0) # 5D

print("input data:\n{} shape is {}".format(feature_maps, feature_maps.shape))

bn = nn.BatchNorm3d(num_features=num_features, momentum=momentum)

running_mean, running_var = 0, 1

for i in range(2):

outputs = bn(feature_maps)

print("\niter:{}, running_mean.shape: {}".format(i, bn.running_mean.shape))

print("iter:{}, running_var.shape: {}".format(i, bn.running_var.shape))

print("iter:{}, weight.shape: {}".format(i, bn.weight.shape))

print("iter:{}, bias.shape: {}".format(i, bn.bias.shape))

weixin_39658474

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。