深度学习笔记：数据正规化和抑制过拟合

Raine_Yang

于 2023-03-04 11:56:07 发布

阅读量477

点赞数

分类专栏：人工智能文章标签：深度学习 python 人工智能反向传播神经网络

本文链接：https://blog.csdn.net/Raine_Yang/article/details/129331471

版权

1 Batch-normalization

batch-normalization将输入数据转化为平均值0，标准差为1的分布，该方法可以加速学习并抑制过拟合。batch-normalization作为神经网络特定的一个层出现

batch-normalization计算表达式：
在这里插入图片描述
接下来，会对数据进行一定的缩放和平移，得到y = γx + β，其中γ和β为参数，初始值为1和0，会根据学习更新

batch-normalization计算图表示：
在这里插入图片描述
比较batch-normalization对训练准确度影响：

# coding: utf-8
import sys, os
sys.path.append("D:\AI learning source code")  # 为了导入父目录的文件而进行的设定
import numpy as np
import matplotlib.pyplot as plt
from dataset.mnist import load_mnist
from common.multi_layer_net_extend import MultiLayerNetExtend
from common.optimizer import SGD, Adam

(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True)

# 减少学习数据
x_train = x_train[:1000]
t_train = t_train[:1000]

max_epochs = 20
train_size = x_train.shape[0]
batch_size = 100
learning_rate = 0.01


def __train(weight_init_std):
    bn_network = MultiLayerNetExtend(input_size=784, hidden_size_list=[100, 100, 100, 100, 100], output_size=10, 
                                    weight_init_std=weight_init_std, use_batchnorm=True)
    network = MultiLayerNetExtend(input_size=784, hidden_size_list=[100, 100, 100, 100, 100], output_size=10,
                                weight_init_std=weight_init_std)
    optimizer = SGD(lr=learning_rate)
    
    train_acc_list = []
    bn_train_acc_list = []
    
    iter_per_epoch = max(train_size / batch_size, 1)
    epoch_cnt = 0
    
    for i in range(1000000000):
        batch_mask = np.random.choice(train_size, batch_size)
        x_batch = x_train[batch_mask]
        t_batch = t_train[batch_mask]
    
        for _network in (bn_network, network):
            grads = _network.gradient(x_batch, t_batch)
            optimizer.update(_network.params, grads)
    
        if i % iter_per_epoch == 0:
            train_acc =

最低0.47元/天解锁文章

Raine_Yang

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习笔记：数据正规化和抑制过拟合

这里L2范数指各权重值的平方和的开方，即√∑w²，与其类似的还有L1范数，指各权重值绝对值的和，L∞（又称Max范数），为权重值中最大值。可以看到神经网络对训练数据集拟合度非常高，在后期直接达到1（对每个epoch中300个数据预测完全正确），但是对测试数据集准确度较低，并在后期没有增长，这就是过拟合的现象。在该程序中，我们为了模拟过拟合现象，使用300的样本量，和7层神经网络（6个隐藏层，每次神经元个数100），进行200个epoch训练，并绘制训练准确度和测试准确度图象。
复制链接

扫一扫

专栏目录