深度学习笔记：dropout和调优超参数方法

最新推荐文章于 2023-07-08 15:23:22 发布

Raine_Yang

最新推荐文章于 2023-07-08 15:23:22 发布

阅读量2.3k

点赞数 1

分类专栏：人工智能文章标签：深度学习人工智能机器学习 python 神经网络

本文链接：https://blog.csdn.net/Raine_Yang/article/details/129343476

版权

1 Dropout

Dropout是一个常用于深度学习的减轻过拟合的方法。该方法在每一轮训练中随机删除部分隐藏层神经元。被删除的神经元不会进行正向或反向信号传递。在测试阶段所有神经元都会传递信号，但对各个神经元的输出要乘以训练时删除比例。

在这里插入图片描述
Dropout实现程序：

class Dropout:
    """
    http://arxiv.org/abs/1207.0580
    """
    def __init__(self, dropout_ratio=0.5):
        self.dropout_ratio = dropout_ratio
        self.mask = None

    def forward(self, x, train_flg=True):
        if train_flg:
            self.mask = np.random.rand(*x.shape) > self.dropout_ratio
            return x * self.mask
        else:
            return x * (1.0 - self.dropout_ratio)

    def backward(self, dout):
        return dout * self.mask

在该程序中，我们初始化dropout的比例为0.5。在正向传播中，如果train_flg为True（神经网络在训练状态），会生成一个和输入x形状相同的boolean矩阵mask，mask为False的位置（即被删除的神经元）在正向传播和反向传播的结果都为0。当train_flg为False时（神经网络在预测状态），会将正向传播的结果乘以(1.0 - self.dropout_ratio)输出

实验：利用dropout抑制过拟合

在该测试程序中，我们使用7层神经网络，每层神经元个数100，权重更新方法SGD，学习率0.01，进行300轮训练。每一轮训练样本量仅为300以增大过拟合概率。

此时我们在网络中使用dropout，并测试训练准确度和测试准确度的差距

# coding: utf-8
import os
import sys
sys.path.append("D:\AI learning source code")  # 为了导入父目录的文件而进行的设定
import numpy as np
import matplotlib.pyplot as plt
from dataset.mnist import load_mnist
from common.multi_layer_net_extend import MultiLayerNetExtend
from common.trainer import Trainer

(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True)

# 为了再现过拟合，减少学习数据
x_train = x_train[:300]
t_train = t_train[:300]

# 设定是否使用Dropuout，以及比例 ========================
use_dropout = True  # 不使用Dropout的情况下为False
dropout_ratio = 0.2
# ====================================================

network = MultiLayerNetExtend(input_size=784, hidden_size_list=[100, 100, 100, 100, 100, 100],
                              output_size=10, use_dropout=use_dropout, dropout_ration=dropout_ratio)
trainer = Trainer(network

最低0.47元/天解锁文章

Raine_Yang

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
深度学习笔记：dropout和调优超参数方法

在正向传播中，如果train_flg为True（神经网络在训练状态），会生成一个和输入x形状相同的boolean矩阵mask，mask为False的位置（即被删除的神经元）在正向传播和反向传播的结果都为0。dropout删除神经元的操作类似于在每一轮训练一个略有不同的神经网络，最后将每一个网络的结果在预测阶段叠加，实现利用一个神经网络模拟集成学习。根据第一轮测试结果，我们将学习率范围缩小到10e-4至10e-3，将权值衰减率范围缩小到10e-8至10e-6，开始第二轮实验。
复制链接

扫一扫

专栏目录