【Python深度学习系列】网格搜索神经网络超参数:丢弃率dropout(案例+源码)

这是我的第271篇原创文章。

一、引言

图片

      在深度学习中,超参数是指在训练模型时需要手动设置的参数,它们通常不能通过训练数据自动学习得到。超参数的选择对于模型的性能至关重要,因此在进行深度学习实验时,超参数调优通常是一个重要的步骤。常见的超参数包括:

  • model.add()

  • model.compile()

    • loss(损失函数)

    • optimizer(优化器)

      • learning rate(学习率)

      • momentum(动量)

      • weight decay(权重衰减系数)

  • model.fit()

    • batch size(批量大小)

    • epochs(迭代次数)

       一般来说,可以通过手动调优、网格搜索(Grid Search)、随机搜索(Random Search)、自动调参算法方式进行超参数调优。dropout是指在网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃。注意是暂时,对于随机梯度下降来说,由于是随机丢弃,故而每一个mini-batch都在训练不同的网络。考虑调节 dropout 为了正则化,为了限制过拟合以及提供模型的泛化能力。本文采用网格搜索选择丢弃率dropout。

二、实现过程

2.1 准备数据

dataset:

dataset = pd.read_csv("data.csv", header=None)
dataset = pd.DataFrame(dataset)
print(dataset)

图片

2.2 数据划分

# 切分数据为输入 X 和输出 Y
X = dataset.iloc[:,0:8]
Y = dataset.iloc[:,8]
# 为了复现,设置随机种子
seed = 7
np.random.seed(seed)
random.set_seed(seed)

2.3 创建模型

需要定义个网格的架构函数create_model,create_model里面的参数要在KerasClassifier这个对象里面存在而且参数名要一致。

def create_model(dropout_rate):
    # 创建模型
    model = Sequential()
    model.add(Dense(50, input_shape=(8, ), kernel_initializer='uniform', activation='relu'))
    model.add(Dropout(dropout_rate))
    model.add(Dense(1, kernel_initializer='uniform', activation='sigmoid'))

    # 编译模型
    model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model
model = KerasClassifier(model=create_model, epochs=100, batch_size=80, verbose=0, dropout_rate=0.2)

这里使用了scikeras库的KerasClassifier类来定义一个分类器,这里由于KerasClassifier没有定义初始化权重的参数,需要自定义一个表示丢弃率的参数dropout_rate,并赋默认值为0.2。

2.4 定义网格搜索参数

param_grid = {'dropout_rate': [0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]}

param_grid是一个字典,key是超参数名称,这里的名称必须要在KerasClassifier这个对象里面存在而且参数名要一致。value是key可取的值,也就是要尝试的方案。

2.5 进行参数搜索

from sklearn.model_selection import GridSearchCV
grid = GridSearchCV(estimator=model,  param_grid=param_grid)
grid_result = grid.fit(X, Y)

使用sklearn里面的GridSearchCV类进行参数搜索,传入模型和网格参数。

2.6 总结搜索结果

print("Best: %f using %s" % (grid_result.best_score_, grid_result.best_params_))
means = grid_result.cv_results_['mean_test_score']
stds = grid_result.cv_results_['std_test_score']
params = grid_result.cv_results_['params']
for mean, stdev, param in zip(means, stds, params):
    print("%f (%f) with: %r" % (mean, stdev, param))

结果:

图片

经过网格搜索,丢弃率的最优选择是0.2。

作者简介:

读研期间发表6篇SCI数据挖掘相关论文,现在某研究院从事数据算法相关科研工作,结合自身科研实践经历不定期分享关于Python、机器学习、深度学习、人工智能系列基础知识与应用案例。致力于只做原创,以最简单的方式理解和学习,关注我一起交流成长。需要数据集和源码的小伙伴可以关注底部公众号添加作者微信。

  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
下面是一个简单的神经网络网格搜索Python 代码实现: ```python from keras.models import Sequential from keras.layers import Dense from sklearn.model_selection import GridSearchCV from keras.wrappers.scikit_learn import KerasClassifier import numpy as np # 定义创建神经网络的函数 def create_model(optimizer='adam', activation='relu', dropout_rate=0.0): model = Sequential() model.add(Dense(16, input_dim=8, activation=activation)) model.add(Dense(8, activation=activation)) model.add(Dense(1, activation='sigmoid')) model.compile(loss='binary_crossentropy', optimizer=optimizer, metrics=['accuracy']) return model # 定义参数搜索范围 param_grid = { 'optimizer': ['rmsprop', 'adam'], 'activation': ['relu', 'sigmoid'], 'dropout_rate': [0.0, 0.1, 0.2] } # 定义模型 model = KerasClassifier(build_fn=create_model, epochs=10, batch_size=16, verbose=0) # 定义网格搜索 grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=3, n_jobs=-1, verbose=2) # 加载数据 dataset = np.loadtxt("pima-indians-diabetes.csv", delimiter=",") X = dataset[:,0:8] y = dataset[:,8] # 训练模型 grid_search.fit(X, y) # 输出最佳模型的参数和得分 print("Best parameters: ", grid_search.best_params_) print("Best score: ", grid_search.best_score_) ``` 上面的代码定义了一个创建神经网络模型的函数,一个参数搜索范围,一个 KerasClassifier 模型和一个网格搜索对象。然后,使用数据拟合网格搜索对象。最后输出最佳模型的参数和得分。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据杂坛

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值