tensorflow实战（四）——过拟合调参(1)及Colab的GPU使用达到限额

最新推荐文章于 2023-08-21 13:56:30 发布

一位安分的码农

最新推荐文章于 2023-08-21 13:56:30 发布

阅读量2.7k

点赞数

分类专栏： tensorflow实战文章标签：深度学习 tensorflow 神经网络迁移学习

本文链接：https://blog.csdn.net/weixin_44612221/article/details/115086799

版权

tensorflow实战专栏收录该内容

7 篇文章 5 订阅

订阅专栏

通过Tensorflow实战（三）——解决Google colab 自动掉线问题，我解决了GPU经常被自动卸载的问题，非常开心，于是去找我的Missile测试代码去了。
找完回来，准备训练，突然傻眼了，显示GPU使用已经达到了限额，在网上查了一下，别人说要过24小时后才能在此使用，太难了，我只能用CPU缓慢的进行训练了。

训练配置

我将random_state改为1，以此保持训练集与测试集为固定的，使用控制变量法优化超参数

(x_train, x_test, y_train, y_test) = train_test_split(all_inputs, all_classes, train_size=0.8, random_state=1)

根据前几天的经验，我这里学习率设置的太大了，所以改为：

model.compile(optimizer=tf.keras.optimizers.Adam(0.0003),
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
              metrics=['sparse_categorical_accuracy'])

听说当训练样本较少时，网络可训练参数不宜过多，不然很容易导致过拟合。
下面，我们将测试LSTM在不同记忆体个数的情况下训练的效果：

NO.1

LSTM第一层和第二层记忆体个数分别为10，80

model = tf.keras.Sequential([
    # 0-255共256个，故第一个参数为256，数据为三位数，故第三个参数为3
    Embedding(256, 3),
    LSTM(10, return_sequences=True),
    Dropout(0.2),
    LSTM(80),
    Dropout(0.2),
    Dense(2, activation='softmax')
])

结果：
在这里插入图片描述

NO.2

LSTM第一层和第二层记忆体个数分别为100，80，准确率为0.865
在这里插入图片描述

NO.3

LSTM第一层和第二层记忆体个数分别为3，5，准确率为0.885
在这里插入图片描述

一位安分的码农

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
tensorflow实战（四）——过拟合调参(1)及Colab的GPU使用达到限额

通过Tensorflow实战（三）——解决Google colab 自动掉线问题，我解决了GPU经常被自动卸载的问题，非常开心，于是去找我的Missile测试代码去了。找完回来，准备训练，突然傻眼了，显示GPU使用已经达到了限额，在网上查了一下，别人说要过24小时后才能在此使用，太难了，我只能用CPU缓慢的进行训练了。训练配置我将random_state改为1，以此保持训练集与测试集为固定的，使用控制变量法优化超参数(x_train, x_test, y_train, y_test) = train
复制链接

扫一扫

专栏目录