tensorflow冻结部分层,只训练某一层

其实常说的fine tune就是冻结网络前面的层,然后训练最后一层。那么在tensorflow里如何实现finetune功能呢?或者说是如何实现冻结部分层,只训练某几个层呢?可以通过只选择优化特定层的参数来实现该功能。示例代码如下:


#定义优化算子

optimizer = tf.train.AdamOptimizer(1e-3)

#选择待优化的参数

output_vars = tf.get_collection(tf.GraphKyes.TRAINABLE_VARIABLES, scope='outpt')

train_step = optimizer.minimize(loss_score,var_list = output_vars)

 把需要更新梯度的层放在get_collection这个函数里面,不需要更新的不放进去。 

但是在这里,我却碰到了一个问题,关于adam的问题,如下:

Failed precondition: Attempting to use uninitialized value beta1_power    

查了一下,这个参数应该是Adam优化算子里的参数。问题出在定义优化算子的时间,晚于参数初始化的时间,导致beta1_power没有初始化,修改一下代码(调整代码顺序即可)即如下的顺序:

sess.run(init)

train_step = optimizer.minimize(loss_score,var_list=output_vars)

改变成如下顺序即可

train_step = optimizer.minimize(loss_score,var_list=output_vars)

sess.run(init)

 另外一个问题是,在用finetune的时候,发现速度并没有比retrain的速度快太多。分析原因在于finetune的时候,冻结了其它层,那么反向传播不会进入到这些层中,但是前向计算是会有的。如果想进一步加速finetune的速度,可以考虑先把所有数据执行一次前向操作,保存最后一层的中间的结果,然后以此中间结果为输入,训练整个网络。可以节省前向计算的一些时间。但如果finetune的epoch较少,那么感觉读写消耗的时间可能就已经很多了,不划算,加速效果也不明显。 
 

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,您的问题是如何使用 TensorFlow 的 ResNet50 模型对自己的数据集进行二分类训练,并添加防止过拟合的操作,最后保存训练结果并进行预测。 首先,您需要准备自己的数据集,并将其划分为训练集和测试集。然后,您需要使用 TensorFlow 的 `ImageDataGenerator` 类来对数据进行增强,例如旋转、翻转、缩放等操作。这可以帮助模型更好地学习数据的特征。 接着,您需要加载 ResNet50 模型,并将其冻结。这是因为 ResNet50 模型已经在大规模的图像数据集上进行了训练,其卷积已经可以提取出图像的特征,因此我们只需要训练模型的全连接即可。通过冻结模型,可以避免在训练全连接的过程中改变卷积的权重。 然后,您需要添加全连接和 Dropout 来防止过拟合。全连接将 ResNet50 的特征向量映射到二分类输出。Dropout 将在训练过程中随机地将一些神经元的输出置为零,以减少模型对训练数据的过度拟合。 接下来,您可以使用 `ModelCheckpoint` 回调函数来自动保存训练结果。这个函数可以在每个 epoch 结束时将模型保存到硬盘上。 最后,您可以使用训练好的模型来进行预测。您需要将待预测的图像传递给模型,并获得二分类的输出结果。 下面是一个示例代码,您可以根据自己的需求进行修改: ```python import tensorflow as tf from tensorflow.keras.applications.resnet50 import ResNet50 from tensorflow.keras.layers import Dense, Dropout from tensorflow.keras.models import Model from tensorflow.keras.callbacks import ModelCheckpoint from tensorflow.keras.preprocessing.image import ImageDataGenerator # 准备数据集 train_dir = 'path/to/train/directory' test_dir = 'path/to/test/directory' img_size = (224, 224) batch_size = 32 # 数据增强 train_datagen = ImageDataGenerator( rescale=1./255, rotation_range=20, width_shift_range=0.1, height_shift_range=0.1, shear_range=0.1, zoom_range=0.1, horizontal_flip=True, fill_mode='nearest' ) test_datagen = ImageDataGenerator( rescale=1./255 ) train_generator = train_datagen.flow_from_directory( train_dir, target_size=img_size, batch_size=batch_size, class_mode='binary' ) test_generator = test_datagen.flow_from_directory( test_dir, target_size=img_size, batch_size=batch_size, class_mode='binary', shuffle=False ) # 加载 ResNet50 模型,并冻结 base_model = ResNet50(include_top=False, weights='imagenet', input_shape=(224, 224, 3)) for layer in base_model.layers: layer.trainable = False # 添加全连接和 Dropout x = base_model.output x = tf.keras.layers.GlobalAveragePooling2D()(x) x = Dense(256, activation='relu')(x) x = Dropout(0.5)(x) predictions = Dense(1, activation='sigmoid')(x) model = Model(inputs=base_model.input, outputs=predictions) # 编译模型 model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy']) # 添加 ModelCheckpoint 回调函数 checkpoint = ModelCheckpoint('path/to/save/model.h5', monitor='val_loss', verbose=1, save_best_only=True, mode='min') # 训练模型 history = model.fit_generator( train_generator, steps_per_epoch=train_generator.n // batch_size, epochs=10, validation_data=test_generator, validation_steps=test_generator.n // batch_size, callbacks=[checkpoint] ) # 加载最好的模型 model.load_weights('path/to/save/model.h5') # 进行预测 result = model.predict(test_generator) ``` 希望这个示例代码能够帮助您完成对自己的数据集进行二分类训练,并添加防止过拟合的操作,最后保存训练结果并进行预测。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值