Keras关于训练冻结部分层

设置冻结层有两种方式。

  1. (不推荐)是在搭建网络时,直接将某层的trainable设置为false,例如:
    layers.Conv2D(filters1, (1, 1), trainable=False)(input_tensor)

     

  2. 在网络搭建完成时,遍历model.layer,然后将layer.trainable设置为False:
    # 冻结网络倒数的3层
    for layer in model.layers[:-3]:
        print(layer.trainable)
        layer.trainable = False
    

    也可以根据layer.name来确定哪些层需要冻结,例如冻结最后一层和RNN层:

    for layer in model.layers:
    	layerName=str(layer.name)
    	if layerName.startswith("RNN_") or layerName.startswith("Final_"):
    		layer.trainable=False
    

    可以在实例化之后将网络层的 trainable 属性设置为 True 或 False。为了使之生效,在修改 trainable 属性之后,需要在模型上调用 compile()。这是一个例子

    x = Input(shape=(32,))
    layer = Dense(32)
    layer.trainable = False
    y = layer(x)
    
    frozen_model = Model(x, y)
    # 在下面的模型中,训练期间不会更新层的权重
    frozen_model.compile(optimizer='rmsprop', loss='mse')
    
    layer.trainable = True
    trainable_model = Model(x, y)
    # 使用这个模型,训练期间 `layer` 的权重将被更新
    # (这也会影响上面的模型,因为它使用了同一个网络层实例)
    trainable_model.compile(optimizer='rmsprop', loss='mse')
    
    frozen_model.fit(data, labels)  # 这不会更新 `layer` 的权重
    trainable_model.fit(data, labels)  # 这会更新 `layer` 的权重

    在网络搭建时,可以考虑最后一个分类层命名和分类数量关联,这样当费雷数量方式变化时,model.load_weight(“weight.h5”,by_name=True)不会加载最后一层

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在增量学习中,我们通常希望保留之前训练好的模型权重,只更新新加入的部分。因此,我们需要冻结之前训练好的,只更新新增的。 举个例子,假设我们有一个包含三个全连接的神经网络,我们已经训练好了前两个,现在要在第三个上进行增量学习。我们可以使用以下代码冻结前两个的权重: ```python import tensorflow as tf # 之前训练好的模型 model = tf.keras.Sequential([ tf.keras.layers.Dense(64, activation='relu', input_shape=(784,)), tf.keras.layers.Dense(64, activation='relu'), tf.keras.layers.Dense(10, activation='softmax') ]) # 冻结前两个的权重 for layer in model.layers[:2]: layer.trainable = False # 新增第三个并进行训练 model.add(tf.keras.layers.Dense(64, activation='relu')) model.add(tf.keras.layers.Dense(10, activation='softmax')) # 编译模型 model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy']) # 训练模型 model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test)) ``` 在上面的代码中,我们使用`model.layers[:2]`来选择前两个,然后将它们的`trainable`属性设置为`False`,这样在训练过程中这两个的权重将不会被更新。然后我们新增了一个含64个神经元的全连接和一个输出,并编译模型进行训练。 通过这种方式,我们可以在不影响之前训练好的权重的情况下,对新增的进行增量学习。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值