keras冻结_Keras: model实现固定部分layer,训练部分layer操作

最新推荐文章于 2022-03-08 16:37:54 发布

nana 不是banana

最新推荐文章于 2022-03-08 16:37:54 发布

阅读量500

点赞数

文章标签： keras冻结

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_28733933/article/details/114318365

版权

本文介绍了如何在Keras中调整预训练的ResNet50模型，以适应新的分类任务（从1000类到500类）。通过设置模型的trainable属性，只让最后三层参与训练，提高训练效率。方法包括模型拆分和遍历设置trainable属性。同时，强调了避免直接在层构造时设置trainable=False，以及在加载权重时注意by_name=True的重要性。

摘要由CSDN通过智能技术生成

需求：Resnet50做调优训练，将最后分类数目由1000改为500。

问题：网上下载了resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5，更改了Resnet50后，由于所有层均参加训练，导致训练速度慢。实际上只需要训练最后3层，前面的层都不需要训练。

解决办法：

①将模型拆分为两个模型，一个为前面的notop部分，一个为最后三层，然后利用model的trainable属性设置只有后一个model训练，最后将两个模型合并起来。

②不用拆分，遍历模型的所有层，将前面层的trainable设置为False即可。代码如下：

for layer in model.layers[:-3]:

print(layer.trainable)

layer.trainable = False

注意事项：

①尽量不要这样：

layers.Conv2D(filters1, (1, 1), trainable=False)(input_tensor)

因为容易出错。。。

②加载notop参数时注意by_name=True.

补充知识：Keras关于训练冻结部分层

设置冻结层有两种方式。

(不推荐)是在搭建网络时，直接将某层的trainable设置为false，例如:

layers.Conv2D(filters1, (1, 1), trainable=False)(input_tensor)

在网络搭建完成时，遍历model.layer,然后将layer.trainable设置为False:

# 冻结网络倒数的3层

for layer in model.layers[:-3]:

print(layer.trainable)

layer.trainable = False

也可以根据layer.name来确定哪些层需要冻结,例如冻结最后一层和RNN层：

for layer in model.layers:

layerName=str(layer.name)

if layerName.startswith("RNN_") or layerName.startswith("Final_"):

layer.trainable=False

可以在实例化之后将网络层的 trainable 属性设置为 True 或 False。为了使之生效，在修改 trainable 属性之后，需要在模型上调用 compile()。

这是一个例子

x = Input(shape=(32,))

layer = Dense(32)

layer.trainable = False

y = layer(x)

frozen_model = Model(x, y)

# 在下面的模型中，训练期间不会更新层的权重

frozen_model.compile(optimizer='rmsprop', loss='mse')

layer.trainable = True

trainable_model = Model(x, y)

# 使用这个模型，训练期间 `layer` 的权重将被更新

# (这也会影响上面的模型，因为它使用了同一个网络层实例)

trainable_model.compile(optimizer='rmsprop', loss='mse')

frozen_model.fit(data, labels) # 这不会更新 `layer` 的权重

trainable_model.fit(data, labels) # 这会更新 `layer` 的权重

在网络搭建时，可以考虑最后一个分类层命名和分类数量关联，这样当费雷数量方式变化时，model.load_weight(“weight.h5”，by_name=True)不会加载最后一层

以上这篇Keras: model实现固定部分layer,训练部分layer操作就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持聚米学院。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。