tensorflow 恢复模型部分权重，CNN输出到LSTM

最新推荐文章于 2024-01-22 20:48:34 发布

haixwang

最新推荐文章于 2024-01-22 20:48:34 发布

阅读量1.6k

点赞数 2

分类专栏： Deep/Machine Learning

本文链接：https://blog.csdn.net/haixwang/article/details/89043820

版权

本文档记录了在TensorFlow中如何恢复预训练的VGG16模型的前7层权重，并将第7层输出reshape作为LSTM的输入。通过创建saver并指定恢复的变量，尝试在不冻结权重的情况下继续训练，发现恢复后的模型文件大小显著减小，这可能是因为只恢复了部分权重。在实际操作中遇到了reshape动态尺寸的问题，最终将输入尺寸固定以解决这个问题。

摘要由CSDN通过智能技术生成

一、需求

语音增强迁移训练时，希望在CNN后面接2层LSTM
但是后面几层CNN（VGG16）的feature map尺寸太小，怕LSTM学不到东西
恢复前7层CNN的权重，然后第7层的输出reshape之后作为LSTM的输入
恢复但不冻结

二、步骤

参考tf.train.saver文档
 参考StackOverflow
原网络结构如下：

    for layer_id in range(n_layers):
        n_channels = base_channels * (2 ** (layer_id // blk_size))

        if layer_id == 0:
            net = slim.conv2d(input_speech, num_outputs=n_channels, kernel_size=[1, ksz], stride=[1, 2],
                              activation_fn=lrelu, normalizer_fn=norm_fn, reuse=reuse, scope='loss_conv_%d' % layer_id)
            layers.append(net)
        elif layer_id < n_layers - 1:
            net = slim.conv2d(layers[-1], n_channels, [1, ksz], [1, 2], activation_fn=lrelu, normalizer_fn=norm_fn,
                              reuse=reuse, scope='loss_conv_%d' % layer_id)
            layers.append(net)
        else:
            net = slim.conv2d(layers[-1], n_channels, [1, ksz], activation_fn=lrelu, normalizer_fn=norm_fn,
                              reuse