当我们要使用神经网络解决某一问题时,有时我们并不需要从0开始训练一个网络,因为训练一个较为复杂的网络,不仅会消耗很多时间也需要较大的数据集。
我们可以使用别人在解决与我们类似的问题时,已经训练好的网络和相应的参数,将网络结构进行“微调”,使得它适合我们的问题,最后在我们的数据集上进行再次的训练。
例如,在解决图像分类问题时
我们可以使用已经在大型的数据集上训练好的InceptionV3网络。
由于卷积层的主要作用是对图像特征的提取,并且在前几层卷积层,提取的方法(权重)基本相同。都是通过寻找图片中的 边,线,轮廓,然后组合。所以在使用InceptionV3时,我们可以锁住前面的卷积层的权重(训练时不进行更新),仅仅对后面的全连接层的参数进行训练。不仅可以保证准确率还能提高训练所需的时间。
实现:
(1)预定义InceptionV3网络,加载参数,锁住卷积层,或者卷积层的输出
import os
from tensorflow.keras import layers
from tensorflow.keras import Model
#下载网络参数,放置在 /tmp/
!wget --no-check-certificate \
https://storage.googleapis.com/mledu-datasets/inception_v3_weights_tf_dim_ordering_tf_kernels_notop.h5 \
-O /tmp/inception_v3_weights_tf_dim_ordering_tf_kernels_notop.h5