《python深度学习》学习笔记与代码实现（第七章：7.2 7.3）

最新推荐文章于 2024-04-16 15:25:15 发布

Tersai

最新推荐文章于 2024-04-16 15:25:15 发布

阅读量625

点赞数 1

分类专栏：学习笔记文章标签：深度学习 python keras 机器学习神经网络

本文链接：https://blog.csdn.net/qq_41718518/article/details/89842173

版权

学习笔记专栏收录该内容

16 篇文章 11 订阅

订阅专栏

python深度学习7.2----使用keras的回调函数和TensorBoard来检查并监控深度学习模型

7.2.1 训练过程中将回调函数作用于模型

回调函数的一些用法示例如下所示：

1.模型检查点：在训练过程中的不同时间点保存模型的当前权重

2.提前终止：如果验证损失不在改善，则中断训练

3.在训练过程中动态的调节某些参数值

4.在训练过程中记录训练指标和验证指标，或将模型学到的表示可视化

# 1.modelCheckPoint 与 EarlyStopping 回调函数

import keras 

callbacks_list = [
#     如果模型不再改善就中断训练   监控模型的验证精度     如果精度在多于1轮的时间（即两轮）内不再改善，则中断训练
    keras.callbacks.EarlyStopping(monitor = 'acc',patience = 1),
#     在每轮过后保存当前权重，目标模型文件的保存路径，如果val_loss没有改善，那么不需要覆盖模型文件，这就可以始终保存在训练过程中中见到的最佳模型
    keras.callbacks.ModelCheckpoint(filepath = 'my_model.h5',monitor = 'val_loss',save_best_only = True)
    
]

# 回调函数要监控验证损失和验证精度，所以在调入fit时需要传入validation_data（验证数据）
model.fit(x,y,epochs = 10,batch_size = 32,callbacks = callbacks_list,validation_data= (x_val,y_val))

# 2.ReduceLROnPlateau回调函数
# 训练过程总验证损失不再改善，使用这个回调函数来改变学习率

callbacks_list = [
#     监控模型的验证损失，触发时将学习率乘以0.1，如果验证损失在10轮内都没有改善，则触发这个回调函数
    keras.callbacks.ReduceLROnPlateau(monitor = 'val_loss',factor = 0.1,patience = 10)
]

model.fit(x,y,epochs = 10,batch_size = 32,callbacks = callbacks_list,validation_data = (x_val,y_val))

# 编写你自己的回调函数
# 示例，在每轮结束后将模型每层的激活保存到硬盘，这个激活是对验证集的第一个样本计算得到的

import keras 
import numpy as np

class ActivationLogger(keras.callbacks.Callback):
    def set_model(self,model):
        self.model = model
        layer_outputs = [layer.output for layer in model.layers]
        self.activations_model = keras.models.Model(model.input,layer_outputs)
        
    def on_epoch_end(self,epoch,logs = None):
        if self.validation_data is None:
            raise RuntimeError('Requires valiation_data')
        validation_sample = self.validation_data[0][0:1]
        activations = self.activations_model.predict(validation_sample)
        f = open('activation_at_epoch' + str(epoch) + '.npz','w')
        np.savez(f,activations)
        f.close()

7.2.2 TensorBoard简介：TensorFlow的可视化框架
主要用途：在训练过程中帮助你以可视化的方法监控模型内部发生的一切，如果你监控了除模型最终损失之外的更多信息，那么可以更清楚的了解模型做了什么，没做什么，并且能够更快的取得进展，TensorBoard的功能如下

1.再寻过程中以可视化的方式监控指标

2.将模型架构可视化

3.将激活和梯度的直方图可视化

4.以三维的形式研究嵌入

示例：IMDB情感分析问题

import keras 
from keras import layers
from keras.datasets import imdb
from keras.preprocessing import sequence

max_features = 2000
max_len = 500

(x_train,y_train),(x_test,y_test) = imdb.load_data(num_words = max_features)
x_train = sequence.pad_sequences(x_train,maxlen = max_len)
x_test = sequence.pad_sequences(x_test,maxlen = max_len)

model = keras.models.Sequential()
model.add(layers.Embedding(max_features,128,input_length = max_len,name = 'embed'))
model.add(layers.Conv1D(32,7,activation = 'relu'))
model.add(layers.MaxPooling1D(5))
model.add(layers.Conv1D(32,7,activation = 'relu'))
model.add(layers.GlobalMaxPooling1D())
model.add(layers.Dense(1))
model.summary()
model.compile(optimizer = 'rmsprop',loss = 'binary_crossentropy',metrics = ['acc'])

Layer (type)                 Output Shape              Param #   
=================================================================
embed (Embedding)            (None, 500, 128)          256000    
_________________________________________________________________
conv1d_1 (Conv1D)            (None, 494, 32)           28704     
_________________________________________________________________
max_pooling1d_1 (MaxPooling1 (None, 98, 32)            0         
_________________________________________________________________
conv1d_2 (Conv1D)            (None, 92, 32)            7200      
_________________________________________________________________
global_max_pooling1d_1 (Glob (None, 32)                0         
_________________________________________________________________
dense_1 (Dense)              (None, 1)                 33        
=================================================================
Total params: 291,937
Trainable params: 291,937
Non-trainable params: 0
_________________________________________________________________

callbacks = [
#     日志文件被写入这个位置，每一轮之后激活直方图，每一轮之后记录嵌入数据
    keras.callbacks.TensorBoard(log_dir = 'D:\study\Python\Deeplearning\ch7',histogram_freq = 1,embeddings_freq = 1)
]

history = model.fit(x_train,y_train,epochs = 20,batch_size = 128,validation_split = 0.2,callbacks = callbacks)

小结
1.keras回调函数提供了一种简单方法，可以在训练过程中，监控模型并根据模型状态自动采取行动

2.使用tensorflow时，TensorBoard是一种在浏览器中将模型活动可视化的好方法，在可让是模型中，你可以通过TensorBoard回到函数来实现这种方法

7.3 让模型的性能发挥到极致

1.批标准化：有助于梯度传播

BatchNormalization层，通常在卷积层和Dense层之后使用

接受一个axis参数，表示在那个通道运用标准化，默认值为-1

2 深度可分离卷积

SeparableConv2D层

对输入的每个通道分别执行空间卷积，然后通过逐点卷积将输出通道混合，相当于将空间特征学习和通道特征学习分开，需要的参数很少，计算量也很小

# 示例

from keras import layers
from keras.models import Sequential,Model

height = 64
width = 64
channels = 3
num_classes = 10

model = Sequential()
model.add(layers.SeparableConv2D(32,3,activation = 'relu',input_shape = (height,width,channels,)))
model.add(layers.SeparableConv2D(64,3,activation = 'relu'))
model.add(layers.MaxPooling2D(2))

model.add(layers.SeparableConv2D(64,3,activation = 'relu'))
model.add(layers.SeparableConv2D(128,3,activation='relu'))
model.add(layers.MaxPooling2D(2))

model.add(layers.SeparableConv2D(64,3,activation = 'relu'))
model.add(layers.SeparableConv2D(128,3,activation='relu'))
model.add(layers.GlobalAveragePooling2D())

model.add(layers.Dense(32,activation = 'relu'))
model.add(layers.Dense(num_classes,activation = 'softmax'))

model.summary()

model.compile(optimizer = 'rmsprop',loss = 'categorical_crossentropy')

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
separable_conv2d_7 (Separabl (None, 62, 62, 32)        155       
_________________________________________________________________
separable_conv2d_8 (Separabl (None, 60, 60, 64)        2400      
_________________________________________________________________
max_pooling2d_3 (MaxPooling2 (None, 30, 30, 64)        0         
_________________________________________________________________
separable_conv2d_9 (Separabl (None, 28, 28, 64)        4736      
_________________________________________________________________
separable_conv2d_10 (Separab (None, 26, 26, 128)       8896      
_________________________________________________________________
max_pooling2d_4 (MaxPooling2 (None, 13, 13, 128)       0         
_________________________________________________________________
separable_conv2d_11 (Separab (None, 11, 11, 64)        9408      
_________________________________________________________________
separable_conv2d_12 (Separab (None, 9, 9, 128)         8896      
_________________________________________________________________
global_average_pooling2d_2 ( (None, 128)               0         
_________________________________________________________________
dense_3 (Dense)              (None, 32)                4128      
_________________________________________________________________
dense_4 (Dense)              (None, 10)                330       
=================================================================
Total params: 38,949
Trainable params: 38,949
Non-trainable params: 0
_________________________________________________________________

3.超参数优化

通常的流程：

1.选择一组超参数（自动选择）

2.构建相应的模型

3.将模型在训练数据上拟合，并衡量其在验证数据上的最佳性能

4.选择要尝试的下一组超参数（自动选择）

5.重复上述过程

6.最后，衡量模型在测试数据上的性能

超参数优化的库：Hyperopt，Hyperas

注意：

在进行大规模超参数自动优化时，有一个重要的问题需要牢记，那就是验证集过拟合，因为你是在使用一个验证数据计算出一个信号，然后根据这个信号来更新超参数，所以你实际上实在验证数据集上训练超参数，很快会对验证数据过拟合，请始终记住这一点

4.模型集成

原则：使用尽可能多的模型，模型之间的表现都差不多，模型的类型应该多样化

小结：

1.构建高性能的卷积神经网络时，你需要使用残差连接，批标准化和深度可分离卷积。未来，无论是一维，二维，还是三维应用，深度可分离卷积可能会完全取代普通卷积，因为他的表示效率更高

2.构建深度网络需要选择许多超参数和架构，这些选择共同决定了模型的性能，与其将这些选择建立在直觉或随机性之上，不如系统的搜索超参数空间，以找到最佳选择，目前，这个搜索过程的计算代价还很高，使用的工具也不是很好，并且要小心验证集过拟合

3.模型集成：加权平均，模型多样性

本章小结

1.如何将模型构建为层组成的图，层的重复使用（层权重共享），与将模型用作python函数（模型模板）

2.你可以用keras的回调函数在训练过程中监控模型，并根据模型状态采取行动

3.TensorBoard可以将指标，激活直方图甚至嵌入空间可视化

4.什么是批标准化，深度可分离卷积和残差连接

5.超参数优化和模型集成

Tersai

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
《python深度学习》学习笔记与代码实现（第七章：7.2 7.3）

python深度学习7.2----使用keras的回调函数和TensorBoard来检查并监控深度学习模型7.2.1 训练过程中将回调函数作用于模型回调函数的一些用法示例如下所示：1.模型检查点：在训练过程中的不同时间点保存模型的当前权重2.提前终止：如果验证损失不在改善，则中断训练3.在训练过程中动态的调节某些参数值4.在训练过程中记录训练指标和验证指标，或将模型学到的表示可视化#...
复制链接

扫一扫