tensorflow.keras 训练模型直接测试结果与导入模型文件测试结果不一致的问题

sifang_baweng

于 2022-07-22 09:38:41 发布

阅读量1.2k

点赞数 1

分类专栏： deep learning 文章标签： tensorflow keras 深度学习

本文链接：https://blog.csdn.net/sifang_baweng/article/details/115536266

版权

deep learning 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

tensorflow.keras 训练模型直接测试结果与导入模型文件测试结果不一致的问题

一个二分类任务，使用tensorflow.keras训练神经网络模型并保存模型文件后，导入模型文件，对单样本进行预测，发现预测值不是0就是1，怀疑是模型出了问题……
于是输入整个测试集进行模型检验，使用sklearn.metrics包中的classification_report, confusion_matrix测试模型，发现模型预测准确率仅有50%左右，混淆矩阵也显示模型将大约95%的样例分类到了0标签。

结果：查看原始模型源码，在训练以及预测前，加入了对数据的normalize操作

from sklearn.preprocessing import StandardScaler
/*
...
*/
normal = StandardNormalizer()
normal.fit(x_train)
model.fit(normal.transform(x_train),y_train)

即对数据的标准化，标准化包括两个步骤：

对数据进行去中心处理，整体数据均值设置在原点，目的：方便对两个样本之间的距离度量
对数据的归一化处理，将整体数据规约在[-1,1]之间，这样减小了部分特征值过大的样本对于分类产生的影响

记录一下tensorflow.keras模型对于单一样本预测，或者少量样本预测时出现的问题：
tensoflow.keras包括两种模型定义方法，一种是函数型，一种是Sequential()型，即大部分文章中说的序贯型。函数型支持多输入，多输出；但是序贯型是一条单输入单输出通道。就样本预测而言，也分为两种模型调用方法，一种是对大数据进行优化输入以及预测的model.predict(input_tensor)方法，还有一种就是直接引用模型的方法model(input_tensor)方法。

在tensorflow.keras官方文档中，对这部分做了较为详尽的描述。model(input_tensor)也就是model.__call__()方法，这部分实际上沿用keras顶层的一些模型调用方法，model本身就可以作为一个layer看待，然后对于针对不同类别的layer实际上又定义了call()方法作为针对性的适配。

例如dense()层，如果模型最后一层是dense()那么在model.__call__()调用过程中，
首先调用顶层的base_layer.__call__()方法对call进行初始化，例如输入数据的处理，包括格式转换、维度处理等操作；系统环境的读取，识别是模型训练环境，亦或是模型推理环境。
然后再进行针对不同层的特异性操作，dense层自身包括kernel_weights以及bias_weights两个ndarray，对于输入的处理就是np.matmul(input_tensor,kernel_weights) + bias_weights。这也正是dense()最终的输出结果。对于特殊的层，例如batch_normalization以及drop，会有对tranining参数的要求，training=True或者training=False都会产生不同的输出结果。