tensorflow.keras 训练模型直接测试结果与导入模型文件测试结果不一致的问题
一个二分类任务,使用tensorflow.keras训练神经网络模型并保存模型文件后,导入模型文件,对单样本进行预测,发现预测值不是0就是1,怀疑是模型出了问题……
于是输入整个测试集进行模型检验,使用sklearn.metrics
包中的classification_report
, confusion_matrix
测试模型,发现模型预测准确率仅有50%左右,混淆矩阵也显示模型将大约95%的样例分类到了0标签。
结果:查看原始模型源码,在训练以及预测前,加入了对数据的normalize
操作
from sklearn.preprocessing import StandardScaler
/*
...
*/
normal = StandardNormalizer()
normal.fit(x_train)
model.fit(normal.transform(x_train),y_train)
即对数据的标准化,标准化包括两个步骤:
- 对数据进行去中心处理,整体数据均值设置在原点,目的:方便对两个样本之间的距离度量
- 对数据的归一化处理,将整体数据规约在[-1,1]之间,这样减小了部分特征值过大的样本对于分类产生的影响
记录一下tensorflow.keras模型对于单一样本预测,或者少量样本预测时出现的问题:
tensoflow.keras
包括两种模型定义方法,一种是函数型,一种是Sequential()
型,即大部分文章中说的序贯型。函数型支持多输入,多输出;但是序贯型是一条单输入单输出通道。就样本预测而言,也分为两种模型调用方法,一种是对大数据进行优化输入以及预测的model.predict(input_tensor)
方法,还有一种就是直接引用模型的方法model(input_tensor)
方法。
在tensorflow.keras官方文档中,对这部分做了较为详尽的描述。model(input_tensor)
也就是model.__call__()
方法,这部分实际上沿用keras顶层的一些模型调用方法,model本身就可以作为一个layer
看待,然后对于针对不同类别的layer
实际上又定义了call()
方法作为针对性的适配。
例如dense()
层,如果模型最后一层是dense()
那么在model.__call__()
调用过程中,
首先调用顶层的base_layer.__call__()
方法对call
进行初始化,例如输入数据的处理,包括格式转换、维度处理等操作;系统环境的读取,识别是模型训练环境,亦或是模型推理环境。
然后再进行针对不同层的特异性操作,dense
层自身包括kernel_weights
以及bias_weights
两个ndarray
,对于输入的处理就是np.matmul(input_tensor,kernel_weights) + bias_weights
。这也正是dense()最终的输出结果。对于特殊的层,例如batch_normalization
以及drop
,会有对tranining
参数的要求,training=True
或者training=False
都会产生不同的输出结果。