tensorflow.keras 训练模型直接测试结果与导入模型文件测试结果不一致的问题

tensorflow.keras 训练模型直接测试结果与导入模型文件测试结果不一致的问题

一个二分类任务,使用tensorflow.keras训练神经网络模型并保存模型文件后,导入模型文件,对单样本进行预测,发现预测值不是0就是1,怀疑是模型出了问题……
于是输入整个测试集进行模型检验,使用sklearn.metrics包中的classification_report, confusion_matrix测试模型,发现模型预测准确率仅有50%左右,混淆矩阵也显示模型将大约95%的样例分类到了0标签。

结果:查看原始模型源码,在训练以及预测前,加入了对数据的normalize操作

from sklearn.preprocessing import StandardScaler
/*
...
*/
normal = StandardNormalizer()
normal.fit(x_train)
model.fit(normal.transform(x_train),y_train)

即对数据的标准化,标准化包括两个步骤:

  1. 对数据进行去中心处理,整体数据均值设置在原点,目的:方便对两个样本之间的距离度量
  2. 对数据的归一化处理,将整体数据规约在[-1,1]之间,这样减小了部分特征值过大的样本对于分类产生的影响

记录一下tensorflow.keras模型对于单一样本预测,或者少量样本预测时出现的问题:
tensoflow.keras包括两种模型定义方法,一种是函数型,一种是Sequential()型,即大部分文章中说的序贯型。函数型支持多输入,多输出;但是序贯型是一条单输入单输出通道。就样本预测而言,也分为两种模型调用方法,一种是对大数据进行优化输入以及预测的model.predict(input_tensor)方法,还有一种就是直接引用模型的方法model(input_tensor)方法。

在tensorflow.keras官方文档中,对这部分做了较为详尽的描述。model(input_tensor)也就是model.__call__()方法,这部分实际上沿用keras顶层的一些模型调用方法,model本身就可以作为一个layer看待,然后对于针对不同类别的layer实际上又定义了call()方法作为针对性的适配。

例如dense()层,如果模型最后一层是dense()那么在model.__call__()调用过程中,
首先调用顶层的base_layer.__call__()方法对call进行初始化,例如输入数据的处理,包括格式转换、维度处理等操作;系统环境的读取,识别是模型训练环境,亦或是模型推理环境。
然后再进行针对不同层的特异性操作,dense层自身包括kernel_weights以及bias_weights两个ndarray,对于输入的处理就是np.matmul(input_tensor,kernel_weights) + bias_weights。这也正是dense()最终的输出结果。对于特殊的层,例如batch_normalization以及drop,会有对tranining参数的要求,training=True或者training=False都会产生不同的输出结果。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值