3.5 过拟合与神经网络的客观评价

评价标准:对未见过数据的预测

import keras
from keras import layers
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

data = pd.read_csv('./dataset/credit-a.csv', header=None)

x = data.iloc[:, :-1].values
y = data.iloc[:,-1].replace(-1,0).values.reshape(-1, 1)

x_train =  x[:int(len(x) * 0.75)]
x_test =  x[int(len(x) * 0.75):]
y_train = y[:int(len(y) * 0.75)]
y_test = y[int(len(y) * 0.75):]

x_train.shape, x_test.shape, y_train.shape, y_test.shape

model = keras.Sequential()
model.add(layers.Dense(128, input_shape=(None, 15), activation='relu'))
model.add(layers.Dense(128, activation='relu'))
model.add(layers.Dense(128, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

model.compile(optimizer='adam',
             loss='binary_crossentropy',
             metrics=['acc']
             )

history = model.fit(x_train, y_train, epochs=1000, 
                    validation_data=(x_test,y_test))

model.evaluate(x_train, y_train) 
# [0.033741530030965805, 0.987730085849762]
model.evaluate(x_test, y_test)  # loss | acc    比较差  --- 过拟合的表现
# [1.9823191165924072, 0.8048780560493469]
# 过拟合:在训练数据上的正确率非常高,在测试数据上比较低

plt.plot(history.epoch, history.history.get('val_acc'), c='r',label='val_acc')
plt.plot(history.epoch, history.history.get('acc'), c='b', label='acc')
plt.legend()

过拟合:

        在训练数据上的正确率非常高,在测试数据上比较低

代码结果分析

 如上图所示,那是训练模型后最后的结果,发现,训练集上和测试集产生了很大的差距

如上图所示,从箭头指示的地方开始,训练集上的acc和测试集上的acc开始有差距了

过拟合的问题是机器学习中的一个本质上的问题。

        对于一个网络,基本上都是可以拟合的。如果出现拟合能力不够(欠拟合)的话, 可以在构建模型的时候增加隐藏层的层数,然后就会出现过拟合的情况,下一节将会讲解如何抑制过拟合的问题。        

说明:

基于JupyterNoteBook(Annaconda3)搭建的tensorflow开发环境。

所使用到的数据集见我的博客上传的资源中,欢迎大家下载。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值