3.5 过拟合与神经网络的客观评价

EaHalen

已于 2022-04-01 16:31:30 修改

阅读量565

点赞数 1

分类专栏：三、多层感知器与神经网络文章标签：深度学习

于 2022-04-01 15:16:54 首次发布

本文链接：https://blog.csdn.net/weixin_46994240/article/details/123898174

版权

三、多层感知器与神经网络专栏收录该内容

8 篇文章 2 订阅

订阅专栏

评价标准：对未见过数据的预测

import keras
from keras import layers
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

data = pd.read_csv('./dataset/credit-a.csv', header=None)

x = data.iloc[:, :-1].values
y = data.iloc[:,-1].replace(-1,0).values.reshape(-1, 1)

x_train =  x[:int(len(x) * 0.75)]
x_test =  x[int(len(x) * 0.75):]
y_train = y[:int(len(y) * 0.75)]
y_test = y[int(len(y) * 0.75):]

x_train.shape, x_test.shape, y_train.shape, y_test.shape

model = keras.Sequential()
model.add(layers.Dense(128, input_shape=(None, 15), activation='relu'))
model.add(layers.Dense(128, activation='relu'))
model.add(layers.Dense(128, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

model.compile(optimizer='adam',
             loss='binary_crossentropy',
             metrics=['acc']
             )

history = model.fit(x_train, y_train, epochs=1000, 
                    validation_data=(x_test,y_test))

model.evaluate(x_train, y_train) 
# [0.033741530030965805, 0.987730085849762]
model.evaluate(x_test, y_test)  # loss | acc    比较差  --- 过拟合的表现
# [1.9823191165924072, 0.8048780560493469]
# 过拟合：在训练数据上的正确率非常高，在测试数据上比较低

plt.plot(history.epoch, history.history.get('val_acc'), c='r',label='val_acc')
plt.plot(history.epoch, history.history.get('acc'), c='b', label='acc')
plt.legend()

过拟合：

在训练数据上的正确率非常高，在测试数据上比较低

代码结果分析

如上图所示，那是训练模型后最后的结果，发现，训练集上和测试集产生了很大的差距

如上图所示，从箭头指示的地方开始，训练集上的acc和测试集上的acc开始有差距了

过拟合的问题是机器学习中的一个本质上的问题。

对于一个网络，基本上都是可以拟合的。如果出现拟合能力不够（欠拟合）的话，可以在构建模型的时候增加隐藏层的层数，然后就会出现过拟合的情况，下一节将会讲解如何抑制过拟合的问题。

说明：

基于JupyterNoteBook(Annaconda3)搭建的tensorflow开发环境。

所使用到的数据集见我的博客上传的资源中，欢迎大家下载。

EaHalen

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
3.5 过拟合与神经网络的客观评价

评价标准：对未见过数据的预测import kerasfrom keras import layersimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltdata = pd.read_csv('./dataset/credit-a.csv', header=None)x = data.iloc[:, :-1].valuesy = data.iloc[:,-1].replace(-1,0).values.
复制链接

扫一扫

专栏目录