-
欠拟合和过拟合
过拟合和欠拟合是导致模型泛化能力不高的两种原因,都是模型学习能力与数据复杂度之间失配的 结果。- 欠拟合:是在模型学习能力较弱,而数据复杂度较高的情况出现,此时模型由于学习能力不足,无 法学习到数据集中的“一般规律”,因而导致泛化能力弱。
- 过拟合:是在模型学习能力过强的情况中出现,此时的模型学习能力太强,以至于将训练单个样本 自身的特定都能捕捉到,并将其认为是“一般规律”,因而导致模型泛化能力下降
- 各自优缺点
欠拟合在训练集和测试集上的性能都较差,而过拟合往往能较好地学习训练集数据地性质,而在测试集上地性能较差。
-
欠拟合和过拟合解决办法
1. 欠拟合的解决办法: a. 增加输入特征项 b. 增减网络 c. 减少正则化参数 2. 过拟合解决办法: a. 数据清洗 b. 增大训练集 c. 采用正则化 d. 增大正则化参数
-
正则化缓解过拟合
正则化在损失函数中引入模型复杂度指标,利用给w加权值,弱化了训练数据的噪声(一般不正则化b)
正则化的选择:- L1正则化大概率会使很多参数变为0,因此该方法可通过稀疏参数,即减少参数的数量,降低复杂度
- L2正则化会使参数很接近零但不为零,因此该方法可通过减小参数值的大小降低复杂度
-
案例:
#导入所需模块
import tensorflow as tf
from matplotlib import pyplot as plt
import numpy as np
import pandas as pd
#读入数据/标签 生成x_train y_train
df = pd.read_csv('dot.csv')
x_data = np.array(df[['x1','x2']])
y_data = np.array(df['y_c'])
x_train = np.vstack(x_data).reshape(-1,2)
y_train = np.vstack(y_data).reshape(-1,1)
Y_c = [['red' if y else 'blue'] for y in y_train