深度学习编程笔记：Tensorflow2.1基础知识---缓解过拟合

最新推荐文章于 2021-08-12 21:16:27 发布

还好江南

最新推荐文章于 2021-08-12 21:16:27 发布

阅读量155

点赞数

分类专栏：深度学习编程笔记文章标签： tensorflow 神经网络机器学习深度学习 python

本文链接：https://blog.csdn.net/weixin_42503072/article/details/105364987

版权

欠拟合和过拟合
过拟合和欠拟合是导致模型泛化能力不高的两种原因，都是模型学习能力与数据复杂度之间失配的结果。
1. 欠拟合：是在模型学习能力较弱，而数据复杂度较高的情况出现，此时模型由于学习能力不足，无法学习到数据集中的“一般规律”，因而导致泛化能力弱。
2. 过拟合：是在模型学习能力过强的情况中出现，此时的模型学习能力太强，以至于将训练单个样本自身的特定都能捕捉到，并将其认为是“一般规律”，因而导致模型泛化能力下降
3. 各自优缺点
  欠拟合在训练集和测试集上的性能都较差，而过拟合往往能较好地学习训练集数据地性质，而在测试集上地性能较差。

欠拟合和过拟合解决办法

 1. 欠拟合的解决办法：
 	a. 增加输入特征项
 	b. 增减网络
 	c. 减少正则化参数
 2. 过拟合解决办法：
 	a. 数据清洗
 	b. 增大训练集
 	c. 采用正则化
 	d. 增大正则化参数

正则化缓解过拟合
正则化在损失函数中引入模型复杂度指标，利用给w加权值，弱化了训练数据的噪声（一般不正则化b）

正则化的选择：
1. L1正则化大概率会使很多参数变为0，因此该方法可通过稀疏参数，即减少参数的数量，降低复杂度
2. L2正则化会使参数很接近零但不为零，因此该方法可通过减小参数值的大小降低复杂度
案例：

	#导入所需模块
	import tensorflow as tf
	from matplotlib import pyplot as plt
	import numpy as np
	import pandas as pd
	
	#读入数据/标签 生成x_train y_train
	df = pd.read_csv('dot.csv')
	x_data = np.array(df[['x1','x2']])
	y_data = np.array(df['y_c'])
	
	x_train = np.vstack(x_data).reshape(-1,2)
	y_train = np.vstack(y_data).reshape(-1,1)
	
	Y_c = [['red' if y else 'blue'] for y in y_train

最低0.47元/天解锁文章

还好江南

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
深度学习编程笔记：Tensorflow2.1基础知识---缓解过拟合

欠拟合和过拟合过拟合和欠拟合是导致模型泛化能力不高的两种原因，都是模型学习能力与数据复杂度之间失配的结果。欠拟合：是在模型学习能力较弱，而数据复杂度较高的情况出现，此时模型由于学习能力不足，无法学习到数据集中的“一般规律”，因而导致泛化能力弱。过拟合：是在模型学习能力过强的情况中出现，此时的模型学习能力太强，以至于将训练单个样本自身的特定都能捕捉到，并将其认为是“一般规律”，因而...
复制链接

扫一扫

专栏目录