机器学习：如何判断和解决过拟合和欠拟合

最新推荐文章于 2024-04-28 10:05:15 发布

c.x.y.07.30

最新推荐文章于 2024-04-28 10:05:15 发布

阅读量5.3k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/MARY197011111/article/details/90175605

版权

1.利用学习曲线判断
2.误差 = 偏差(精确率) + 方差(稳定性)
3.下图中虚线为训练集，实线为测试集
在这里插入图片描述

'''
功能：判别过拟合和欠拟合
学习曲线Learning Curve：评估样本量和指标的关系
验证曲线validation Curve：评估参数和指标的关系
'''
import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.cross_validation import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline
import matplotlib.pyplot as plt
from sklearn.learning_curve import learning_curve
import numpy as np
from sklearn.learning_curve import validation_curve
#导入数据
df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/wdbc.data',header=None)
X=df.loc[:,2:].values
y=df.loc[:,1].values
le=LabelEncoder()
y=le.fit_transform(y)#类标整数化
print (le.transform(['M','B'])

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

c.x.y.07.30

关注关注

0
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
机器学习：如何判断和解决过拟合和欠拟合

1.利用学习曲线判断2.误差 = 偏差(精确率) + 方差(稳定性)3.下图中虚线为训练集，实线为测试集'''功能：判别过拟合和欠拟合学习曲线Learning Curve：评估样本量和指标的关系验证曲线validation Curve：评估参数和指标的关系'''import pandas as pdfrom sklearn.preprocessing import LabelE...
复制链接

扫一扫