1. 什么是学习曲线
学习曲线是模型在训练集和验证集上的得分变化曲线,横坐标表示的是样本数量(x_train的数据量)的大小,纵坐标为训练集和验证集的得分(train_score, test_score)。
2. 什么是过拟合和欠拟合
过拟合:过拟合一般是由于模型使用了太多的特征引起的,太过贴近于训练数据的特征了,在训练集上表现非常优秀,但是在新的测试集上却表现平平,不具泛化性。
欠拟合:欠拟合一般是指模型没有很好的抓住数据的特征,在训练集和测试集的准确率相差不大,但是都表现的大,使得偏差较大。
3. 怎么判断过拟合还是欠拟合
import numpy as np
import matplotlib.pyplot as plt
from sklearn.naive_bayes import GaussianNB
from sklearn.svm import SVC
from sklearn.datasets import load_digits
from sklearn.model_selection import learning_curve
from sklearn.model_selection import ShuffleSplit
d