介绍
Scikit-learn提供了learning_curve类,方便获得和训练的可视化相关的数据。例如,如果想要观察训练集使用不同样本数量和训练得分/测试得分的关系,可以使用learning_curve函数可视化,得到训练样本数量——训练/测试得分曲线如下。
本文将具体介绍实现过程。
from sklearn.learning_curve import learning_curve, validation_curve
1.数据集选用load_digit数据集 简单介绍
from sklearn.datasets import load_digits
X = digits['data'] #(1797,64)
Y = digits['target'] #(1797,)
2.采用KNC(KNeighborsClassifier)分类器
from sklearn.neighbors import KNeighborsClassifier
knc = KNeighborsClassifier(n_neighbors=3, algorithm='auto', weights='distance'