【Python机器学习】k近邻——模型复杂度与泛化能力的关系

最新推荐文章于 2024-05-20 08:39:09 发布

zhangbin_237

最新推荐文章于 2024-05-20 08:39:09 发布

阅读量353

点赞数 9

分类专栏： Python机器学习文章标签：机器学习 python 人工智能

本文链接：https://blog.csdn.net/weixin_39407597/article/details/135415158

版权

Python机器学习专栏收录该内容

40 篇文章 0 订阅

订阅专栏

以某数据进行研究，先将数据集分为训练集和测试集，然后用不同的邻居数对训练集合测试集的新能进行评估：


from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt

cancer=load_breast_cancer()
X_train,X_test,y_train,y_test=train_test_split(
    cancer.data,cancer.target,stratify=cancer.target,random_state=66
)
plt.rcParams['font.sans-serif']=['SimHei']
training_accuracy=[]
test_accuracy=[]
neighbors_settings=range(1,11)

for n_neighbors in neighbors_settings:
    clf=KNeighborsClassifier(n_neighbors=n_neighbors)
    clf.fit(X_train,y_train)
    training_accuracy.append(clf.score(X_train,y_train))
    test_accuracy.append(clf.score(X_test,y_test))

plt.plot(neighbors_settings,training_accuracy,label='训练集精度')
plt.plot(neighbors_settings,test_accuracy,label='泛化精度')
plt.xlabel('邻居数')
plt.ylabel('精度')
plt.legend()
plt.show()