【Python机器学习】对二维数据集的决策边界

最新推荐文章于 2024-05-22 00:00:00 发布

zhangbin_237

最新推荐文章于 2024-05-22 00:00:00 发布

阅读量339

点赞数 10

分类专栏： Python机器学习文章标签：机器学习 python 人工智能

本文链接：https://blog.csdn.net/weixin_39407597/article/details/135414348

版权

Python机器学习专栏收录该内容

40 篇文章 0 订阅

订阅专栏

对于二维数据集，可以在xy平面上画出所有可能的测试点的预测结果，根据平面中的每个点所属的类别对平面进行角色，可以查看决策边界，也就是算法对类别0和类别1的分界线。

对1、3、9个邻居三种情况的决策边界可视化：

import mglearn.datasets
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt

X,y=mglearn.datasets.make_forge()
fig,axes=plt.subplots(1,3,figsize=(10,3))

for n_neighbors,ax in zip([1,3,9],axes):
    clf=KNeighborsClassifier(n_neighbors=n_neighbors).fit(X,y)
    mglearn.plots.plot_2d_classification(clf,X,fill=True,eps=0.5,ax=ax,alpha=.4)
    mglearn.discrete_scatter(X[:,0],X[:,1],y,ax=ax)
    ax.set_title('{} neighbor(s)'.format(n_neighbors))
    ax.set_xlabel('feature 0')
    ax.set_ylabel('feature 1')

axes[0].legend(loc=3)
plt.show()