K-NN(k近邻算法)基础

最新推荐文章于 2024-04-01 20:48:50 发布

趣谈数据分析

最新推荐文章于 2024-04-01 20:48:50 发布

阅读量304

点赞数

分类专栏：机器学习文章标签：机器学习 KNN 人工智能

本文链接：https://blog.csdn.net/qq_21795835/article/details/84726718

版权

本文介绍了K-NN(k近邻算法)的基础知识，通过可视化展示了不同邻居数（1、3、9）对决策边界的影响。K-NN算法具有模型简单、易于理解的优点，但对稀疏数据集和多特征数据处理效果不佳，且运行速度慢，因此在实际应用中使用相对较少。

摘要由CSDN通过智能技术生成

对于二维数据集，可以画出所有可能的测试点的预测结果，根据平面中每个点所属的类别，对平面进行着色，这样可以查看决策边界。即算法对类别0和类别1的分界线：
用下面的代码分别将1、3、9个邻居三种情况的决策边界可视化：

import mglearn.plots
import mglearn.datasets

import matplotlib.pyplot as plt

from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.neighbors import KNeighborsRegressor
from sklearn.datasets import load_breast_cancer


def knn_decision_boundary():
    X, y = mglearn.datasets.make_forge()
    X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)

    # 二维数据集，决策边界可视化
    fig, axes = plt.subplots(1, 3, figsize=(10, 3))
    for n_num, ax in zip([1, 3, 9], axes):
        clf = KNeighborsClassifier(n_neighbors=n_num).fit(X, y)
        mglearn.plots.plot_2d_separator(clf, X, fill=True, ax=ax, alpha=.4)
        mglearn.discrete_scatter(X[:, 0], X[:, 1], y, ax=ax)
        ax.set_title('{

最低0.47元/天解锁文章

趣谈数据分析

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
K-NN(k近邻算法)基础

对于二维数据集，可以画出所有可能的测试点的预测结果，根据平面中每个点所属的类别，对平面进行着色，这样可以查看决策边界。即算法对类别0和类别1的分界线：用下面的代码分别将1、3、9个邻居三种情况的决策边界可视化：import mglearn.plotsimport mglearn.datasetsimport matplotlib.pyplot as pltfrom sklearn.m...
复制链接

扫一扫

专栏目录