机器学习算法-K近邻（KNN）算法（二）：二维数据，鸢尾花，模拟数据-算法实战（代码附详细注释）

最新推荐文章于 2024-02-15 10:20:03 发布

不语菠萝

最新推荐文章于 2024-02-15 10:20:03 发布

阅读量1.3k

点赞数

分类专栏： KNN（K近邻）文章标签：机器学习

本文链接：https://blog.csdn.net/qq_41669491/article/details/111656676

版权

本文通过二维鸢尾花数据和鸢尾花数据集展示了K近邻(KNN)算法的分类应用，详细介绍了模型训练、预测及可视化过程。对于不同K值的选择，如k=1和k=15，分析了其对模型鲁棒性的影响。同时，还探讨了模拟数据集上的KNN回归问题，揭示了k值过小可能导致过拟合，而k值过大可能引起欠拟合的现象，建议在实际应用中根据数据规模选择合适的k值范围。

摘要由CSDN通过智能技术生成

二维鸢尾花数据-KNN分类

step 1：库函数导入

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.colors import ListedColormap
from sklearn.neighbors import KNeighborsClassifier
from sklearn import datasets

step 2：数据导入

#使用莺尾花数据集的前两维数据，便于数据可视化
iris = datasets.load_iris() #加载鸢尾花数据集
X = iris.data[:, :2] #取鸢尾花数据集前两列特征
y = iris.target #y为鸢尾花的类别信息

step 3：模型训练&可视化

k_list = [1, 3, 5, 8, 10, 15] # 因为要比较不同K值下模型的性能，所以选择了6个不同的k值。
h = .02，步长，用来设置x和y轴上两个数字之间的间距
# 创建不同颜色的画布
cmap_light = ListedColormap(['orange', 'cyan', 'cornflowerblue']) #画布上不同区域的颜色
cmap_bold = ListedColormap(['darkorange', 'c', 'darkblue']) #数据集点的颜色

plt.figure(figsize=(15,14)) #画图的尺寸
# 根据不同的k值进行可视化
for ind,k in enumerate(k

最低0.47元/天解锁文章

不语菠萝

关注

0
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法-K近邻（KNN）算法（二）：二维数据，鸢尾花，模拟数据-算法实战（代码附详细注释）

二维鸢尾花数据-KNN分类step 1：库函数导入import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn import datasetsstep 2：数据导入#使用莺尾花数据集的前两维数据，便于数据可视化iris = datasets.
复制链接

扫一扫

专栏目录