机器学习KNN算法--（2）KNN算法的分割数据集及测试

最新推荐文章于 2023-08-22 09:05:17 发布

一只努力的菜鸡

最新推荐文章于 2023-08-22 09:05:17 发布

阅读量2.6k

点赞数 3

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_43405767/article/details/96484130

版权

本文介绍了如何对鸢尾花数据集进行80/20分割，以创建训练集和测试集。通过使用random库的permutation函数打乱数据，并自定义测试分割函数。在设定seed确保可重复性后，应用KNN算法并测试其准确性。最后，展示了如何在Jupyter Notebook中导入和使用KNN算法。

摘要由CSDN通过智能技术生成

机器学习KNN算法（二）--KNN算法的分割数据集及测试

对鸢尾花数据集进行数据集分割

首先加载鸢尾花数据集（用的是Anaconda的Jupyter Notebook）

import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
from sklearn import datasets

iris=datasets.load_iris()
x=iris.data[:,2:]                   #取所有行的后两列
for i,colors,marker in [(0,"red","o"),(1,"blue","+"),(2,"green","x")]:
    plt.scatter(x[y==i,0],x[y==i,1],color=colors,marker=marker)