机器学习KNN算法--(2)KNN算法的分割数据集及测试

本文介绍了如何对鸢尾花数据集进行80/20分割,以创建训练集和测试集。通过使用random库的permutation函数打乱数据,并自定义测试分割函数。在设定seed确保可重复性后,应用KNN算法并测试其准确性。最后,展示了如何在Jupyter Notebook中导入和使用KNN算法。
摘要由CSDN通过智能技术生成

对鸢尾花数据集进行数据集分割

首先加载鸢尾花数据集用的是Anaconda的Jupyter Notebook

import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
from sklearn import datasets

iris=datasets.load_iris()
x=iris.data[:,2:]                   #取所有行的后两列
for i,colors,marker in [(0,"red","o"),(1,"blue","+"),(2,"green","x")]:
    plt.scatter(x[y==i,0],x[y==i,1],color=colors,marker=marker)

输出结果为

在这里插入图片描述
此时的数据集是150行2列的,我们的目标是取其中的百分之八十做数据集,百分之二十做测试集,然后用那0.2的测试数据去测试,把测试结果从源数据集中分离出来的测试集 中的数据作比较,来测试算法的准确度,首先先分割数据集

这里用了一个random中的permutation(),他可以生成随机的数字并且打乱,


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值