1.数据集
参考https://blog.csdn.net/qq_39011567/article/details/102657280对鸢尾花数据集的介绍
2.KNN算法分析
1)计算测试数据与各个训练数据之间的距离;
2)按照距离的递增关系进行排序;
3)选取距离最小的K个点;
4)确定前K个点所在类别的出现频率;
5)返回前K个点中出现频率最高的类别作为测试数据的预测分类
3.实验过程
1、使用算法:KNN分类算法
2、实现过程:
1、建立工程,导入sklearn相关包
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt
2、加载数据,创建KNN算法实例
iris = load_iris()
data = iris.data
target = iris.target
data_train,data_test,target_train,target_test=train_test_split(data,targ