1.Iris数据集介绍
Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例。数据集内包含 3 类共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度,可以通过这4个特征预测鸢尾花卉属于(iris-setosa, iris-versicolour, iris-virginica)中的哪一品种。
2.实验总要求:
利用scikit-learn库中的KNeighborsClassifier分类算法,对iris数据的 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度进行分类测试,并给出准确率。
实验过程:
1.利用pandas将iris数据导入到dataframe
import pandas as pd
import numpy as np
dataframe = pd.read_csv("iris.data.txt",
header=None,names=["花萼长度","花萼宽度","花瓣长度","花瓣宽度","花类品质"])
Dataframe