大数据入门——Iris数据集类别预测（K近邻分类器：KNN）

ykycode

已于 2023-12-07 21:05:23 修改

阅读量3.1k

点赞数 2

分类专栏：大数据竞赛文章标签：大数据竞赛大数据 KNN K近邻 Iris数据集

于 2017-10-11 12:48:15 首次发布

本文链接：https://blog.csdn.net/u012181348/article/details/78202433

版权

大数据竞赛专栏收录该内容

5 篇文章 0 订阅

订阅专栏

#读取数据集细节资料
from sklearn.datasets import load_iris

iris=load_iris()
print(iris.data.shape)
print(iris.DESCR)


#对数据集进行随机分割
from sklearn.cross_validation import train_test_split

X_train, X_test, y_train, y_test=train_test_split(iris.data, iris.target,
test_size=0.25, random_state=33)


#使用K近邻分类器对数据进行类别预测
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier

ss=StandardScaler()
X_train=ss.fit_transform(X_train)
X_test=ss.transform(X_test)

knc=KNeighborsClassifier()
knc.fit(X_train, y_train)
y_predict=knc.predict(X_test)


#对K近邻分类器的预测性能进行评估
print('The accuracy of K-Nearest Neighbor Classifier is', knc.score(X_test, y_test))

from sklearn.metrics import classification_report 

print(classification_report(y_test, y_predict, target_names=iris.target_names))