[K最近邻算法KNN]使用案例：酒的分类

紫昂张

已于 2023-06-23 22:05:07 修改

阅读量1.1k

点赞数

分类专栏： Python机器学习文章标签：近邻算法分类 sklearn

于 2023-02-18 00:46:15 首次发布

本文链接：https://blog.csdn.net/Sukey666666/article/details/129095679

版权

Python机器学习专栏收录该内容

30 篇文章 9 订阅

订阅专栏

用K最近邻算法KNN对酒的类型进行预测。数据来源于sklearn的数据集。

导入数据集

from sklearn.datasets import load_wine
wine_data = load_wine()
wine_data.keys()

sklearn里面的datasets 里的每一个数据集都包含以下信息： data：特征数据，target：目标变量，target_names：目标变量的名称，DESCR：数据描述，feature_names：特征名称。

探索数据

wine_data['data'].shape

可以发现这个数据集一共178个样本，13个特征变量。

print(wine_data['DESCR'])

划分数据集

from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(wine_data['data'],wine_data['target'],random_state=0)

在train_test_split()里面的 wine_data['data'],wine_data['target']代表特征变量和目标变量；

也可以先赋值X=wine_data['data']，y=wine_data['target']，train_test_split(X,y,random_state=0)；

random_state是随机种子，可以任意写一个数字。

用shape方法可以看到训练集占75%，测试集25%。

建模&计算得分

# KNN分类模型
from sklearn.neighbors import KNeighborsClassifier  
model_knn = KNeighborsClassifier()
model_knn.fit(X_train,y_train)

format(model_knn.score(X_test,y_test))

模型准确率约73%，也就是对新酒做出预测是正确的概率为73%。

紫昂张

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
[K最近邻算法KNN]使用案例：酒的分类

用K最近邻算法KNN对酒的类型进行预测
复制链接

扫一扫

专栏目录

[K最近邻算法KNN]使用案例：酒的分类

“相关推荐”对你有帮助么？