练习：使用 scikit-learn 的 kNN 分类算法实现水果识别器

最新推荐文章于 2024-06-03 17:49:30 发布

qq_38220914

最新推荐文章于 2024-06-03 17:49:30 发布

阅读量1.1k

点赞数 3

文章标签： scikit-learn 分类 python

本文链接：https://blog.csdn.net/qq_38220914/article/details/127558479

版权

* 题目描述：使用k近邻距离算法创建一个水果识别器，根据水果的属性，判断该水果的种类。

* 题目要求:

* 使用scikit-learn的kNN算法进行识别

* 数据文件：

* 数据源下载地址：https://video.mugglecode.com/fruit_data.csv（数据源与上节课相同）

* fruit_data.csv，包含了59个水果的的数据样本。

* 共5列数据

* fruit_name：水果类别

* mass: 水果质量

* width: 水果的宽度

* height: 水果的高度

* color_score: 水果的颜色数值，范围0-1。

* 0.85 - 1.00：红色

* 0.75 - 0.85: 橙色

* 0.65 - 0.75: 黄色

* 0.45 - 0.65: 绿色

* 如图所示：https://video.mugglecode.com/color_score.jpg

# 数据源下载地址：https://video.mugglecode.com/fruit_data.csv（数据源与上节课相同）

查看提示

* 问题拆解提示：
1. 如何处理样本的字符串标签？
2. 如何建立kNN模型？
3. 如何训练模型？
4. 如何验证模型？
* 问题解决提示：
1. 利用Pandas模块中的map()(https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.map.html)方法进行字符串到数字的映射转换；
2. 利用scikit-learn模块中的KNeighborsClassifier()(http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html)建立kNN模型；
3. 利用scikit-learn模块中的fit()(http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html#sklearn.neighbors.KNeighborsClassifier.fit)方法训练模型；
4. 利用scikit-learn模块中的score()(http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html#sklearn.neighbors.KNeighborsClassifier.score)方法验证模型。