基于K-最近邻算法构建鸢尾花分类模型

基于K-最近邻算法构建鸢尾花分类模型

鸢尾花(Iris)数据集是机器学习中一个经典的数据集。

假设有一名植物学爱好者收集了150朵鸢尾花的测量数据:花瓣的长度和宽度以及花萼的长度和宽度,这些花已经鉴定为属于Setosa、Versicolor和Virginica三个品种之一。

本任务的主要工作内容包括:

1、 使用 Pandas 和 Matplotlib 可视化并观察数据;

请添加图片描述

2、 将数据集随机拆分为训练集(train set)和测试集(test set);

3、 构建一个机器学习分类模型(K-最近邻算法)并评估其准确性(Accuracy)。

资源包下载链接

二 任务目标

  1. 掌握机器学习的基本概念,如样本、特征、训练集和测试集、泛化能力、模型评估、模型的准确性(Accuacy)等。 重点
  2. 熟悉使用Scikit-learn构建机器学习模型的基本过程。 重点
  3. 熟悉K-最近邻算法(KNN算法)的思想。 重点
  4. 掌握数据集拆分函数、训练拟合函数、模型评估函数的使用。 重点

三 任务环境

  • 操作系统:Windows 10、Ubuntu18.04

  • 工具软件:Anaconda3 2019、Python3.7

  • 硬件环境:无特殊要求

  • 依赖库列表

    matplotlib   	3.3.4
    numpy 			1.19.5
    pandas			1.1.5
    scikit-learn	0.24.2
    

四 任务分析

因为学习数据中已知鸢尾花的品种(即数据的标签),所以这是一个监督学习,另外模型的用途是预测新的测量数据的品种,因此这是一个分类(Classification)问题。单个数据点(一朵鸢尾花的测量数据)的预期输出是这朵花的品种(标签)。

本任务涉及以下几个环节:

a)认识数据、观察数据(可视化)

b)将数据拆分为训练集与测试集

c)构建模型:K最近邻算法

d)训练模型

e)评估模型

五 资源介绍

5.1 资源截图

请添加图片描述

5.2 部分代码截图

请添加图片描述

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值