KNN算法预测iris数据集

本文介绍了使用KNN算法预测鸢尾花数据集的过程。数据集包含150个样本,4个特征和3种鸢尾花类别。通过皮尔森相关性系数矩阵分析特征,并将数据划分为训练集和测试集进行预测。
摘要由CSDN通过智能技术生成

KNN算法预测iris数据集

1.数据集介绍

鸢尾花灰Iris数据集中有150个样本,每个样本有4个特征,1个标签。其中,鸢尾花种类可取0、1、2,分别代表山鸢尾setosa、变色鸢尾versicolor、维吉尼亚鸢尾virginica。

2.代码解析

首先导入iris数据集,在sklearn库里面已经有了。iris.data()是特征数据,iris.target()是标签数据。根据这些我们绘制一个皮尔森相关性系数矩阵。公式如下:

 我们只需要关注第一个等号后面的公式。两个变量X,Y的皮尔森相关性系数等于他们之间的协方差cov(X,Y)除以他们各自标准差的乘积。这里我不展开具体描述,详细内容可见http://blog.sina.com.cn/s/blog_69e75efd0102wmd2.html。至于协方差和方差的计算我简要说一下。

  • 方差࿱
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值