PCA线性降维——应用于IRIS鸢尾花数据集

该博客介绍了如何使用PCA(主成分分析)对IRIS鸢尾花数据集进行线性降维,从四个特征降至二维。通过查看不同特征组合的数据分布,展示PCA如何帮助区分不同种类的鸢尾花。最后,利用pandas库进一步分析降维后的数据分布。
摘要由CSDN通过智能技术生成

一、IRIS数据集

Iris数据集是常用的分类实验数据集,也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度(sepal length,sepal width ,petal length ,petal width )4个特征预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。

150个数据,3类,4个特征

二、选取三个特征查看数据分布情况

选取三个特征的原因是人对三维空间比较有概念

import matplotlib.pyplot as plt#画图工具
from mpl_toolkits.mplot3d import Axes3D
from sklearn import datasets
data=datasets.load_iris()
X=d
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值