降维算法PCA的应用----高维数据的可视化

本文介绍了使用PCA降维算法将高维数据可视化的过程。通过鸢尾花数据集,展示了PCA如何减少数据维度并保留大部分信息,从而帮助理解数据分布。文章强调了降维后的数据仍能保持与原始标签的一一对应关系,是探索数据分布的有效方法。
摘要由CSDN通过智能技术生成

序言

当我们拿到一堆数据的时候,几乎不可能通过我们的肉眼分辨出数据的分布情况,这时候就想要通过图展示数据的分布,但是现实中数据往往维度很高,而我们人类能看到的最高维度就三维,这时我们就可以通过降维算法PCA将维度降低到三位之下,便于我们观察数据的分布。注意点这里讲的方式只适用于分类型标签数据的可视化

废话不多说看代码

本次使用的数据是sklearn自带的鸢尾花数据集

导入相关模块

from sklearn.datasets import load_iris
from sklearn.decomposition import PCA
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

%matplotlib inline

数据提取

# 提取特征和标签
iris = load_iris()
X = iris['data']
y = iris[
评论 21
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值