python机器学习之降维算法PCA(高维数据的可视化,鸢尾花案例)

最新推荐文章于 2025-04-29 22:56:57 发布

黎明之道

最新推荐文章于 2025-04-29 22:56:57 发布

阅读量1.2w

点赞数 14

分类专栏：机器学习文章标签：可视化 python 机器学习深度学习人工智能

本文链接：https://blog.csdn.net/sjjsaaaa/article/details/110443757

版权

本文介绍了如何使用PCA进行高维数据的降维和可视化，通过鸢尾花数据集展示了降维过程。主要内容包括设置降维的n_components参数，调用PCA模型，以及通过累积可解释方差贡献率曲线选择最佳的特征数量。曲线有助于确定最佳的n_components值，以最大化新特征矩阵的信息捕获能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

高维数据的可视化

n_components是我们降维后需要的维度，即降维后需要保留的特征数量，降维流程中第二步里需要确认的k值，一般输入[0, min(X.shape)]范围中的整数。

调用库和模块

import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.decomposition import PCA

提取数据集

iris = load_iris()
x = iris.data
y = iris.target

x.shape

#作为数据表或特征矩阵，x是几维
import pandas as pd
pd.DataFrame(x)

在这里插入图片描述
建模调用PCA

pca = PCA(n_components=2)#实例化
pca = pca.fit(x)#拟合模型
x_dr = pca.transform(x)#获取新矩阵
#也可以一步到位
#x_dr = PCA(2).fit_transform(x)
x_dr

在这里插入图片描述
可视化

x_dr[y ==0,0]#采用布尔索引

#画出分类图
plt.figure()

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

黎明之道

关注关注

14
点赞
踩
135

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

【人工智能机器学习基础篇】——深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理

编程技术探索者，分享C/C++、C#、Java、数据库等开发经验，聚焦实战技巧与AI兴趣，助力编程爱好者成长。

12-31

3384

【人工智能机器学习基础篇】——深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理

Python数据挖掘笔记七 .PCA降维操作及subplot子图绘制

湾区人工智能

03-23

2184

Python数据挖掘笔记七 .PCA降维操作及subplot子图绘制这篇文章主要介绍四个知识点，也是我那节课讲课的内容。 1.PCA降维操作； 2.Python中Sklearn的PCA扩展包； 3.Matplotlib的subplot函数绘制子图； 4.通过Kmeans对糖尿病数据集进行聚类，并绘制子图。一. PCA降维为了...

4 条评论您还未登录，请先登录后发表或查看评论

PCA 原理及 Python 实现

最新发布

belldeep的专栏

04-29

506

参考书：《统计学习方法》第2版第16章主成分分析（PCA）示例

python主成分分析_Python机器学习笔记：主成分分析（PCA）算法

weixin_39570530的博客

11-28

1924

一：引入问题首先看一个表格，下表是某些学生的语文，数学，物理，化学成绩统计：首先，假设这些科目成绩不相关，也就是说某一科目考多少分与其他科目没有关系，那么如何判断三个学生的优秀程度呢？首先我们一眼就能看出来，数学，物理，化学这三门课的成绩构成了这组数据的主成分（很显然，数学作为第一主成分，因为数据成绩拉的最开）。那么为什么我们能一眼看出来呢？当然是我们的坐标轴选对了！！下面，我们继续看一个表格，下...

高维数据可视化示例

choosetobehappy的博客

08-16

3662

高维数据可视化示例文中代码均在Jupyter Notebook中运行文中所需两个数据文件在下面给出。文中数据集下载1 文中数据集下载2 目录高维数据可视化示例单变量分析多变量分析可视化二维数据可视化三维数据可视化四维数据可视化 5 维数据可视化 6 维数据（6-D）结论 import pandas as pd import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D import matplotlib as mpl

PCA降维_鸢尾花案例python代码实现

ThePaK的博客

12-08

2652

PCA降维

python pca函数_在Python中实现PCA（基于特征向量）

weixin_33877700的博客

03-01

1356

我尝试用Python实现PCA。我的目标是创建一个行为类似于Matlab的PCA实现的版本。然而，我认为我错过了一个关键点，因为我的测试部分产生了错误符号(+/-)的结果。在你能找出算法的错误吗？为什么这些标志有时不同？在基于特征向量的PCA实现：new_array_rank=4A_mean = np.mean(A, axis=0)A = A - A_meancovariance_matrix =...

降维算法PCA的应用----高维数据的可视化

weixin_43776305的博客

06-05

2660

Python 数据可视化学习笔记之高维数据可视化及其方法

qq_48219609的博客

11-23

7071

一、高维数据 高维数据泛指高维（multidimensional）和多变量（multivariate）数据 -- 高维是指数据具有多个独立属性 -- 多变量是指数据具有多个相关属性 高维数据可视化的挑战：如何呈现单个数据点的各属性的数据值分布，以及比较多个高维数据点之间的属性关系，从而提升高维数据的分类、聚类、关联、异常点检测、属性选择、属性关联分析和属性简化等任务的效率。说明： 1.聚类：聚类是一种无监督学习的手段，其目的是使相似数据点分布在同一类中，而不同数据点处于不同类中或者噪声中 .

Python机器学习小项目实战：PCA降维与可视化探索

qq_40884337的博客

03-06

3353

特征空间是由所有特征组成的向量空间。例如，如果一个数据集包含两个特征：年龄和收入，那么特征空间就是一个二维平面，每个客户都可以表示为该平面上的一个点。PCA 是一种常用的线性降维算法，可以有效地降低数据的维度，提取数据的主要特征，方便数据可视化。就像将一幅复杂的地图简化成一张只有主要道路的简图，降维算法可以帮助我们提取数据的精华，去除冗余信息。投影后的数据在新的特征上的方差最大化，这意味着这些新的特征能够最好地区分不同的数据点。随着维度的增加，数据空间的体积呈指数增长，导致数据变得稀疏，模型更容易过拟合。

基于PCA实现鸢尾花数据集降维【源程序】【Python】

03-29

基于Python3.7实现鸢尾花数据集降维，调用PCA算法。包括源程序和结果图片。

PCA实现代码（Python）

04-16

提供了PCA实现的代码，以及图片处理实例的代码，图片需要自己寻找且编号（16张，编号为01,02,...,16.jpg）

基于PCA模型的鸢尾花数据可视化_pythonpca花_PCA鸢尾花_python_PCA模型_鸢尾花数据_

10-02

使用Python编写的小程序代码，基于PCA模型的鸢尾花数据可视化。

Python进行PCA降维，以及可视化

Kp0fS的草稿纸

10-28

5026

Python进行PCA降维

PCA降维及降维过程python可视化分析

qq_53383206的博客

01-25

3492

PCA降维numpy实现，python可视化分析PCA降维实质

python实现pca_PCA实例和python实现

weixin_39641236的博客

12-07

404

本文给出一个PCA的具体实例和源码：PCA算法算法步骤：设有m条n维数据。1)将原始数据按列组成n行m列矩阵X2)将X的每一行(代表一个属性字段)进行零均值化，即减去这一行的均值3)求出协方差矩阵C=1/m*XXT4)求出协方差矩阵的特征值及对应的特征向量5)将特征向量按对应特征值大小从上到下按行排列成矩阵，取前k行组成矩阵P6)Y=PX即为降维到k维后的数据python实现12345678910...

PCA数据降维原理及python应用（葡萄酒案例分析）

陆海潘江的博客

08-10

1万+

数据降维的一种方法是通过特征提取实现，主成分分析PCA就是一种无监督数据压缩技术，广泛应用于特征提取和降维。换言之，PCA技术就是在高维数据中寻找最大方差的方向，将这个方向投影到维度更小的新子空间。

python的pca函数_PCA降维算法的python实现

weixin_39875503的博客

02-21

3263

主成分分析(PCA)是一种无监督的学习方式，是一种常用的线性降维方法。如果遇到多因素分析，想要很多个自变量与因变量进行线性回归分析，一般都必须进行降维处理，而主成分分析是一种很好的解决方案。一、PCA简介PCA是将数据的n维特征映射到k维上(kPCA求解的一般流程为：(1)将原始数据进行标准化；(2)计算标准化数据集的协方差矩阵；(3)计算协方差矩阵的特征值和特征向量；(4)保留最重要的k个特征(...