Python sklearn库实现PCA（以鸢尾花分类为例）

最新推荐文章于 2024-06-23 20:41:57 发布

Cindy0812

最新推荐文章于 2024-06-23 20:41:57 发布

阅读量4w

点赞数 27

分类专栏： Python 文章标签： sk learn

本文链接：https://blog.csdn.net/qq_38825002/article/details/81356377

版权

PCA是一种常用的降维方法，常用于高维数据探索和可视化。本文通过Python的sklearn库，以鸢尾花数据为例，展示如何将4维数据降维到2维，并绘制降维后的样本分布。主要步骤包括数据加载、PCA应用和结果可视化。

摘要由CSDN通过智能技术生成

PCA简介
主成分分析（Principal Component Analysis，PCA）是最常用的一种降维方法，通常用于高维数据集的探索与可视化，还可以用作数据压缩和预处理等。矩阵的主成分就是其协方差矩阵对应的特征向量，按照对应的特征值大小进行排序，最大的特征值就是第一主成分，其次是第二主成分，以此类推。
基本步骤：
具体实现
我们通过Python的sklearn库来实现鸢尾花数据进行降维，数据本身是4维的降维后变成2维，可以在平面中画出样本点的分布。样本数据结构如下图：

其中样本总数为150，鸢尾花的类别有三种，分别标记为0，1，2

代码

import matplotlib.pyplot as plt                 #加载matplotlib用于数据的可视化
from sklearn

关注

专栏目录