Iris数据集的LDA和PCA二维投影的比较

最新推荐文章于 2023-06-24 15:29:44 发布

壮壮不太胖^QwQ

最新推荐文章于 2023-06-24 15:29:44 发布

阅读量1.5k

点赞数 1

文章标签： python 数据分析

本文链接：https://blog.csdn.net/weixin_46072771/article/details/106242504

版权

本文探讨了鸢尾花数据集的主成分分析（PCA）和线性判别分析（LDA）的应用。通过PCA在2D空间中展示了样本的分布，而LDA则专注于找出类别间差异最大的属性，是一种监督学习方法。

摘要由CSDN通过智能技术生成

鸢尾花数据集代表3种鸢尾花（Setosa，Versicolour和Virginica），具有4个属性：萼片长度，萼片宽度，花瓣长度和花瓣宽度。

应用于此数据的主成分分析（PCA）可以识别出造成数据差异最大的属性（主要成分或特征空间中的方向）组合。在这里，我们在2个第一主成分上绘制了不同的样本。

线性判别分析（LDA）试图识别出类别之间差异最大的属性。尤其是，与PCA相比，LDA是使用已知类别标签的受监督方法。

import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.decomposition import PCA
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
import pandas as pd

iris = datasets.load_iris()

X = iris.data
y = iris.target
target_names = iris.target_names
pd.DataFrame(X, columns=iris.feature_names).head()

在这里插入图片描述

target_names

最低0.47元/天解锁文章

壮壮不太胖^QwQ

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Iris数据集的LDA和PCA二维投影的比较

鸢尾花数据集代表3种鸢尾花（Setosa，Versicolour和Virginica），具有4个属性：萼片长度，萼片宽度，花瓣长度和花瓣宽度。应用于此数据的主成分分析（PCA）可以识别出造成数据差异最大的属性（主要成分或特征空间中的方向）组合。在这里，我们在2个第一主成分上绘制了不同的样本。线性判别分析（LDA）试图识别出类别之间差异最大的属性。尤其是，与PCA相比，LDA是使用已知类别标签的受监督方法。import matplotlib.pyplot as pltfrom sklearn impo
复制链接

扫一扫