PCA LDA 对鸢尾花降维后的结果

最新推荐文章于 2023-05-26 22:21:04 发布

guo_dasha

最新推荐文章于 2023-05-26 22:21:04 发布

阅读量1.9k

点赞数 2

本文链接：https://blog.csdn.net/guo_dasha/article/details/90112206

版权

本文通过导入数据包，对鸢尾花数据进行PCA和LDA两种降维方法处理，将数据降至二维并用matplotlib进行可视化。PCA作为无监督方法，而LDA是有监督方法，目标是使类别间投影距离最大化。虽然作者不确定理论是否准确，但结果显示尚可。

摘要由CSDN通过智能技术生成

先导入数据包

比我是直接下好的数据，没有用网上的

import pandas as pd
from pandas import DataFrame
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDA

data = pd.read_excel('IRIS数据集.xls',usecols =[1,2,3,4,5])#usecols这个函数可以获得你想要的数据部分

对数据进行pca 跟lda 操作

他俩都是降维

pca = PCA(n_components=2)
reduced_x = pca.fit_transform(x)

lda = LDA(n_components=2)
reduced_x_lda = lda.fit_transform(x,y)#用lda进行降维

都是把你要的东西降维为你想要的维度（我这里是二维）

降维后我们进行可视化

我这里用的是matplotlib

把降维后的二维数据存入三个列表中，把三个列表的数据进行可视化（用点）

这是lda后的结果

这是用pca降维后的结果

pca更是无监督的降维，lda是有监督的降维。lda是使投影尽可能的分开，然后让判断的数据离样本更接近。

。。。。。其实我也不知道对不对，感觉训练出来的结果还能接受。哈哈

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

guo_dasha

关注关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

对鸢尾花数据集和月亮数据集，分别采用线性LDA、k-means和SVM算法进行二分类可视化分析

zjc

05-17

1443

对鸢尾花数据集和月亮数据集，分别采用线性LDA、k-means和SVM算法进行二分类可视化分析知识理解1.线性LDA2.k-means3.SVM鸢尾花数据集算法可视化1.使用线性LDA对鸢尾花数据集聚类2.使用k-means对鸢尾花数据集聚类3.使用SVM对鸢尾花数据集聚类月亮数据集算法可视化1.使用线性LDA对月亮数据集聚类2.使用k-means对月亮数据集聚类3.使用SVM对月亮数据集聚类知识理解 1.线性LDA 线性判别式分析（Linear Discriminant Analysis），简称为LDA

LDA 鸢尾花

weixin_43326122的博客

05-29

2419

导语在模式分类和机器学习实践中，线性判别分析（Linear Discriminant Analysis, LDA）方法常被用于数据预处理中的降维（dimensionality reduction）步骤。LDA在保证良好的类别区分度的前提下，将数据集向更低维空间投影，以求在避免过拟合（“维数灾难”）的同时，减小计算消耗。 Ronald A. Fisher 在1936年（The Use of Multiple Measurements in Taxonomic Problems）提出了线性判别（Linear

参与评论您还未登录，请先登录后发表或查看评论

LDA算法实现鸢尾花数据集降维

ZHW-鲜橙大AI课题组的博客

05-26

1823

唐杰，男，西安工程大学电子信息学院，2022级研究生研究方向：机器视觉与人工智能电子邮件：3225033259@qq.com陈梦丹，女，西安工程大学电子信息学院，2022级硕士研究生，张宏伟人工智能课题组研究方向：机器视觉与人工智能电子邮件：1169738496@qq.comIris数据集的中文名是安德森鸢尾花卉数据集，英文全称是Anderson’s Iris data set。Iris包含150个样本，对应数据集的每行数据。

python 降维lda算法的使用_【Python】降维算法PCA和LDA的实现及总结

weixin_39743423的博客

12-09

992

以Iris数据集为例，分别实现PCA和LDA降维算法原理主成分分析(Principal Component Analysis，PCA)是一种常用的线性降维数据分析方法，其实质是在能尽可能好的代表原特征的情况下，将原特征进行线性变换、映射至低纬度空间中。算法实现首先将数据做中心化处理12meanVal = np.mean(X, axis=0)W = X - meanVal这里说一下，中心化就是使得样...

分类2：LDA-KNN 处理iris（鸢尾花）数据集代码

ww596520206的博客

09-24

343

使用KNN对鸢尾花数据集进行分类，并且使用LDA进行降维，然后再使用KNN做对比实验 2 加载数据注意： 3 使用KNN进行分类 KNN模型，K=5 为K紧邻，K=1为最近邻，使用费fit训练模型，使用predict函数进行预测，最后使用acc计算精度。 4 先使用LDA进行降维，再使用KNN进行分类使用LDA将维度降低到1维使用transform对原数据进行降维，例如原来是4维的，现在是1维的，则会生成一个4*1的矩阵，降维后的数据特征是1维；使用KNN进行降维

svm_multi_SVM鸢尾花_datapreprocessing_ldasvm_fitcsvm_LDA；PCA_

10-03

本项目针对鸢尾花数据集，运用了SVM进行多元分类，同时提供了数据预处理的两种方法：主成分分析（Principal Component Analysis, PCA）和线性判别分析（Linear Discriminant Analysis, LDA）。接下来，我们将深入...

python导入鸢尾花数据集，使用主成分分析函数对鸢尾花数据集降维数据集和原始数据集分别进行线性判别比较分析的准确率

热门推荐

北落师门XY的博客

07-06

1万+

参考教程：https://mp.weixin.qq.com/s/QqqLAxx92v_HOg7QBKrK6A 一、wine数据集介绍 sklearn的wine数据，它有178个样本，13个特征（Alcohol ，Malic acid ，Ash等），总共分为三类。二、查看三个特征下的数据分布 #葡萄酒数据集+PCA import matplotlib.pyplot as plt#画图工具...

鸢尾花分类与降维

12-21

这段时间，自己学习了一些有关机器学习的算法，现在拿鸢尾花分类来对这四种进行巩固与回顾。这些算法都是直接使用的skearn库的算法，并未自己编写。 鸢尾花的降维 import matplotlib.pyplot as plt from sklearn.decomposition import PCA from sklearn.datasets import load_iris data = load_iris() y = data.target X = data.data pca = PCA(n_components=2) reduced_X = pca.fit_transform(X) re

基于鸢尾花数据集实现线性判别式多分类

12-21

基于鸢尾花数据集实现线性判别式多分类本文在自己编写梯度下降的逻辑斯蒂判别式算法的基础上，对鸢尾花数据集实现多分类。 鸢尾花数据集公包含三类数据，每条数据四个特征，从中随机选取70%的数据作为训练集，30%的数据作为测试集。主要包含三个函数：随机生成70%测试集函数、训练函数、预测函数随机生成70%测试集函数 randomdata 输入：无输出：0-49之间的35个随机数代码： def randomdata(): array = set() while(len(array) < 50*0.7): n = random.randint(0,49)

使用matlab完成对鸢尾花数据集的特征选择、主成分分析（PCA）、核主成分分析（KPCA）、线性判别分析（LDA）的若干处理

weixin_46538207的博客

04-20

939

使用matlab完成对鸢尾花数据集的特征选择、主成分分析（PCA）、核主成分分析（KPCA）、线性判别分析（LDA）的若干处理

LDA---鸢尾花数据集

Nanopipi的博客

02-24

1353

LDA实现话不多说。直接来代码吧整理的比较简单，记录自己的学习过程下面展示一些内联代码片。 import pandas as pd import numpy as np from matplotlib import pyplot as plt from sklearn.preprocessing import LabelEncoder from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDA featur

对鸢尾花数据集和月亮数据集，分别采用线性LDA、k-means和SVM算法进行二分类可视化分析(python编程)

mango

05-18

2163

这里写目录标题一、简述算法线性LDA、k-means和SVM算法二、线性判别分析LDA1.鸢尾花数据集2.月亮数据集三、k-means聚类分析1.鸢尾花数据集2.月亮数据集四、SVM（支持向量机）算法1.鸢尾花数据集2.月亮数据集五、SVM算法的优缺点一、简述算法线性LDA、k-means和SVM算法算法基本思想 LDA LDA 是一种可作为特征抽取的技术，其目标是向最大化类间差异，最小化类内差异的方向投影，以利于分类等任务即将不同类的样本有效的分开。LDA 可以提高数据分析过程中的计

PCA和LDA鸢尾花实现

Nanopipi的博客

02-17

336

PCA 运行结果没有粘贴，自行操作哦下面展示一些内联代码片。 ##用于3D可视化 from mpl_toolkits.mplot3d import Axes3D ##用于可视化图表 import matplotlib.pyplot as plt ##用于做科学计算 import numpy as np ##用于做数据分析 import pandas as pd ##用于加载数据或生成数据等 from sklearn import datasets ##导入PCA库 from sklearn.decomp

主成分分析应用实例(Matlab)：鸢尾花分类

刘广隶的博客

01-01

1万+

主成分分析技术应用实例

对鸢尾花数据集和月亮数据集，分别采用LDA、k-means和SVM算法进行二分类可视化分析(python)

weixin_43709601的博客

05-18

3534

对鸢尾花数据集和月亮数据集，分别采用线性LDA、k-means和SVM算法进行二分类可视化分析(python) 一、线性判别分析LDA 1、LDA介绍线性判别分析(linear discriminant analysis，LDA)是对费舍尔的线性鉴别方法的归纳，这种方法使用统计学，模式识别和机器学习方法，试图找到两类物体或事件的特征的一个线性组合，以能够特征化或区分它们。所得的组合可用来作为一个线性分类器，或者，更常见的是，为后续的分类做降维处理。线性判别分析是一种经典的线性学习方法，在二分类问题上最早

分类1：Fisher（LDA）处理iris（鸢尾花）数据集代码

ww596520206的博客

09-24

1345

使用sklearn中的LDA处理鸢尾花数据集，理论知识详见西瓜书或者sklearn文档即可，只对代码进行说明。LDA在降维的时候需要注意维度要小于原有维度，或者N-1，N表示类别的数目。

python中pca算法鸢尾花降维

11-06

PCA（Principal Component Analysis）是一种常用的降维算法，可以用于处理鸢尾花数据集中的特征向量。 鸢尾花数据集包含四个特征：花萼长度、花萼宽度、花瓣长度和花瓣宽度。首先，我们需要对数据进行标准化处理，将每个特征的均值调整为0，标准差调整为1，这样可以确保每个特征对降维的结果的贡献度是相同的。然后，我们计算鸢尾花数据集的协方差矩阵。协方差矩阵是一个对称矩阵，描述了不同特征之间的相关性。接下来，我们对协方差矩阵进行特征值分解，得到特征值和特征向量。特征值告诉我们每个特征向量的重要程度，特征向量是协方差矩阵的特征方向。我们可以根据特征值的大小来选择保留的特征个数。通常情况下，我们选择特征值最大的前k个作为主成分，因为这些特征值对应的特征向量可以解释原始数据中大部分的方差。最后，我们可以通过将原始数据与选定的主成分进行点积运算，得到降维后的数据集。新数据集的每个样本都是原始特征的线性组合，这些线性组合使得新的特征集上样本的方差最大化。 Python中可以使用sklearn库实现PCA算法。通过对鸢尾花数据集调用PCA算法，我们可以获得一个降维后的数据集，其中维度较低且保留了大部分原始数据的信息。使用PCA算法可以将鸢尾花数据集从原始的四维降至更低的维度，这在可视化和数据分析中非常有用。这可以帮助我们更好地理解数据集，并更方便地进行后续的分析和建模。