Iris数据集使用PCA/LDA/KPCA降维的结果比较

最新推荐文章于 2021-12-06 09:39:21 发布

靠影

最新推荐文章于 2021-12-06 09:39:21 发布

阅读量1.7k

点赞数

本文链接：https://blog.csdn.net/ctffengzi/article/details/103661481

版权

该博客探讨了在Iris数据集上使用PCA、LDA和KPCA进行降维的效果。PCA是无监督降维方法，力求最大化投影后数据的方差；LDA是有监督降维，注重类别间的方差和组内的方差。KPCA作为PCA的非线性版本，通过非线性映射增强分类能力。通过可视化工具，作者比较了三种方法的降维结果，并指出在有标签数据时，LDA能提供更好的分类性能。

摘要由CSDN通过智能技术生成

一、实验描述
分别使用PCA、LDA和KPCA方法对Iris数据集进行降维，利用可视化工具比较降维的效果。

二、分析及设计
Principal component analysis(PCA) 算法简介
PCA的思想就是将n维特征映射到k维上(k<n)，这k维是重新构造出来的全新维度特征，而不是简单的从n维特征去除n-k维特征，这k维就是主成分。

对数据中心化
求特征的协方差矩阵
求协方差矩阵的特征值和特征向量
取最大的k个特征值所对应的特征向量
将样本点投影到选取的特征向量上
Linear Discriminant Analysis(LDA) 算法简介
可以参考这篇教程

Kernel Principal component analysis(KPCA) 算法简介
KernelPCA是PCA的一个改进版，它将非线性可分的数据转换到一个适合对齐进行线性分类的新的低维子空间上，核PCA可以通过非线性映射将数据转换到一个高维空间中，在高维空间中使用PCA将其映射到另一个低维空间中，并通过线性分类器对样本进行划分。

核函数：通过两个向量点积来度量向量间相似度的函数。常用函数有：多项式核、双曲正切核、径向基和函数(RBF) (高斯核函数)等。

三、详细实现
导入需要的模块以及数据

from sklearn.datasets import load_iris
import numpy as np
from sklearn import decomposition
import matplotlib.pyplot as plt
def load_data():
    return load_iris()

def load_data_tag():
    iris = load_data()
    return iris.data, iris.target

1.PCA

def PCA(data, n):
    from sklearn.decomposition import PCA
    pca = PCA(n_components=n)
    pca_result = pca.fit_transform(data.data)
    return pca_result

2.LDA

def LDA(data, n):
    from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDA
    lda = LDA(n_components=n)
    lda_result = lda.fit_transform(data.data, data.target)
    return lda_result

3.PCA和LDA的可视化

def plot(data, n):
    pca_result = PCA(data, n)
    lda_result = LDA(data, n)

    plt.subplot(1

最低0.47元/天解锁文章

靠影

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Iris数据集使用PCA/LDA/KPCA降维的结果比较

一、实验描述分别使用PCA、LDA和KPCA方法对Iris数据集进行降维，利用可视化工具比较降维的效果。二、分析及设计Principal component analysis(PCA) 算法简介PCA的思想就是将n维特征映射到k维上(k<n)，这k维是重新构造出来的全新维度特征，而不是简单的从n维特征去除n-k维特征，这k维就是主成分。对数据中心化求特征的协方差矩阵求协方差矩阵...
复制链接

扫一扫