基于 Python 的 11 种经典数据降维算法---数据挖掘

本文介绍了基于Python的11种经典数据降维算法在数据挖掘中的应用,包括PCA、KPCA、LDA等线性和非线性方法。数据降维旨在简化高维数据,提高算法效率,减少冗余信息。文章由哈尔滨工业大学在读硕士Heucoder整理,提供了相关代码和资料。
摘要由CSDN通过智能技术生成

基于 Python 的 11 种经典数据降维算法—数据挖掘

	通常,我们会发现大部分数据集的维度都会高达成百乃至上千,而经典的 MNIST,
其维度都是 64。我们所用到的有用信息却并不需要那么高的维度,而且每增加一维
所需的样本个数呈指数级增长,这可能会直接带来极大的「维数灾难」。而数据降
维,也常应用于文本处理、人脸识别、图片识别、自然语言处理等领域。
  • 数据降维:高维数据下降为低维数据
    (1)使得数据集更易使用;
    (2)确保变量之间彼此独立
    (3)降低算法计算运算成本
  • 数据降维原理:往往高维空间的数据会出现分布稀疏的情况,在降维处理的过程中,通常会做一些数据删减,这些数据包括了冗余的数据、无效信息、重复表达内容

(1)线性降维方法:PCA 、ICA、 LDA、LFA、LPP(LE 的线性表示)
(2)非线性降维方法:
- 基于核函数的非线性降维方法——KPCA 、KICA、KDA
- 基于特征值的非线性降维方法(流型学习)——ISOMAP、LLE、LE、LPP、LTSA、MVU
哈尔滨工业大学计算机技术专业的在读硕士生 Heucoder 则整理了 PCA、KPCA、LDA、MDS、ISOMAP、LLE、TSNE、AutoEncoder、FastICA、SVD、LE、LPP 共 12 种经典的降维算法,并提供了相关资料、代码以及展示.

序号 算法
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值