一张图总结机器学习降维算法

最新推荐文章于 2024-04-15 21:43:55 发布

王蒟蒻

最新推荐文章于 2024-04-15 21:43:55 发布

阅读量647

点赞数 1

分类专栏： # 机器学习实战书籍文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_41413511/article/details/118463498

版权

13 篇文章 1 订阅

订阅专栏

在这里插入图片描述
一些问题
减少数据集维度的主要动机是什么？主要缺点是什么？

维度的诅咒是什么？

许多在低维空间中不存在的问题，在高维空间中发生。在机器学习领域，一个常见的现象是随机抽样的高维向量通常非常稀疏，提升了过拟合的风险，同时也使得在没有充足训练数据的情况下，要识别数据中的模式非常困难。

一旦降低了数据集的维度，是否可以你操作？如果可以，怎么做？如果不能，为什么？

几乎不可能再将操作完美的逆转，因为在降温过程中必然丢失了一部分信息。此外，虽然有一些算法拥有简单的逆转换过程，可以重建出与原始数据集相似的数据集，但是也有一些算法不能实现逆转。

你可以使用PCA来减少高度非线性的数据集的维度吗？

在什么情况下你将使用常规PCA?增量PCA?随机PCA内核PCA

常规PCA是默认选择,但是他仅适用于内存足够处理训练集的时候。
增量PCA对于内存无法支持的大型数据集非常有用，但是他比常规PCA要慢一些。所以内存如果能够支持,还是应该使用常规PCA。当你随时需要应用PCA来处理每次新增的实例时，增量PCA对于在线任务同样有用。
当你想大大降低维度数量，并且内存能够支持数据集时，使用随机PCA非常有效，他比常规PCA快得多。
对于非线性数据集,使用核化PCA非常有效。

如何评估数据集中的降维算法的性能？

链接两个不同的降维算法是否有意义？

其他降维见之前的李宏毅学习笔记

关注