数据降维的作用PCA与LDA

最新推荐文章于 2024-07-14 16:32:04 发布

夏天7788

最新推荐文章于 2024-07-14 16:32:04 发布

阅读量8.2k

点赞数 6

分类专栏：机器学习之特征

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuxiatian/article/details/53784931

版权

1. 当你的特征数量p过多，甚至多过数据量N的时候，降维是必须的。

为什么是必须的？有个东西叫curse of dimensionality，维度越高，你的数据在每个特征维度上的分布就越稀疏，这对机器学习算法基本都是灾难性的。
你说特征数量过多，砍一点就行了嘛？但是对不起，就有这样的问题存在，砍不了。
你要研究某个罕见病跟什么基因有关？基因很多哦，人类已知的基因有几千个，可是病例通常也就几百个，有时连几百个都没有……

2. 特征有比较明显的自相关的时候，也可以考虑降维。
自相关会让很多模型的效果变差，主要是线性模型。这些模型效果不好，但是算的快，很多时候很有用。先降维再算会好的多。

最低0.47元/天解锁文章

关注

6
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
数据降维的作用PCA与LDA

1. 当你的特征数量p过多，甚至多过数据量N的时候，降维是必须的。为什么是必须的？有个东西叫curse of dimensionality，维度越高，你的数据在每个特征维度上的分布就越稀疏，这对机器学习算法基本都是灾难性的。你说特征数量过多，砍一点就行了嘛？但是对不起，就有这样的问题存在，砍不了。你要研究某个罕见病跟什么基因有关？基因很多哦，人类已知的基因有几千个，可是病例通常
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。