（模式识别）特征降维问题

最新推荐文章于 2022-05-30 22:42:38 发布

爱吃香菇的小姑娘

最新推荐文章于 2022-05-30 22:42:38 发布

阅读量1.6k

点赞数

分类专栏：模式识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zwj256920/article/details/80524888

版权

特征降维是为了解决多重共线性、高维稀疏性和变量冗余问题。PCA是常用的线性方法，通过正交变换找到主要成分，但可能无法捕捉非线性属性。LDA则侧重于分类，同时考虑类别信息。非线性方法如LLE和Laplacian Eigenmaps则适用于非线性结构数据。在Matlab中，PCA可利用princomp函数实现。

摘要由CSDN通过智能技术生成

（模式识别）特征降维问题

降维的必要性

多重共线性--预测变量之间相互关联。多重共线性会导致解空间的不稳定，从而可能导致结果的不连贯。
高维空间本身具有稀疏性。一维正态分布有68%的值落于正负标准差之间，而在十维空间只有0.02%。
过多的变量会妨碍查找规律的建立。
仅在变量层面上分析可能会忽略变量之间的潜在联系。

降维的目的：

减少预测变量的个数
确保这些变量是相互独立的
提供一个框架来解释结果

降维的方法主要有：1.主成分分析算法（PCA）、2.线性判别分析（LDA）、3.局部线性嵌入（LLE）、4.拉普拉斯特征映射（Laplacian Eigenmaps）

1.主成分分析算法（PCA）

主成分分析法是一种数据压缩的常用方法。主要是基于正交变换的思想，保留有显著贡献的特征向量。任取一个特征向量，如果它所对应的特征值在数据集上代表一个显著的方差值，则它称之为这个数据集的一个主成分。（其中，每一个特征向量和一个方差对应，而这个方差又由对应的特征值表示）

主成分分析算法存在的缺点：

主成分法是基于原始特征的一种线性变换。若原始数据中存在

最低0.47元/天解锁文章

爱吃香菇的小姑娘

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。