机器学习降维算法对比分析(待补充)

最新推荐文章于 2022-11-30 23:25:08 发布

Y_hero

最新推荐文章于 2022-11-30 23:25:08 发布

阅读量830

点赞数

分类专栏：机器学习文章标签：降维算法机器学习

本文链接：https://blog.csdn.net/Y_hero/article/details/88784182

版权

主要的方法有属性(特征)选择，线性映射和非线性映射方法三大类。一、属性(特征)选择缺失值比率：如果数据集的缺失值太多，我们可以用这种方法减少变量数。低方差滤波：这个方法可以从数据集中识别和删除常量变量，方差小的变量对目标变量影响不大，所以可以放心删去。高相关滤波：具有高相关性的一对变量会增加数据集中的多重共线性，所以用这种方法删去其中一个是有必要的。随机森林反向特征消除前向特征选择...

摘要由CSDN通过智能技术生成

主要的方法有属性(特征)选择，线性映射和非线性映射方法三大类。

一、属性(特征)选择

缺失值比率：如果数据集的缺失值太多，我们可以用这种方法减少变量数。

低方差滤波：这个方法可以从数据集中识别和删除常量变量，方差小的变量对目标变量影响不大，所以可以放心删去。

高相关滤波：具有高相关性的一对变量会增加数据集中的多重共线性，所以用这种方法删去其中一个是有必要的。
随机森林
反向特征消除
前向特征选择

二、线性映射

2.1PCA
主成分分析(PCA) 是最常用的线性降维方法，它的目标是通过某种线性投影，将高维的数据映射到低维的空间中表示，并期望在所投影的维度上数据的方差最大(选取特征值最高的k个特征向量来表示一个矩阵)，以此使用较少的数据维度，同时保留住较多的原数据点的特性。是将原空间变换到特征向量空间内，数学表示为AX = γX。

另一种理解思路：求特征向量的关系，就是把矩阵A所代表的空间，进行正交分解，使得A的向量集合可以表示为每个向量a在各个特征向量上面的投影长度。例如A是mn的矩阵,n>m，那么特征向量就是m个(因为秩最大是m)，n个行向量在每个特征向量E上面有投影，其特征值v就是权重。那么每个行向量现在就可以写为Vn=(E1v1n,E2v2n…Emvmn)，矩阵变成了方阵。如果矩阵的秩更小，矩阵的存储还可以压缩。再: 由于这些投影的大小代表了A在特征空间各个分量的投影，那么我们可以使用最小2乘法，求出投影能量最大的那些分量&#x

最低0.47元/天解锁文章

Y_hero

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习降维算法对比分析(待补充)

主要的方法有属性(特征)选择，线性映射和非线性映射方法三大类。一、属性(特征)选择缺失值比率：如果数据集的缺失值太多，我们可以用这种方法减少变量数。低方差滤波：这个方法可以从数据集中识别和删除常量变量，方差小的变量对目标变量影响不大，所以可以放心删去。高相关滤波：具有高相关性的一对变量会增加数据集中的多重共线性，所以用这种方法删去其中一个是有必要的。随机森林反向特征消除前向特征选择...
复制链接

扫一扫