降维和特征选择的关键方法介绍及MATLAB实现

最新推荐文章于 2024-09-09 10:40:36 发布

奔跑的Yancy

最新推荐文章于 2024-09-09 10:40:36 发布

阅读量3.4w

点赞数 47

分类专栏：机器学习算法MATLAB实例文章标签：降维特征选择 PCA PLS 正则化

本文链接：https://blog.csdn.net/lyxleft/article/details/82984477

版权

本文介绍了降维和特征选择的概念，重点讲解了PCA和PLS方法，包括MATLAB的实现。PCA通过主成分分析提取特征，而PLS则综合考虑了主成分对输入和输出变量的解释能力。文中提供了MATLAB函数解读，包括princomp和plsregress，并通过光谱数据的PCR和PLS例子进行说明。特征选择方面讨论了Filter和Wrapper方法，以及正则化方法的作用。

摘要由CSDN通过智能技术生成

主成分分析（Principle Component Analysis, PCA）方法

偏最小二乘法(Partial Least Squares, PLS)

概念理解

降维：

比如现在有100维的变量来表征一个东西，我们觉得太冗余复杂了，想降低到10维。但是我们没有确定的筛选依据，直接使用数学工具来实现降维，就好像丢进了一个黑箱，经过抽象、提炼，得到了新的10维特征，这新的10维特征可能失去了物理意义，我们也不知道它们具体是怎么来的，表征什么，但是确实是可以用它们表征这个东西，而且是经过了原先100维特征的信息的融合、取舍过程。它的过程是比较高级的。

特征选择：

选择出100维特征里面最重要的10个特征，这个筛选过程是有依据的。比如苹果有很多特征，大小，形状，颜色，味道，生长季节，……。我们选择：颜色红、味道甜等几个非常明显的重要的特征出来就足以表示苹果了。当然，颜色和味道可能也有一定的耦合关系，生成地点、时间也有耦合关系，如果懒得管特征之间的耦合关系，直接丢进降维的黑箱中，也可以得到新的几个降维后的特征，但我们可能就说不出这个特征的含义了，只是一些数据信息而已了。