为什么要进行特征选择和数据降维?
“特征选择是选择用于模型构建的相关特征的子集的过程”,或者换句话说,选择最重要的特征。
降维是指通过保留一些比较重要的特征,去除一些冗余的特征,减少数据特征的维度。但降维之后的数据不可解释了,改变了原来的维度所在的意义,产生了新的维度。
一、特征选择的三种方式?
1.过滤选择
二、降维
1.PCA---方差越大,数据反应的信息就越多
“特征选择是选择用于模型构建的相关特征的子集的过程”,或者换句话说,选择最重要的特征。
降维是指通过保留一些比较重要的特征,去除一些冗余的特征,减少数据特征的维度。但降维之后的数据不可解释了,改变了原来的维度所在的意义,产生了新的维度。