1. 定义:
特征降维: 特点的条件下,降低随机变量的个数(特征值),从而得到一组不相关的主变量
a. 降低随机变量的个数
b. 相关
2. 特征降维的方式:
a.特征选择
i.数据中包含冗余或无关变量,旨在从原有特征中找出主要特征。
b.主成分分析
定义:
高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量
api:
位置:
from sklearn.decomposition import PCA
初始化:
n_components:
int : 减少到多少个特征
float: 保留原来 %多少的信息
方法:
fit
transform
fit_transform