1. 定义:将现有特征映射到一个新的特征空间中,然后得到新的特征。 特点:维度降低,数据改变。
2. 目的:算法运算更快效果更好;数据可视化
3. 衡量指标:样本方差,又称可解释性方差,方差越大,特征所带的信息量越多。
其中,Var表示某特征的方差,n代表样本量,xi表示某特征中的各样本 取值,x’代表该特征对应样本的均值。
4. 方法:矩阵分解。用来找出n个新特征向量,让数据能够被压缩到少数特征上并且总信息量不损失太多的技术。
5. 操作过程:
6. 举例:
原数据是二维的(x1和x2),找到新的特征空间(x1’和x2’