pca主要是定义一个x映射到z,且只能在训练集里使用PCA
当定义完之后,就可以进行交叉验证和测试集里使用
主要功能:
减少存储数据需要的空间
加速学习的算法
错误1
使用pca减少数据维度去解决过拟合
应该使用正则化,利用线性回归等去处理
因为pca会损失一些维度信息,可能会漏掉重要信息
而正则化的y值是已知的
错误2
不要一开始就使用pca
很多时候直接用原始数据也能完成项目
如果一开始就花大量时间想怎么使用pca怎么计算k值会浪费大量时间,得不偿失。
pca主要是定义一个x映射到z,且只能在训练集里使用PCA
当定义完之后,就可以进行交叉验证和测试集里使用
主要功能:
减少存储数据需要的空间
加速学习的算法
错误1
使用pca减少数据维度去解决过拟合
应该使用正则化,利用线性回归等去处理
因为pca会损失一些维度信息,可能会漏掉重要信息
而正则化的y值是已知的
错误2
不要一开始就使用pca
很多时候直接用原始数据也能完成项目
如果一开始就花大量时间想怎么使用pca怎么计算k值会浪费大量时间,得不偿失。