通常,对于高维或超高维数据,学习困难甚至无法学习,难以进行数据的可视化。】
PCA(Principal Component Analysis)就成了降维处理这些数据的有效手段,PCA通过将各维度的数据进行线性组合,然后进行数据变换,去掉不重要的数据。
在使用PCA进行降维前,考虑各维度数据量纲和跨度不同,需要对各维度的数据进行标准化处理,常用的方法是将数据进行正态化,及减均值/标准差,即进行StandardScalar,另外一种方式是进行MinMaxScalar
通过PCA可以将数据降为2维或者3维,即可以进行数据的可视化。