特征降维
特征降维,有时候也称之为特征抽取(用于降维的特征选择方法)或数据压缩,因为现实生活中产生的数据是越来越多,数据压缩技术可以帮助我们对数据进行存储和分析。
特征降维是无监督学习的另一个应用,目的有 2:(1)我们会经常在实际项目中遭遇特征维度非常之高的训练样本,而往往又无法借助自己的领域知识人工构建有效特征;(2)在数据表现方面,我们无法用肉眼观测超过三个维度的特征。因此,特征降维不仅仅重构了有效的低纬度特征,同时也为数据展现提供了可能。在特征降维技术中 PCA 主成分分析是最为经典和实用的特征降维技术,在图像识别方面表现的也很突出。
1、特征降维的目的
1.1为什么要进行数据降维?
通常处理的数据是多维的,算法的时间复杂度与维数成指数级增加。维数达上千万维,称为维数灾难,往往就需要进行降维处理。
1.2、数据降维的作用
数据降维:
* 1.使数据集更容易使用
* 2.降低算法的计算开销
* 3.去除噪声
* 4.减轻过拟合
* 5.易于获取有价值的信息