PCA和特征选择技术都是特征工程的一部分,他们有什么不同?
特征选择是从已经存在的特征中选取携带信息最多的,选完之后的特征依然具有可解释性,我们仍然能知道特征在源数据的哪个位置,待表数据的什么含义。
PCA是将已经存在的特征进行压缩,降维完成后的特征不再是源数据中的任何一个特征,而是通过通过某种方式组合起来的特征,新的特征矩阵不再具有可读性,属于特征创造的一种。
因此
PCA不适合用于探索特征和标签的关系的模型比如线性回归,因为无法解释新特征与标签的关系,所以在线性回归中用特征选择。
PCA和特征选择技术都是特征工程的一部分,他们有什么不同?
最新推荐文章于 2024-05-09 15:53:00 发布