特征工程的含义
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
不管通过哪种方式获取数据,总会有那么一些数据无法直接投入生产使用中,这些不可直接使用的数据必须经过数据处理。
特征工程可以通俗的理解为把获取的数据处理为机器能够读懂的数据
更为精确的将特征工程指的是把原始数据转变为模型的训练数据的过程从而提高对未知数据的模型预测的准确性
特征工程的意义
只有把原始数据尽力处理到极致,从而提高基于此数据构建的模型的准确性,使得模型的预测能力不断提高。
特征工程的建立
特征构建
特征抽取
特征选择