1、为什么需要特征工程?
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
2、什么是特征工程?
特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程
意义:会直接影响机器学习的效果
3、pandas:数据清洗、数据处理
sklearn:对于特征的处理提供了强大的接口
4、特征工程包含内容:
特征抽取
特征预处理
特征降维
1、为什么需要特征工程?
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
2、什么是特征工程?
特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程
意义:会直接影响机器学习的效果
3、pandas:数据清洗、数据处理
sklearn:对于特征的处理提供了强大的接口
4、特征工程包含内容:
特征抽取
特征预处理
特征降维