零基础数据挖掘入门-二手车价格预测

最新推荐文章于 2024-07-29 10:48:09 发布

蛐蛐在睡觉

最新推荐文章于 2024-07-29 10:48:09 发布

阅读量527

点赞数

文章标签：数据挖掘机器学习 python

本文链接：https://blog.csdn.net/weixin_43702053/article/details/105168693

版权

本文介绍了零基础数据挖掘入门中的二手车价格预测，重点聚焦于特征工程，包括特征工程概述、特征构建、特征提取和特征选择。特征工程是提高机器学习模型性能的关键，涉及特征构建（如统计量特征、时间特征、地理信息和非线性变换）、特征提取（过滤式、包裹式和嵌入式方法）和特征选择（统计学方法和机器学习模型）。特征构建被视作最核心的部分，对问题的深入理解至关重要。

摘要由CSDN通过智能技术生成

零基础数据挖掘入门-二手车价格预测part（二）：特征工程

文章目录

零基础数据挖掘入门-二手车价格预测part（二）：特征工程

一、特征工程概述

“数据决定了机器学习的上限，而算法只是尽可能逼近这个上限”，这里的数据指的就是经过特征工程得到的数据。特征工程指的是把原始数据转变为模型的训练数据的过程，它的目的就是获取更好的训练数据特征，使得机器学习模型逼近这个上限。特征工程能使得模型的性能得到提升，有时甚至在简单的模型上也能取得不错的效果。特征工程在机器学习中占有非常重要的作用，一般认为括特征构建、特征提取、特征选择三个部分。特征构建比较麻烦，需要一定的经验。
特征提取与特征选择都是为了从原始特征中找出最有效的特征。它们之间的区别是特征提取强调通过特征转换的方式得到一组具有明显物理或统计意义的特征；而特征选择是从特征集合中挑选一组具有明显物理或统计意义的特征子集。两者都能帮助减少特征的维度、数据冗余，特征提取有时能发现更有意义的特征属性，特征选择的过程经常能表示出每个特征的重要性对于模型构建的重要性

二、特征构建

特征构建是指从原始数据中人工的找出一些具有物理意义的特征。需要花时间去观察原始数据，思考问题的潜在形式和数据结构，对数据敏感性和机器学习实战经验能帮助特征构建。除此之外，属性分割和结合是特征构建时常使用的方法。结构性的表格数据，可以尝试组合二个、三个不同的属性构造新的特征，如果存在时间相关属性，可以划出不同的时间窗口，得到同一属性在不同时间下的特征值，也可以把一个属性分解或切分，例如将数据中的日期字段按照季度和周期后者一天的上午、下午和晚上去构建特征。总之特征构建是个非常麻烦的问题，书里面也很

最低0.47元/天解锁文章

蛐蛐在睡觉

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
零基础数据挖掘入门-二手车价格预测

零基础数据挖掘入门-二手车价格预测part（二）：特征工程文章目录零基础数据挖掘入门-二手车价格预测part（二）：特征工程一、特征工程概述二、特征构建三、特征提取四、特征选择五、总结一、特征工程概述“数据决定了机器学习的上限，而算法只是尽可能逼近这个上限”，这里的数据指的就是经过特征工程得到的数据。特征工程指的是把原始数据转变为模型的训练数据的过程，它的目的就是获取更好的训练数据特征，使...
复制链接

扫一扫