数据挖掘
-GGGG
这个作者很懒,什么都没留下…
展开
-
二手车价格预测-- task3 特征工程
数据预处理和特征选择是数据挖掘与机器学习中关注的重要问题,坊间常说:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。特征工程就是将原始数据转化为有用的特征,更好的表示预测模型处理的实际问题,提升对于未知数据的预测准确性。 3.1特征工程 常见的特征工程包括: 异常值的处理: 通过箱线图(或3-Sigma)分析删除异常值; BOX-COX转换(处理有偏分布); 长尾截断;...原创 2020-03-28 20:33:35 · 163 阅读 · 0 评论 -
二手车价格预测--task2 数据分析
数据挖掘学习任务二是对数据进行EDA–数据性探索分析。 EDA定义: 探索性数据分析(Exploratory Data Analysis,简称EDA),是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 EDA目标 EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定...原创 2020-03-24 21:42:19 · 413 阅读 · 0 评论