技术学习
caow_1
这个作者很懒,什么都没留下…
展开
-
天池二手车交易价格预测Task 03(特征工程)
Tips:写在最前面,通过数据的EDA分析之后,我们大概熟悉了数据的分布、相关性、异常值等,下一步便是研究数据的转换,提取出数据中关键的特征,让数据变得更加有规律,从而能帮助我们更好地完成任务。总而言之,特征工程决定了模型检测的上限,所以特征工程很重要,很重要,很重要!内容介绍:1.异常处理:通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); ...原创 2020-03-27 22:02:05 · 406 阅读 · 0 评论 -
天池二手车交易价格预测Task 02(数据的探索性分析)
1.前言介绍上一期基本把握了赛题的理解,这一期着重对数据进行探索性分析,即EDA。参照学习文档,EDA的主要目标如下:EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。 当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。 引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集...原创 2020-03-22 20:48:30 · 1180 阅读 · 0 评论