这里写自定义目录标题
Datawhale-零基础入门数据挖掘 - 二手车交易价格预测-- 赛题理解与数据分析(EDA)
一、赛题理解
这里转载自杨煜队伍的分享的思维导图:
二、数据探索性分析(EDA)
2.1 介绍(摘自AI蜗牛车的Task2 数据分析)
数据探索在机器学习中我们一般称为EDA(Exploratory Data Analysis):
是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。
数据探索有利于我们发现数据的一些特性,数据之间的关联性,对于后续的特征构建是很有帮助的。
1)对于数据的初步分析(直接查看数据,或.sum(), .mean(),.descirbe()等统计函数)可以从:样本数量,训练集数量,是否有时间特征,是否是时许