阿里天池新人赛——二手车交易价格预测EDA工作
概述
Datawhale与天池联合发起的0基础入门数据挖掘系列赛事第一场 —— 零基础入门数据挖掘之二手车交易价格预测大赛。赛事以二手车市场为背景,要求选手预测二手汽车的交易价格。这是典型的回归问题,除了数据量有二十万条比一些玩具数据集大得多之外,其他方面都适合小白上手
二手车交易价格数据集及赛事描述
探索性数据分析 EDA(Exploratory Data Analysis)
在对赛题有初步的了解和认识以后进行初步的分析,判断数据缺失和异常 ,数据总览,了解预测值的分布等,这些都是很基础的工作,方便后续特征工程的构建。
导入工具库
import numpy as np
import pandas as pd
import warnings
import matplotlib
import matplotlib.pyplot