2020年3月份开始参加datawhale和阿里云联合举办的,《零基础学数据挖掘比赛之二手车价格预测》,在代码勉为其难能看懂、而且经常fork不到队伍的小白菜而言,先做一版的学习笔记,等后面进度跟上来了,再更新和修改。
一、相关链接
1、赛题baseline:
https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.24.1cd8593aw4bbL5&postId=95422
2、赛题教程之题意理解(part.1):
https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.15.1cd8593aw4bbL5&postId=95456
3、赛题教程之数据分析(part.2):
https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.12.1cd8593aw4bbL5&postId=95457
附注:赛题数据集在baseline页面下载。
https://tianchi.aliyun.com/competition/entrance/231784/information
二、数据来源
赛题以预测二手车的交易价格为任务,该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。其中,15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name、model、brand和regionCode等信