DW组队学习-二手车交易价格预测

本文探讨了一个二手车交易价格预测的赛事,包括赛题理解、数据概况和初步的EDA。数据量超过40w,涉及匿名特征的分布、相关性分析以及异常值处理。目标是通过MAE最小化来优化预测模型。常用工具包括numpy、pandas、matplotlib等,回归算法有xgb、lgb、catboost。
摘要由CSDN通过智能技术生成

一 赛事理解

1 赛题概况
  • 目标:价格预测 -> price

  • 数据来源:某交易平台的二手车交易记录

  • 数据量:总数据量超过40w,包含31列变量信息,其中15列为匿名变量,从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B

  • 数据处理:已对name、model、brand和regionCode等信息进行脱敏。

  • 评测标准:MAE(Mean Absolute Error),MAE越小说明模型预测得越精确。

  • 结果提交:csv格式(SaleID,price),与sample_submit.csv中的格式一致

2 数据概况
  • 数字全都脱敏处理,都为label encoding形式,即数字形式
  • 数据概况介绍,描述列的性质特征
Field Description
SaleID 交易ID,唯一编码
name 汽车交易名称,已脱敏
regDate 汽车注册日期,例如20160101,2016年01月01日
model 车型编码,已脱敏
brand 汽车品牌,已脱敏
bodyType 车身类型:豪华轿车:0,微型车:1,厢型车:2,大巴车:3,敞篷车:4,双门汽车:5,商务车:6,搅拌车:7
fuelType 燃油类型&
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值