我的0基础入门-二手车交易预测河北高校邀请赛-Task1

本文介绍了参加河北高校邀请赛-Task1的经历,赛题要求预测二手车价格。内容包括数据集理解,如数据字段解释,匿名特征,评估指标(MAE)。讨论了数据挖掘常用库和EDA(探索性数据分析)的重要性,以及赛题理解的深入层次,如问题分析、难点识别、特征工程和模型验证策略。此外,还分享了实际操作中的导入数据和初步数据概况观察等实践经验。
摘要由CSDN通过智能技术生成

Task1: 赛题理解

1.报名并下载数据集 

2.数据概况(包含匿名特征)

train.csv

  • SaleID - 销售样本ID
  • name - 汽车编码
  • regDate - 汽车注册时间
  • model - 车型编码
  • brand - 品牌
  • bodyType - 车身类型
  • fuelType - 燃油类型
  • gearbox - 变速箱
  • power - 汽车功率
  • kilometer - 汽车行驶公里
  • notRepairedDamage - 汽车有尚未修复的损坏
  • regionCode - 看车地区编码
  • seller - 销售方
  • offerType - 报价类型
  • creatDate - 广告发布时间
  • price - 汽车价格
  • v_0', 'v_1', 'v_2', 'v_3', 'v_4', 'v_5', 'v_6', 'v_7', 'v_8', 'v_9', 'v_10', 'v_11', 'v_12', 'v_13','v_14' 【匿名特征,包含v0-14在内15个匿名特征】  

数字全都脱敏处理,都为label encoding形式,即数字形式

 

3.预测与评估指标&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值