第1章绪论
题目来源:http://suo.im/S2beL
数据来源:https://github.com/ajschumacher/gadsdata/tree/master/lemons
1.1研究背景
一个汽车经销商在汽车拍卖平台采购一个二手车所面临的一个巨大的挑战是可能购买到有一系列问题的汽车,从而不能卖给顾客。汽车论坛称这种不幸的购买为“kicks”
坏车原因可能是里程计别篡改,也可能是经销商也无法处理的机械问题,也可能是汽车名称问题或其它难以预测的问题。坏车对于经销商是一个巨大的花费,包括在运输费,修理费,和二手车市场损失费等
1.2研究问题
预测在拍卖平台购买的汽车是否是一个坏车?
1.3研究目标
模型可以得到哪个车更可能为坏车并为经销商提供一个真实的值,为客户提供一个最佳库存选择。
第2章数据分析
2.1特征清单
RefID |
赋予每辆汽车独一无二的名字 |
|
IsBadBuy |
购买是否为坏车的标识 |
|
PurchDate |
在拍卖平台的购买日期 |
|
Auction |
所购汽车的拍卖平台 |
|
VehYear |
汽车制造年限 |
|
VehicleAge |
汽车使用年限 |
|
Make |
汽车制造商 |
|
Model |
汽车模型 |
|
Trim |
汽车配置水平 |
|
SubModel |
汽车子模型 |
|
Color |
汽车颜色 |
|
Transmission |
汽车变速器形式(自动、手动) |
|
WheelTypeID |
汽车轮胎类型ID |
|
WheelType |
轮胎类型 |
|
VehOdo |
汽车里程表读数 |
|
Nationality |
制造商所属国家 |
|
Size |
汽车尺寸类别(紧凑型、SUV) |
|
TopThreeAmericanName |
确定制造商是否是美国三大制造商之一 |
|
PRIMEUNIT |
确定该汽车需求比普通车型要高 |
|
AcquisitionType |
汽车如何获得(拍卖平台购买、交易) |
|
AUCGUART |
汽车拍卖所提供的等级保护(绿灯保证/可仲裁、黄色警示/问题、红灯出售) |
|
KickDate |
汽车是坏的返回拍卖平台的日期 |
|
BYRNO |
购买者购买汽车分配的标识 |
|
VNZIP |
汽车购买的邮政编码 |
|
VNST |
汽车购买状态 |
|
VehBCost |
汽车购置成本 |
|
IsOnlineSale |
汽车是否初次在网上售卖标识 |
|
WarrantyCost |
保修价格(期限=36个月,保险费=36K) |
|
MMRAcquisitionAuctionAveragePrice |
平均条件该汽车购置价格 |
|
MMRAcquisitionAuctionCleanPrice |
在平均条件该汽车的平均购置价格 |
|
MMRAcquisitionRetailAveragePrice |
平均条件该汽车在零售市场购置价格 |
|
MMRAcquisitonRetailCleanPrice |