机器学习:第五步:Python 上实现机器学习的基本算法(logistic 回归)

该博客介绍了如何使用Python进行机器学习,以解决二手车经销商预测汽车质量的问题。首先,它阐述了研究背景和目标,旨在预测拍卖平台上的汽车是否为‘坏车’。接着,博客详细展示了数据预处理步骤,包括数据读取、特征处理(如去除标签、字符转数字、数据归一化和降维)。作者使用了PCA进行降维,并通过逻辑回归模型进行训练。最后,博客讨论了模型评估,包括ROC曲线绘制和交叉验证,同时也提出了在数据处理和模型测试中遇到的问题和未来改进方向。
摘要由CSDN通过智能技术生成

第1章绪论

题目来源:http://suo.im/S2beL

数据来源:https://github.com/ajschumacher/gadsdata/tree/master/lemons

 

1.1研究背景

一个汽车经销商在汽车拍卖平台采购一个二手车所面临的一个巨大的挑战是可能购买到有一系列问题的汽车,从而不能卖给顾客。汽车论坛称这种不幸的购买为“kicks”

    坏车原因可能是里程计别篡改,也可能是经销商也无法处理的机械问题,也可能是汽车名称问题或其它难以预测的问题。坏车对于经销商是一个巨大的花费,包括在运输费,修理费,和二手车市场损失费等

1.2研究问题

   预测在拍卖平台购买的汽车是否是一个坏车?

1.3研究目标

   模型可以得到哪个车更可能为坏车并为经销商提供一个真实的值,为客户提供一个最佳库存选择。


 

第2章数据分析

2.1特征清单

RefID

赋予每辆汽车独一无二的名字

IsBadBuy

购买是否为坏车的标识

PurchDate

在拍卖平台的购买日期

Auction

所购汽车的拍卖平台

VehYear

汽车制造年限

VehicleAge

汽车使用年限

Make

汽车制造商

Model

汽车模型

Trim

汽车配置水平

SubModel

汽车子模型

Color

汽车颜色

Transmission

汽车变速器形式(自动、手动)

WheelTypeID

汽车轮胎类型ID

WheelType

轮胎类型

VehOdo

汽车里程表读数

Nationality

制造商所属国家

Size

汽车尺寸类别(紧凑型、SUV)

TopThreeAmericanName

确定制造商是否是美国三大制造商之一

PRIMEUNIT

确定该汽车需求比普通车型要高

AcquisitionType

汽车如何获得(拍卖平台购买、交易)

AUCGUART

汽车拍卖所提供的等级保护(绿灯保证/可仲裁、黄色警示/问题、红灯出售)

KickDate

汽车是坏的返回拍卖平台的日期

BYRNO

购买者购买汽车分配的标识

VNZIP

汽车购买的邮政编码

VNST

汽车购买状态

VehBCost

汽车购置成本

IsOnlineSale

汽车是否初次在网上售卖标识

WarrantyCost

保修价格(期限=36个月,保险费=36K)

MMRAcquisitionAuctionAveragePrice

平均条件该汽车购置价格

MMRAcquisitionAuctionCleanPrice

在平均条件该汽车的平均购置价格

MMRAcquisitionRetailAveragePrice

平均条件该汽车在零售市场购置价格

MMRAcquisitonRetailCleanPrice

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值