请结合如下购车信贷数据,设计一个算法决策是否发放购车贷款。
1. 购车信贷数据。数据主要包括历史同意贷款数据(accepts.csv)和历史拒绝贷款数据(rejects.csv)。数据中各个字段含义见下表。
名称 | 中文含义 | 备注 |
application_id | 申请者ID | |
account_number | 帐户号 | |
bad_ind | 是否违约 | |
vehicle_year | 汽车购买时间 | 0代表缺失 |
vehicle_make | 汽车制造商 | 空白代表缺失 |
bankruptcy_ind | 曾经破产标识 | 空白代表缺失 |
tot_derog | 五年内信用不良事件数量(比如手机欠费消号) | 缺失代表无记录 |
tot_tr | 全部帐户数量 | 缺失代表系统内无记录 |
age_oldest_tr | 最久账号存续时间(月) | 缺失代表系统内无记录 |
tot_open_tr | 在使用帐户数量 | 缺失代表系统内无记录 |
tot_rev_tr | 在使用可循环贷款帐户数量(比如信用卡) | 缺失代表系统内无记录 |
tot_rev_debt | 在使用可循环贷款帐户余额(比如信用卡欠款) | |
tot_rev_line | 可循环贷款帐户限额(信用卡授权额度) | |
rev_util | 可循环贷款帐户使用比例(余额/限额) | |
fico_score | FICO打分(一种信用分) | 缺失代表系统内无记录 |
purch_price | 汽车购买金额(元) | |
msrp | 建议售价 | 0代表缺失 |
down_pyt | 分期付款的首次交款 | |
loan_term | 贷款期限(月) | |
loan_amt | 贷款金额 | |
ltv | 贷款金额/建议售价*100 | |
tot_income | 月均收入(元) | |
veh_mileage | 行驶里程(Mile) | |
used_ind | 是否使用 | |
weight | 样本权重 |
2.请结合数据,设计贷款决策算法。要求:
(1)给出算法设计的基本思想,所选取的机器学习方法的依据。
(2)给出算法伪代码(编写语言不限,建议python)。
(3)要求给出所选机器学习技术的训练方法以及评价策略。
3.如出现数据缺失、数据错误或异常、数据噪音等现象,将对预测产生影响。针对上述情况,请结合数据,说明解决方法。