目录
本学习笔记为阿里云天池龙珠计划金融风控训练营的学习内容,学习链接为:https://tianchi.aliyun.com/specials/activity/promotion/aicampfr
学习知识点概要
本次学习的知识点主要分为以下几点:赛题概况、数据概况、预测指标以及指标相关代码实现
学习内容
(一)赛题概况:此赛题实际上是分类问题,根据贷款人在金融方面的个人信息数据,结合相关预测指标判断是否应该获得贷款的一个问题。
(二)数据概况:在个人信息数据中,个人的年收入、就业信息、贷款用途等信息都可以对贷款人是否可能违约起到判断作用。
(三)预测指标:金融风控预测类常使用三个预测指标:KS、AUC、ROC,本次赛事使用AUC作为预测指标,是 ROC曲线下与坐标轴围成的面积,介于0.5与1之间,越靠近1,则越有应用价值;越靠近0.5,则越无应用价值。
学习问题与解答
问题:这里的AUC定义为ROC曲线下与坐标轴围成的面积,那它与ROC的关系是怎么样的呢?它的值更深层次的意义是什么呢?
解答:ROC曲线上的任意一点都是代表这个分类器的效果值,越靠近左上角,则分类效果越好;而AUC则是评判一个 二分类的模型的优劣。如果AUC=1.则表示完美预测;如果0.5<AUC<1,则表示仅次于完美预测;如果AUC=0.5,则表示是随机预测,效果很差,完全没有价值;如果AUC<0.5,则表示预测不存在。
学习思考与总结
如果想要参加一场比赛,就要理解这个比赛的相关流程以及赛点。本次比赛是金融风控,因此贷款违约风险判断与之息息相关,就可以明确学习方向,了解大概思路,先获得贷款人个人数据,然后计算相关评估指标,画出相关评价指标,最后根据指标数值进行判断,思路清晰了,就容易了许多。