本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:https://tianchi.aliyun.com/specials/activity/promotion/aicampdocker
一、学习知识点概要
- 赛题概况
- 数据概况
- 预测指标
- 分析赛题
二、学习内容
2.1 赛题概况
比赛要求参赛选手根据给定的数据集,建立模型,预测金融风险。
赛题以预测金融风险为任务,数据集可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。将从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。
2.2 数据概况
说明数据中列的性质特征。了解列的性质会有助于我们对于数据的理解和后续分析。
2.3 预测指标
竞赛采用AUC作为评价指标。AUC(Area Under Curve