本学习笔记为阿里金融风控训练营的学习内容,学习链接为:AI训练营金融风控-阿里云天池
我的完整笔记为:AI训练营金融风控—01赛题理解_天池notebook-阿里云天池
一、学习知识点概要
- 比赛:零基础入门金融风控之贷款违约预测挑战赛(分类问题,根据贷款申请人的数据信息预测其是否有违约的可能)比赛地址:零基础入门金融风控-贷款违约预测_学习赛_天池大赛-阿里云天池
- 理解赛题数据和目标,清楚评分体系。
- 完成相应报名,下载数据,理解赛题的解题思路,结果提交打卡(可提交示例结果),熟悉比赛流程。
二、学习内容
1. 赛题数据
该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。
2. 数据概况
train.csv
- id 为贷款清单分配的唯一信用证标识
- loanAmnt 贷款金额
- term 贷款期限(year)
- interestRate 贷款利率
- insta