金融风控模型
仲天祺
这个作者很懒,什么都没留下…
展开
-
Task3-特征工程
#按照平均数填充数值型特征data_train[numerical_fea] = data_train[numerical_fea].fillna(data_train[numerical_fea].median())data_test_a[numerical_fea] = data_test_a[numerical_fea].fillna(data_train[numerical_fea].median())#按照众数填充类别型特征data_train[category_fea] = data..原创 2020-09-21 23:07:27 · 118 阅读 · 0 评论 -
task2—数据分析
前一部分我们对一些分类指标等一些预备知识进行了学习,接下来我们要进行的是探索性的数据分析(EDA)。EDA是我们进行数据挖掘非常重要的一步,做的好的EDA可以让我们对数据作出更准确的分析,一方面是让我们了解整个数据集,包括缺失值,异常值,变量间的练习等,另一方面也是为我们之后的特征工程做好准备。查看数据集的列数据train.columnsIndex([‘id’, ‘loanAmnt’, ‘term’, ‘interestRate’, ‘installment’,‘grade’,‘subG.原创 2020-09-18 23:11:28 · 272 阅读 · 1 评论 -
金融风控-贷款违约预测 task1——赛题理解
本次比赛是Datawhale与天池联合发起的系列赛事第四场 —— 零基础入门金融风控-贷款违约预测 比赛链接:零基础入门金融风控-贷款违约预测-天池大赛-阿里云天池 https://tianchi.aliyun.com/competition/entrance/531830/introduction一、赛题说明首先我们看看官方提供的数据赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为...原创 2020-09-15 21:59:24 · 1190 阅读 · 0 评论