- 博客(4)
- 收藏
- 关注
原创 金融风控 Task02
查看数据集中特征缺失值,唯一值具体的查看缺失特征及缺失率查看训练集测试集中特征属性只有一值的特征查看特征的数值类型有哪些,对象类型有哪些特征一般都是由类别型特征和数值型特征组成,而数值型特征又分为连续型和离散型。类别型特征有时具有非数值关系,有时也具有数值关系。比如‘grade’中的等级A,B,C等,是否只是单纯的分类,还是A优于其他要结合业务判断。数值型特征本是可以直接入模的,但往往风控人员要对其做分箱,转化为WOE编码进而做标准评分卡等操作。从模型效果上来看,特征分箱主要是为了降低变量的
2020-09-18 22:49:54 158
原创 金融风控 Task01
题目理解比赛要求参赛选手根据给定的数据集,建立模型,预测金融风险。赛题以预测金融风险为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。通过这道赛题来引导大家走进金融风控数据竞赛的世界,主要针对于于竞赛新人进行自我练习、自我提高。
2020-09-15 22:52:53 156
原创 python task02
条件语句if / if elseif & else 后记得冒号结尾!!if expression: expr_true_suiteelse: expr_true_suite嵌套使用注意缩进,构成层级关系的不是括号而是缩进hi = 6if hi > 2: if hi > 7: print('好棒!好棒!')else: print('切~')if - elif - else 比较 c#if expression1: ex
2020-07-23 22:59:27 147
原创 python task01
运算符算数运算符# + 加 print(2 + 3)# - 减print(2 - 3)# * 乘print(2 * 3)# / 除print(2 / 3)# // 整除print(2 // 3)# % 取余print(2 % 3)# ** 幂print(2 ** 3)比较运算符# > 大于print(2 > 3)# >= 大于等于print(2 >= 3)# < 小于print(2 < 3)# <=
2020-07-20 23:16:44 159
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人