自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 金融风控 Task02

查看数据集中特征缺失值,唯一值具体的查看缺失特征及缺失率查看训练集测试集中特征属性只有一值的特征查看特征的数值类型有哪些,对象类型有哪些特征一般都是由类别型特征和数值型特征组成,而数值型特征又分为连续型和离散型。类别型特征有时具有非数值关系,有时也具有数值关系。比如‘grade’中的等级A,B,C等,是否只是单纯的分类,还是A优于其他要结合业务判断。数值型特征本是可以直接入模的,但往往风控人员要对其做分箱,转化为WOE编码进而做标准评分卡等操作。从模型效果上来看,特征分箱主要是为了降低变量的

2020-09-18 22:49:54 158

原创 金融风控 Task01

题目理解比赛要求参赛选手根据给定的数据集,建立模型,预测金融风险。赛题以预测金融风险为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。通过这道赛题来引导大家走进金融风控数据竞赛的世界,主要针对于于竞赛新人进行自我练习、自我提高。

2020-09-15 22:52:53 156

原创 python task02

条件语句if / if elseif & else 后记得冒号结尾!!if expression: expr_true_suiteelse: expr_true_suite嵌套使用注意缩进,构成层级关系的不是括号而是缩进hi = 6if hi > 2: if hi > 7: print('好棒!好棒!')else: print('切~')if - elif - else 比较 c#if expression1: ex

2020-07-23 22:59:27 147

原创 python task01

运算符算数运算符# + 加 print(2 + 3)# - 减print(2 - 3)# * 乘print(2 * 3)# / 除print(2 / 3)# // 整除print(2 // 3)# % 取余print(2 % 3)# ** 幂print(2 ** 3)比较运算符# > 大于print(2 > 3)# >= 大于等于print(2 >= 3)# < 小于print(2 < 3)# <=

2020-07-20 23:16:44 159

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除