风控评分卡
qq_39403128
这个作者很懒,什么都没留下…
展开
-
使用groupby统计样本各数值的数量
h = data_X.groupby('供应商名称')['缴费天数'].value_counts().unstack(fill_value=0)上面代码的意义在于按照供应商名称分组,统计不同缴费天数的数量,并转换成宽格式的dataframe并将空值用fill_value填充原创 2021-12-08 23:37:54 · 1093 阅读 · 0 评论 -
决策树分箱,参考代码
金融申请评分卡_starzhou的专栏-CSDN博客_申请评分卡金融申请评分卡(1)2018年02月23日 00:26:08阅读数:527金融申请评分卡概念的介绍 目前金融申请评分卡主要使用在一些互联网金融企业和保险银行机构,主要用来解决目前金融机构存在的信用风控问题。1、信用违约风险的控制手段 从最早的有抵押无规则→无抵押有规则→数据模型,形成了目前在风控领域的基本风控脉络;现今主要采用基于数据驱动建立的风控模型,主要就是目前应用最广...https://blog.csdn.net...原创 2021-11-22 10:57:52 · 577 阅读 · 0 评论 -
数据离散化与分箱
1.分箱的意义将数据放在分段线中,例如将成绩按照等差区间分为,A,B,C,D。分别对应60,80,90,100。2.代码示例import pandas as pdimport numpy as npages = [20,22,33,54,64,43,55,66,75,32,21,11]bins = [18,25,35,60,100]cart = pd.cut(ages,bins) #将原数据按照bins中的区间进行分箱。cart.codes #查看每个数据分箱到哪里了ca原创 2021-11-15 13:40:32 · 837 阅读 · 0 评论