自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

不太焦虑又不太安分

我想看看三年后的自己

  • 博客(37)
  • 资源 (1)
  • 收藏
  • 关注

原创 PART 1.3 风控利率那些事儿(名义利率 实际利率 还款方式 以及 计算逻辑汇总)

最重要的事情开始都会讲:建模是始终服务于业务的,没有业务的评分卡就没有灵魂利率这件事情,大部分人都模棱两可,建模的过程不是仅仅把数据掌握,而是你是否充分掌握很多数据的起因和一些基本数据的产生法则,我们将逾期率,一般是针对金额的,那么金额的利率你需要知道,利率所造成的结果很有可能导致不同的逾期行为,比如年化1000%的利率肯定要比年化为1%造成的压力大,这一点你们一定要知道。也就是说授信你要了解产...

2019-07-16 13:52:32 2157

原创 风控策略篇 外部数据测试

1 评分类2 黑名单类3 多头类4 失信类

2019-08-30 15:54:55 1820

原创 介绍篇 小贷公司 消费金融公司 P2P 助贷具体区别是什么

最重要的事情开始都会讲:建模是始终服务于业务的,没有业务的评分卡就没有灵魂发布时间 2019年9月最重要的事情最后都会讲:建模是始终服务于业务的,没有业务的评分卡就没有灵魂...

2019-08-18 15:48:49 3579 1

原创 数据挖掘算法 回归和分类的区别,同时探讨评分卡的具体使用优化

分类和回归的区别分类:classification回归:regression输入变量与输出变量均为连续变量的预测问题是回归问题输出变量为有限个离散变量的预测问题为分类问题输入变量与输出变量均为变量序列的预测问题为标注问题分类问题和回归问题都要根据所给特征给出一个输出值,本质是一样的,不同的在于用法拿LR为例,基于(0,1)离散值,实际上输出的不是(0,1)而是一个概率值。我们去要选...

2019-07-26 18:02:51 1975

转载 风控模型师面试准备--业务+模型篇

Q:互联网金融场景下的的风控模型种类?获客阶段:用户响应模型,风险预筛选模型。授信阶段:申请评分模型,反欺诈模型,风险定价模型,收益评分模型。贷后阶段:行为评分模型,交易欺诈模型,客户流失模型。催收阶段:早期催收模型,晚期催收模型。Q:简单描述一下风控建模的流程?前期准备工作:不同的模型针对不同的业务场景,在建模项目开始前需要对业务的逻辑和需求有清晰的理解,明确好模型的作用,项目周期时...

2019-05-29 15:57:57 2006

原创 PART 7.2 评分卡模型概率校准

评分卡模型概率校准不会影响评分卡模型概率的分布情况,只是针对不同情况的比例进行调整,如果后期涉及应用坏客户率或者切分点的时候使用参考文献https://mp.weixin.qq.com/s/B0aCXHWz6CIarRUPyJeITg...

2019-05-29 15:27:19 1273

原创 Part 1.2 如何选取样本数据

最重要的事情开始都会讲:建模是始终服务于业务的,没有业务的评分卡就没有灵魂传统的操作部分在Part 1.1中 讲过 如何定义Y值,通过选中Y值后,我们需要做的事情是基于Y值去选取我们的建模样本建模样本一般可以从两个维度去思考授信维度:判断客户好坏的是 人从人角度出发,判断客户在某一段时间内是否出现逾期笔数,比如逾期天数超过30天,1 首先判断多少期限有多少客户稳定提现2 基于稳定提...

2019-05-21 14:11:05 3323

原创 反欺诈类优秀文章汇总

40页PPT详解反欺诈体系与策略规则https://mp.weixin.qq.com/s/d7jSGOpy6pzy_GKju1LfEQ干货 | 人工智能如何帮助银行反欺诈?https://mp.weixin.qq.com/s/5uUH2BYDH77TTEcr_6DQEw

2019-05-14 10:08:54 2038

原创 数据挖掘算法 主成分分析法

五月份发布

2019-04-30 11:04:39 540

原创 风控建模 差异化定价篇

预计发布时间 5月初

2019-04-10 12:01:25 1064 6

原创 风控建模 额度管理篇

预计发布时间 2019年4月中下旬https://blog.csdn.net/Sinsa110/article/details/81195126 TCRP-《信贷额度设定技巧》课程笔记https://blog.csdn.net/LuYi_WeiLin/article/details/88578623 (信贷风控十五)评分卡分数切分、授信额度与利率定价...

2019-04-10 12:00:49 3409 8

原创 风控建模 实战&环节篇 授信评分卡

4月份发布 敬请期待

2019-04-02 09:52:46 796 4

原创 风控建模 数据对照篇:WOE IV 回归系数 P值 相关系数 共线性指标 膨胀因子 KS AUC GINI PSI

最重要的事情开始都会讲:建模是始终服务于业务的,没有业务的评分卡就没有灵魂每一个指标段对应的评价如下,就当做各位的参考表数据吧。希望可以对大家有帮助WOEIV回归系数P值相关系数共线性指标:膨胀因子KSAUCGINIPSI最重要的事情最后都会讲:建模是始终服务于业务的,没有业务的评分卡就没有灵魂...

2019-04-01 14:52:54 2406

原创 风控建模 宽表篇

宽表是所有变量以及衍生变量的汇总表这份博客也是对我自己建模逻辑的整理,会做及时的更新整理授信环节 A 环节贷中环节 B 环节催收环节 C 环节一般来讲 C 环节包含A B,B包含A...

2019-03-28 10:13:04 1974

原创 PART 8 风控建模 监控指标以及相关操作逻辑

预计发布时间 3月底

2019-03-25 11:15:12 792

原创 数据挖掘算法 聚类篇 Kmeans系列

发布时间 4月初

2019-03-21 10:45:56 297

原创 数据挖掘算法 数据预处理之数据缩放(映射)

数据映射简介无论是 归一化 标准化 本质上都是将数据进行映射到一个区间范围目的:1) 提升模型的收敛速度如下图,x1的取值为0-2000,而x2的取值为1-5,假如只有这两个特征,对其进行优化时,会得到一个窄长的椭圆形,导致在梯度下降时,梯度的方向为垂直等高线的方向而走之字形路线,这样会使迭代很慢,相比之下,右图的迭代就会很快(理解:也就是步长走多走少方向总是对的,不会走偏)2)提升模...

2019-03-19 11:11:37 1815

原创 数据挖掘算法1 逻辑回归

预计发布时间 3月低

2019-03-18 14:52:26 269

原创 汇总篇 风控建模 13大环节,让建模工作量化

风控建模环节中,关键的在于是对所有环节进行量化环节汇总如下:1 定义Y值Y值的确定相当于整个建模的目标值,最重要的值,因为只有一个!!!!!2 变量的准备工作各类变量的储备以及变量衍生工作3 分箱卡方分箱作为主要分箱方式(也可Best-ks 决策树分箱 )核心基于公司对应客群4 IV筛选针对所有变量进行筛选满足IV要求的变量5 WOE满足要求的变量(可能某一箱...

2019-03-15 11:35:23 1698 2

原创 介绍篇 决策引擎环节

决策引擎概念简述在我理解上 决策引擎类似是一个管道、运输系统,连通整个风控流程,所有的规则和评分卡以及流程都覆盖其中,分配到每一个环节(比如人工),将结果返回给决策引擎,走入下一个流程决策引擎的使用规则决策引擎的分流效果评分卡是内置在决策引擎当中,基于评分卡的分段,评分卡的使用具体参见:评分卡在策略中的使用,进行分流,分流决策的目的是为让好客户以及有借款欲望客户进一步走入下一流程决策引擎...

2019-03-13 13:48:31 4298

原创 介绍篇 贷中环节

贷中环节贷中:其实也就是用户授信之后,提现相关动作的行为相关操作核心内容1 针对提现用户:提额 降额 以及 冻额操作用户频繁提现,还款良好且额度利用率较高用户基本不提现,可以适当降低额度用户恶性提现,或者已经逾期严重,实行冻额实际上:在小贷领域,很少有解冻操作2 针对客户历史提现数据预测该笔是否是赚钱,如果不赚钱就禁止提现3 针对在途客户,预测该笔是否逾期,及时作出相应操作,...

2019-03-12 13:56:54 1820

原创 介绍篇 授信环节

授信环节定义授信环节简单讲 获客后,用户是否获得借款资格的环节授信环节 最多可进行策略分配的环节能否很好的在授信环节区分好快客户,相当于一个大闸,如果将好快客户识别并且管控,是一项很庞大的项目在之前的文章中详细介绍https://blog.csdn.net/qq_23483285/article/details/88292777现在基于实际情况具体讲解申请评分模型:传统的A卡基于用...

2019-03-12 13:56:03 1266

原创 PART 7.1 评分卡作为策略的使用

最重要的事情开始都会讲:建模是始终服务于业务的,没有业务的评分卡就没有灵魂概率值转化为分数的意义核心在于业务的使用、理解和策略的决策首先全部为概率值时,在样本不均衡条件下,概率值分布基本都维持在0.9以上,概率的分布在[0,1],分布属于变态分布,分值的转化目的是将变态分布转化为类正态分布,更加偏重于实际的使用,也就是两边少中间多,便于做决策不过需要建模的过程,很多时候样本的比例来讲不会...

2019-03-12 13:52:19 1062

原创 PART 4 风控建模 变量筛选

变量筛选包含核心点如下 1 变量可解释性 确定筛选变量是可解释变量,不是没有含义的 2 变量相关性 由于很多变量基于时间切片或者衍变模式类似,所以需要检测剔除,目前剔除方式是保留IV最大的,剔除IV较小的,但是这种方式忽略了变量间组合的效果作用,不能保证模型的效果最大化,后期会做相应的优化 3 变量共线性 两两相关性检测完毕后,需要观察变量与其他变量的组合关系 4 变量显著性 选择...

2019-03-10 10:48:23 1831

原创 PART 6 风控建模 评价指标

一般公司风控建模的维度包括变量维度以及模型维度建模玩家重心都会关注模型的整体效果,但是建模的效果本质上是变量的作用效果,在对模型汇报的前提下,建议需要再次检查变量维度信息,可以纠正整体模型效果模型维度从宏观维度评价模型变量维度变量分箱情况针对分箱效果的检测,详见 风控建模分箱篇变量相关性设定好最大相关系数标准(corr)变量共线性膨胀因子:一般设定为10以下,但是实际...

2019-03-10 10:46:25 1294

原创 数据挖掘算法专栏:内容记录&发布时间

逻辑回归随机森林决策树聚类时间序列GBDTXGBOOST推荐算法

2019-03-08 13:48:53 225

原创 PART 5 风控建模篇: 逻辑回归

样本的使用:训练集训练模型 用来学习的样本集,用于分类器参数的拟合测试集调节参数 用来调整分类器超参数的样本集,比如罚项,学习率等验证集验证模型泛化能力仅用于对已经训练好的分类器进行性能评估的样本集 (样本外验证同理,仅用于测试数据的结果)交叉验证集:(比如K-fold)1 训练集+验证集 as 模型 测试集独立存在2 交叉验证 小样本操作 验证集 训练集 忽略3 测试集和...

2019-03-08 11:41:45 1754 10

原创 介绍篇 催收环节

催收催收环节是针对逾期客户所采取的策略和评分卡,评分卡模块在PART 2.1 中已经有初步介绍,但是实际上关于催收的具体操作和步骤来讲其实其余的文章讲解的没有那么清晰。在这里需要针对具体业务和环节进行讲解催收客户类型和风险级别第一类 轻度 还款意愿和还款能力良好,客户特殊原因(忘了,自己周转,系统问题)第二类 中轻度 还款意愿良好 还款能力出现问题第三类 中度 五还款意愿或者还款意愿恶...

2019-03-07 14:54:23 3496

原创 风控建模专栏:日志记录&内容发布

风控建模篇:卡方分箱篇处女文章 1:PART 3.1 风控建模卡方分箱步骤详解篇 发布时间:2019年02月11日2:PART 3.2 风控建模卡方分箱前期数据处理篇 发布时间:2019年02月13日3:PART 3.3 风控建模卡方分箱计算篇 发布时间:2019年03月06日数据预处理篇4 PART 1 如何确定建模的Y值 发布时间:2019年02月19日5 PART 2.1...

2019-03-07 11:36:52 1044

原创 PART 2.1 风控模型种类&变量选择范围&变量衍生&特征交叉

评分卡环节的介绍风控模型种类获客阶段:用户响应模型:在获客阶段的用户转化情况(比如互联网引流用户注册情况)风险预筛选模型:不同渠道的风险指数不同,客户质量不同,导流途径和方向不同授信阶段:申请评分模型:传统的A卡反欺诈模型:团伙欺诈、个人欺诈、关系拓扑等风险定价模型:不同的客群利率不同,收益评分模型:基于客户收益状况评分贷后阶段:行为评分模型:基于提现情况 进行评分,针对得...

2019-03-07 11:20:40 4598 2

原创 PART 3.3 风控建模卡方分箱计算篇

卡方分箱算法主要包括两个阶段:初始化阶段和自底向上的合并阶段卡方值计算公式:O =观测频率E =期望频率∑ =总和X2 =卡方值卡方分箱excel计算演示1 对数据进行排序2 对数据进行分组(比如10组)3 计算相邻两箱的期望值数据4 选择最小卡方值进行合并如果结果所示 group0.61-0.7 与 group0.71-0.8两组差异化最小卡方值最小...

2019-03-06 17:17:38 4192 17

原创 PART 2.2 风控建模前数据预处理&清洗

广义数据预处理包括:数据清洗,数据集成(用户基础数据,外部第三方数据,埋点数据),数据变换(WOE)类型 重复值 字段问题空格大小写不一致多余符号关键字替换 缺失值完全随机缺失(是随机的,数据的缺失不依赖于任何不完全变量或完全变量:设备出问题,导致缺失值,仅仅本身问题)随机缺失(数据的缺失不是完全随机的,即该类数据的缺失依赖于其他完全变...

2019-03-01 20:49:03 1300

原创 PART 1.1 如何确定建模的Y值

风控建模:如何定义Y值定义Y什么样的客户是好客户什么样的客户是坏客户我认为是首要的,也就是需要有一个目标,也就是方向要对简要介绍A B C 卡A卡(Application scorecard)申请卡:客户授信,预测客户开户后一定时期内违约拖欠的风险概率,有效排除信用不良客户和非目标客户的申请B卡(Behavior score card)行为卡:在帐户管理期,根据账户历史上所表现出来的...

2019-02-19 10:44:26 6019 3

原创 风控Python绘图技法代码示例

承接风控建模篇第5节,现对各个细节点讲解绘图元素代码示例First part 位置决定身材整体框架的布局位置设置 画布 绘图区 图例简单介绍下:画板称为Canvas画布称为Figure绘图区称为Axespyplot存在当前画布窗口和当前绘图区当声明完一个画布或者一个绘图区所有代码所绘制的图像展示声明的当前的画布和当前的绘图区,直到声明新的画布或者绘图区为止 im...

2019-02-15 15:56:57 869

原创 风控Python绘图技法汇总

风控Python绘图技法汇总现在看很多绘图的,基础资料准备相对比较齐全,但是相对框架性的学习比较少这是我做的一幅卡方分箱图,仅供参考绘图的元素一览实际上,想绘制出一幅比较精致的图,首先需要对绘图的元素有一个充分的了解,如果没有足够的视觉触感,可以手动在excel设置绘图,查看图表元素通过具像的展示,可以了解元素的重要性 图片以及绘图区大小背景颜色 绘图类型...

2019-02-15 09:56:34 610

原创 PART 3.2 风控建模卡方分箱前期数据处理篇

单一变量比重检测 通常是设置比例的#drop_list不满足条件列表drop_list=[]#对变量单一值进行检测,比例大于等于0.95,放入不满足条件列表,最后扔掉for col in adata.columns: percent = adata[col].value_counts().max()/float(len(adata)) if percent>=0....

2019-02-13 21:20:50 1854 3

原创 PART 3.1 风控建模卡方分箱步骤详解篇

风控建模卡方分箱内容详解篇这是我第一次使用CSDN文章,希望将很多事情做到细致和极致,也希望真的可以给大家带来帮助客观讲,卡方检验逻辑简单,基于四个表计算卡方值,通过自由度,置信度得到该条件下的卡方值基于四个表卡方值与实际操作进行比对,对实际结果进行比对,是否有显著区别风控建模分箱流程图很多博客很客观的讲,代码的问题不多讲述,基本都是以代码讲解,大部分都是复制,不具备可读性,这里...

2019-02-11 17:46:02 5647 3

em代码matlab版

em是聚类算法中一类十分经典的算法流程,希望大家可以学习一下,对以后的大数据时代有很大的益处,同时我觉得这个算法对于初期学习的人来说有很大的助理

2014-11-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除