![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
风控建模
文章平均质量分 92
风控模型知识分享与技术研读
fantasticString
专注于风险管理、大数据与机器学习领域知识
展开
-
PRIM(Patient Rule Induction Method)规则发现算法在风控中的应用
在风控策略迭代过程中,我们通常需要从高维变量中搜索组合得到规则集(RuleSet),但是单纯依靠画格子、CART决策树等常规手段具有很高的挑战。此时,我们需要一种更为智能、更自动化的方法,从大量变量(高维空间)里找到最优规则集,这就是规则发现。本文主要介绍一种规则发现算法,即病人规则归纳方法(Patient Rule Induction Method -PRIM),并紧密结合信贷风控业务知识,详细介绍理论和实践应用。Part 1. 规则发现的概念很多机器学习二分类问题抽象为 f(y|x) ,根据输.原创 2021-03-30 10:28:03 · 1664 阅读 · 2 评论 -
机器学习模型效果评估指标与方法介绍
模型评估是模型开发过程的不可或缺的一部分。它有助于发现表达数据的最佳模型和所选模型将来工作的性能如何。在数据挖掘中,使用训练集中的数据评估模型性能是不可接受的,因为这易于生成过于乐观和过拟合的模型。数据挖掘中有两种方法评估模型,验证(Hold-Out)和交叉验证(Cross-Validation)。为了避免过拟合,这两种方法都使用(模型没有遇到过的)测试集来评估模型性能。一、验证(Hold-Out)使用这种方法时,通常大的数据集会被随机分成三个子集:训练集:用于构建预测模型。验证集:用于评估训.原创 2021-03-25 17:57:55 · 4643 阅读 · 0 评论 -
如何量化样本偏差对信贷风控模型的影响
风控是信贷业务的核心,业务实践中经常会出现样本选择性偏差(samplebias),从而影响模型效果,影响信贷业务。而很多风控模型也都只能基于有偏样本建立。对于样本偏差对风控模型的影响,很多模型同学一般只是定性分析,为此,本文将尝试从量化的角度探讨这一点,希望能给大家一些方法论上的启发。目录信贷业务中的样本偏差来源信贷业务中的风控模型术语拒绝推断方法概述仿真实验设计评价总结01信贷业务中的样本偏差来源信贷业务大致分为营销获客、贷前授信、贷中动支等几个环节。如图1所示,每一个环节都有一.转载 2021-03-08 09:33:52 · 1276 阅读 · 0 评论