大数据智能风控核心：模型

最新推荐文章于 2024-10-25 15:34:27 发布

johnny233

最新推荐文章于 2024-10-25 15:34:27 发布

阅读量1.4k

点赞数 29

分类专栏：读书笔记文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lonelymanontheway/article/details/141684873

版权

概述

模型

线性判别分析方法，Sir Ronald Fisher最早提出模型评分的概念。

个人FICO模型信用分。

巴塞尔委员会发布巴塞尔Ⅱ协议，推出内部评级法（Internal Rating Based Approach，IRB）。IRB综合考虑客户评级和债项评级，通过违约概率(Probability of Default, PD)、违约损失率(Loss Given Default, LGD)、违约风险暴露(Exposure At Default, EAD)以及有效期限(Maturity, M)四个风险要素计算信用风险加权资产。

按照信贷生命周期划分，有四种应用最为广泛的模型：

A卡：申请(Application)模型，贷前，审批与额度
B卡：行为(Behavior)模型，贷中，还款
C卡：催收(Collection)模型，贷后，催收
F卡：反欺诈(Fraud)模型，全流程，反欺诈。

算法

模型和算法是两个概念：

算法是一系列针对特定问题或任务的计算步骤或指令。它是一种具体的计算过程，用于处理数据并生成有用的结果。
模型是通过算法在特定数据集上训练得到的结果或表示。它是对数据的一种抽象和概括，用于预测或推断新的数据样本。模型可以采用数学方程、统计分布、决策规则等形式，它的目标是对未知数据进行预测或分类。

逻辑回归算法

逻辑回归(Logistic Regression, LR)算法：一种经典的二分类算法，可用于预测客户的违约概率。它通过估计一个线性回归方程并将结果映射到一个概率值（0到1之间）来预测违约概率。

两个变量之间存在线性关系，也叫一次函数关系，映射到直角坐标系中是一条直线。公式： $y=b_0+b_1*x_1+b_2*x_2+e$ 就描述一种线性关系。

该公式由四部分组成：

$x$ ：自变量或预测变量，可以是原始变量、转换变量或虚拟变量；
$b$ ：回归系数或参数估计，相当于变量的权重。虚拟变量的系数表示其相对重要性；
$y$ ：因变量、目标变量或响应变量，与结果有关。通常0代表坏，1代表好，这样最终分数越高代表信用质量越好；
$e$ ：残差或误差，是模型无法解释的部分，通常可以忽略

线性关系是研究n个变量之间关系的函数，回归系数可以解释一个模型中预测变量与目标变量之间的关系，也是研究多个变量之间的关系，更具体地说是研究因变量和自变量之间的关系。根据是否违约，可以将信用评估结果划分为0和1两类。一般情况下，0表示未违约，1表示违约。由于线性回归会有多个输出值，无法进行直接分类，因此LR通过一个单位阶跃函数将线性回归函数输出结果映射到0或1，最终成为逻辑回归函数。逻辑回归算法通过把y的结果带入一个非线性变换的Sigmoid函数中，将结果映射到0到1之间的概率值，进而预测客户未来的违约概率，即

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

johnny233 晚饭能不能加鸡腿就靠你了

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。