本文转自https://github.com/xsj0609/data_science/tree/master/ScoreCard
一、评分卡逻辑
信贷业务评估的是客户的客户违约率(Percent of Default)即PD,是[0,1]的概率,比如2%即100个客户中有2个违约,简称为p。
评分卡中不直接用客户违约率p,而是用违约概率与正常概率的比值,称为Odds,即
O d d s = p 1 − p Odds=\frac{p}{1-p} Odds=1−pp
p = O d d s 1 + O d d s p=\frac{Odds}{1+Odds} p=1+OddsOdds
评分卡的背后逻辑是Odds的变动与评分变动的映射(把Odds映射为评分),分值是根据Odds的前提条件算出来的,不是人工取的。以单个客户在整张评分卡的得分的变动(比如评分从50分上升到70分)来反映Odds的变动(比如Odds从5%下降至1.25%),以及背后相对应的客户违约率PD的变动(比如从4.8%下降到1.2%)。违约率PD不直观、业务看起来不方便、不便计算,而评分就很直观、便于计算。如图所示。
二、评分映射公式
Odds映射为评分的公式为:
S c o r e = A − B l o g ( p 1 − p ) Score=A-Blog(\frac{p}{1-p}) Score=A−Blog(1−pp)
<1> 预设条件
要算出系数A、B的话,需要从业务角度先预设两个前提条件:
- 在某个特定的比率 θ 0 θ_0 θ0设定特定的预期分值 P 0 P_0 P0
- 指定比率翻番时分数的变动值(PDO)
解释:
- 比如根据业务经验,消费金融信贷的客户违约率4.8%算正常( θ 0 θ_0 θ0=Odds=5)。预设评分卡的分值为0-100分,那取预期分值 P 0 P_0 P0为50分,并指定当Odds按双倍上下浮动时(比如2.5%或10%),分值则对应上下变动10分(比如60分或40分)。
- 这里=5%是根据业务经验来的,没有数学依据;
- 0-100分是根据做评分卡的需要来的,没有数学依据。要是想做成600-1000分的评分卡也可以,修改对应的 P 0 P_0 P0和PDO就行;
- P 0 P_0 P0=50分是根据0-100分来的,也可以取45分或73分,不重要。重要的是随着Odds翻番变动时,分数也随之变动的联动变化体系(你翻番我就变PDO=10分)
<2> 求解A、B
设定好 θ 0 θ_0 θ0、 P 0 P_0 P0、PDO后,联动变化为:Odds( θ