风控规则成本最优排序算法

        规则要全部过,成本挺高的。

        过漏斗排序,就要需要知道怎么排序。

        举个栗子:以下为用户全部规则都进行判断的时候。(0是未命中规则,1是命中规则)

user_idrule_1rule_2rule_3rule_4rule_5rule_6rule_7rule_8rule_9rule_10
10000011110
20000000000
30000000000
40000000000
50000000100
60000000000
70000000100
80000000100
90000000000
100000000100
110000000000
120000000100
130001000001
140001000001
150001000001
160001000001
170001000001
180001000001
190000010110

  如果需要更改风控流程为只要命中一个规则则输出结果,不进行后续规则判断,则需要对这些规则进行排序。每个规则调用都可能互相干涉且成本可能不一。

按照上面栗子的数据使用穷举的话,会有3628800种排序方式。如果这样的话,生活就不美好了。所以需要一个算法来进行处理从而降低筛选耗时提高效率。

       

        设:A、B、C规则分别命中情况:307、611、173  规则可能存在多重命中的情况。其中全集U为2575。Pa、Pb、Pc规则调用金额分别为:0.15、0.5、0.15。

求A、B、C规则排序。

解:对于3个规则只需要对比每个规则的优先级,再根据每个规则的优先级进行排序即可。

1、Pa*U+Pb*(U- A)比Pb*U+Pa*(U-b) 化简一下可得:Pa*U+Pb*U-Pb*A 比 Pb*U+Pa*U-Pa*B => 可得:-Pb*A : -Pa*B ,   -Pb*A=-153.5,-Pa*B=-91.65, -Pb*A<-Pa*B 故A排序在B前。

2、Pa*U+Pc*(U- A)比Pc*U+Pa*(U-C) 化简一下可得:Pa*U+Pc*U-Pc*A 比 Pc*U+Pa*U-Pa*C => 可得:-Pc*A : -Pa*C ,   -Pc*A=-46.05,-Pa*C=-25.95, -Pc*A<-Pa*C 故A排序在C前。

3、Pb*U+Pc*(U- B)比Pc*U+Pb*(U-C) 化简一下可得:Pb*U+Pc*U-Pc*B 比 Pc*U+Pb*U-Pb*C => 可得:-Pc*B : -Pb*C ,   -Pc*B=-91.65,-Pb*C=-86.5, -Pc*B<-Pb*C 故B排序在C前。

综上,A小于B、C,B小于C,可得排序 1,A、2,B、3,C

矩阵:

ABC
Pa--91.65-25.95
Pb-153.5--86.5
Pc-46.05-91.65-

从矩阵来看,需要对比的是斜对角的数的大小。

python代码:

首先构建数据:

import pandas as pd
import numpy as np

data=[[307,0.15],[611,0.5],[173,0.15]]

df_value = pd.DataFrame(data,columns=['hit_rule_cnt','pricing'],index=['A','B','C'])

其次生成矩阵:

data = pd.DataFrame(np.random.rand(df_value.shape[0],df_value.shape[0]))

for i in range(df_value.shape[0]):
    for a in range(df_value.shape[0]):
        data.iloc[i,a] = -1*df_value['pricing'][i]*df_value['hit_rule_cnt'][a]

data.index=df_value['pricing'].index

data.columns= list(df_value.index)

data.index = ['P'+x for x in list(data.index)]

 

最后进行计算:

data2 = data.copy(deep=True)

for i in range(data2.shape[0]):
    for a in range(data2.shape[0]):
        if data.iloc[a,i] > data.iloc[i,a]:
            data2.iloc[a,i]=1
        else:
            data2.iloc[a,i]=0

输出计算结果:

data2.sum().sort_values()

以上,如有错误请大家指出,请多多指点。谢谢。 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值