策略规则常见10大应用问题

答疑:Devin老师

编辑:Joey

近期收到同学们在学习策略或工作应用中遇到的不少业务问题,今天小篇统一整理了一下,分享给大家。我们讲师也是结合实际业务场景的经验,给了同学们细心答复。大家可以看看有没有自己遇到的相似问题?关注【金科应用研院】回复“CSDN”领取风控资料礼包。

课程干货回顾:知识星球-第6期大咖直播课:风控策略规则开发与应用

01

Q:对不同的分析场景,在实践中一般会有多少条策略规则?

A:金融不同业务场景的贷前策略规则有一定区别,比如对于不同金融机构(银行、消金、小贷、保险等)、不同产品(个人、企业)等。但一般情况下大约在30条~100条的范围。

银行的策略规则一般不会很多,因为客户群体本身大多都是优质用户,而对于消金公司,客户群体资质会差一点,策略规则数量稍多些。

一般从信息核验类(要素核验、黑名单核验等),加上基本信息、人行征信数据的策略规则加起来有几十条。当然,由于各家机构业务不同,以及风控思路不同,策略数量有时差别也会挺大,但大体情况如上所述。

02

Q:策略特征一般是怎么选择的?在实践中可能可供选择的特征有几十上百个甚至更多,策略人员怎么选择出来十几个用来建立策略和分析?

A:在实际业务场景中策略规则有很多,具体选择建议是将所有线上应用的规则都引入,当然有一类规则要除外,即“核验类规则”,比如:

要素核验(二要素、三要素、四要素等);

黑名单核验(司法黑名单、征信黑名单等);

产品范围(省市区域等);

这些策略规则是强性规则,不需要矩阵分析,如果用户命中直接拒绝就可以了。

此外其他规则可以采用决策矩阵,如果为了保证风控的精准度,可以将其余所有规则引入。但太多了也会造成监测调整维护起来较麻烦,因此可以进行规则筛选,这时需要考虑规则的效果,选择区分度较好的、信息维度有代表性的、业务类别有意义的、规则字段相关性比较弱的、规则字段分布稳定性较好的等。

03

Q:策略规则选用的时候会有要求么,比如较强的业务含义?

A:策略规则的选用是比较看重业务含义的,因为业务维度越多,说明识别用户风险的维度也就越多,从风控的思想来讲,这是非常重要的。但是,除了业务含义,策略规则字段的效果也是十分重要的,比如:策略规则的准确性、稳定性、解释性等,要选择区分度较好的、稳定性较好的等,这样才能保证决策矩阵的准确性能和稳定性能。

04

Q:在课程中提到模型区分度一般比策略规则区分度好,在实践中,最终等级因为规则策略影响的比例大概多少?

A:影响比例这个是无法界定的,也不需要去关注。对于风控来讲,将策略与模型的体系架构好了实现风控准确度提升的目的,这才是重点。所谓模型区分度一般比策略规则区分度要好,意思某个模型分数比某个策略规则的区分效果要好很多,理由是:

一方面是模型是由多个变量训练拟合而成的,包含的信息维度较多;

另一方面是最终分数单调性的连续分布,可以较好的区分出响应的比例;而对于某条规则,在这重要的两个方面是很难和模型相比的。

当然,一个模型和一套策略多个规则集相比,效果是不好衡量的,也没有太大意义,而且这和很多实际业务需求有关。无论怎样,策略模块的规则类别越多、每个规则的区分度越好,那策略的性能越好,同对模型也是如此,这样构建出的决策矩阵在实际应用中的综合效果会很好的,简单点说,这也是风控的思想。

05

Q:针对分区度高的规则或变量,如果命中总样本量较少(少于30)时,怎么处理?还要做成规则吗?

A:区分度高的规则或变量命中总样本的数量少,比如只有0.5%,一般情况下不是优先考虑,主要原因并不在于命中数量太少,而是担心这样的规则在后期不太稳定,波动的可能性较大,如果其他可选的规则较多,或者非常想用这条规则的话,也可以考虑的,只是要特别测试下这条规则在不同时间窗口样本下的稳定性,如果表现稳定也是可以采用的,当然还要分析下是否被其他规则覆盖、字段调用的成本等。

这个问题回归到实际业务中,其实是很少出现的情况,变量的区分度很好,要是好的话各个区间的分布有明显的差异,不仅仅局限在刚说的这种命中很少的情况,若某个区间命中很少,可以适当往前扩大点区间,假如不便于扩展而出现了问题描述的情况,那就是按照前边说的思路处理。

06

Q:考虑数据成本和策略效果,怎样对规则中使用数据源的先后顺序进行排序?

A:

先信息核验类后信用风险类;
先欺诈识别类,后信用评估类;
先价格较低类,后价格较高类;
先特征标签类,后模型分数类;
先数据内部类,后数据外部类;
先区分较好类,后区分较弱类…

这些原则不是绝对的,但都是考虑的原则,在实际部署时,在同等情况下重点排序,此外还要考虑规则之间的覆盖情况。

07

Q:原样本和新样本取数时间范围一般各是多久?

A:在课程中原样本指的是开发样本,新样本指的是测试样本,从时间窗划分,原样本在前,新样本在后。一般情况下,建议开发样本的时间窗最好取36个月,测试样本的时间窗最好取13个月,具体也得看实际业务情况,选取的时间窗口数据能否满足开发的需求,这是很重要的。

此外,开发样本与测试样本时间窗不要有重叠,且间隔时间最好是相邻。举个例子,开发样本13月,测试样本45月。

08

Q:拒绝规则按照命中个数,稳定性怎么样,后续怎么迭代

A:可以采用PSI指标来监测规则的稳定性情况,优先监测规则区间的稳定性结果,然后关注变量本身多个区间的稳定性结果,这个工作是可以一次性出结果的,只是重点看规则区间的波动情况。

如果波动性比较大,先采用阈值调整,一般是缩小占比,以保证不同时间窗样本下比较稳定,区分度还是保持好的。如果阈值不好调整,那就需要将此规则直接弃用,或者与别的规则进行组合使用。

09

Q:几个拒绝规则的变量的IV为0.2左右,且变量也不是黑名单类的强拒绝规则,那这样把这几个拒绝规则做或运算的话,拒绝的客户量就比较高?

A:在规则开发时,优先对单一规则进行通过率与区分度分析,但在部署之前,务必要对所有规则的决策效果进行整体分析,以保证最终对业务影响的通过率和坏账率符合预期。因此,在开发出多个规则之后不会直接上线,还会做整体规则的应用分析,如果得到的通过率满足预期可考虑部署上线;若得到的通过率较低或较高,那需要对某些区分度较好的规则进行阈值调整,在保证坏账表现合理的情况下,适当放宽一点拒绝阈值。

10

Q:如果规则的首逾7天指标区分度高,但首逾30天逾期率区分度低,这种该怎么处理?

A:这是由于目标变量定义口径不同,使得目标变量的分布存在很大差异,规则的区分度自然也很容易变低,但根据这种情况来说规则效果变差的话,是不太合理的,开发某条规则,是定义好了目标才进行划分阈值确定规则的,既然是确定这条规则,说明区分度是比较好的,这和目标逾期几天没有什么关系的。

如果目标定义又发生了变化,那规则自然也得重新开发,对应的阈值一般也就发生了变化。因此,问题描述的情况从客观角度说,是不存在的。要理解一点,规则是定义好目标才开发的,而不是开发好规则再去变化目标定义的,这不是随便可以双向变化的,而是一个单向的流程机制。

如果你喜欢、想要看更多的干货类型的文章,可以把【金科应用研院】设为星标🌟,顺便转发分享~
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于规则策略的微电网多目标优化是利用计算机编程将规则策略应用于微电网中的多目标优化过程,通过Python代码实现。以下是一个简单的示例代码: ```python import numpy as np def minimize_cost_loadshedding(load_demand, battery_capacity, pv_generation): # 假设目标是最小化成本和负荷削减 # load_demand为负荷需求,battery_capacity为电池容量,pv_generation为光伏发电量 max_battery_capacity = 0.8 * battery_capacity # 最大电池容量为总容量的80% max_loadshedding = 0.3 * load_demand # 最大负荷削减为负荷需求的30% # 初始化参数 best_cost = np.inf best_battery_capacity = 0 best_loadshedding = 0 # 进行参数搜索 for i in range(int(max_battery_capacity)): for j in range(int(max_loadshedding)): cost = calculate_cost(load_demand, i, j, pv_generation) # 计算成本 if cost < best_cost: best_cost = cost best_battery_capacity = i best_loadshedding = j return best_cost, best_battery_capacity, best_loadshedding def calculate_cost(load_demand, battery_capacity, loadshedding, pv_generation): # 假设电池存储能量的成本为1,负荷削减的成本为5,光伏发电成本为0.5 battery_cost = battery_capacity loadshedding_cost = loadshedding * 5 pv_generation_cost = pv_generation * 0.5 total_cost = battery_cost + loadshedding_cost + pv_generation_cost # 计算实际负荷需求 actual_load_demand = load_demand - min(battery_capacity, loadshedding) # 如果实际负荷需求小于0,增加超出光伏发电的成本 if actual_load_demand < 0: total_cost += abs(actual_load_demand) * 0.5 return total_cost # 示例用法 load_demand = 100 # 总负荷需求 battery_capacity = 50 # 电池容量 pv_generation = 60 # 光伏发电量 best_cost, best_battery_capacity, best_loadshedding = minimize_cost_loadshedding(load_demand, battery_capacity, pv_generation) print("最佳成本:", best_cost) print("最佳电池容量:", best_battery_capacity) print("最佳负荷削减:", best_loadshedding) ``` 该代码实现了一个简单的基于规则策略的微电网多目标优化的示例。使用常见的迭代搜索方法,对电池容量和负荷削减量进行参数搜索,找到最佳的成本并返回最佳的电池容量和负荷削减量。最后,输出最佳成本、最佳电池容量和最佳负荷削减量。注意,该示例仅用作演示,实际情况可能需要更复杂的策略和优化算法。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值