接到有用数据的5个做法,让你不再头疼

“信用策略做得好的就一定能把欺诈策略做得好吗?”
“不是”

反欺诈的策略是定义NO的,找出不准入的人,比较像是排雷的过程。

信用策略一部分工作同样是定义NO,例如逾期天数限制、信贷申请次数限制,但信用策略更需要偏重于定义YES,也就是定义目标客群特征。

我们在定义NO时,需要接入数据源来辅助判断,那么头疼的问题来了:

如何接到有用的数据?

🌟做法1:确定一个拟测试数据的list,选取测试样本发过去,待测试样本返回后,运用单变量分析方法,确定ks/iv等高的数据对接;

🌟做法2:在样本选取上考虑信用与欺诈的区别,特别定义一批欺诈样本,进行做法1的测试;

🌟做法3:在做法2的基础上,按照数据功能模块,有针对性的选取数据厂商进行对比测试,加入到现有的反欺诈策略体系中,计算增益效果;

🌟做法4:分欺诈类型,如养卡模型、伪冒模型、中介模型,分别挑选样本,在做法3的基础上进行测试。

🌟做法5:在做法4的基础上,除进行单变量和增益计算外,还要考虑每类数据特征,如设备指纹数据的机型兼容率测试指标,制定差异化的评价指标。

上面列举的5种数据接入测试评价的方法,也是目前大多数机构在采用的方法,实际上每种做法都有一些细节需要考量。

以做法2为例,很多建模人员和策略人员并不会区分B样本的风险成因,据此编制的规则和模型就会存在一定的差异或者问题。

如果欺诈风险拦截发生在第一环节,那么一旦欺诈策略出现改动,进入到信用策略决策阶段的样本就会与训练和验证样本出现偏差,简单说就是模型或者是信用策略决策效果可能会下降,在复盘分析时会得出错误的或者是有偏的结论。

另外还会存在一个问题,当你在做变量构建或是衍生时,可挑选的基础变量呈现出的IV或是KS并不能代表欺诈属性的成色,有的变量在纯欺诈样本的表现可能可用,但是在综合样本上的表现却不尽如人意。

所以在接欺诈数据的流程上,需要分项测试,如下图。

图片

而在数据或是技术评价时,要像下图一样制定如做法5一样差异化的评价指标,而不是唯统计学指标论,因为欺诈识别是特征识别,并不是绝对的量化分析,“欺诈/非欺诈”和“好/坏”并不可以划等号(深入理解一下)。关注【金科应用研院】,回复CSDN,免费领取风控干货礼包!

图片
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值