反欺诈篇二

关注公众号“番茄风控大数据”,获取更多数据分析与风控大数据的实用干货。
 

数据和模型是反欺诈系统架构的基础。这在之前的文章里也是反复提到过的。数据究竟在反欺诈模块里究竟是怎么使用的?本文主要是想再稍微深入些讲一下这方面内容。首先我们给大家科普下黑产的那些“黑话”,便于大家更好的理解欺诈以及如何去做反欺诈,话不多说,上干货。

在这里插入图片描述

讲完上面的黑话,我们来几个具体的场景感受下:
场景一:
A:兄弟,最近手头有料没?
B:刚好搞了一些轨道料,都是内料、外料都有,正准备找人刷货。
A:刷货多老土啊,还得买设备,而且现在都是芯片卡,也不好刷。我刚好认识一个挂马的,到时给你洗拦截料,方便快捷还安全。
B:技术真是日新月异啊,你不说我还真不知道。
场景二:
A:最近搞了一批菠菜,价格实惠
B:哪来的货?
A:拖库来的。
B:菠菜品质怎么样?我比较想要XX网的。
A:货还没撞过库,你要的货得等一等,我还没来得及拖库。
B:行,上次那批货我已经洗过了,质量一般。
场景三:
A:有没熟悉的卡商,找他买两千张卡。
B:这么多卡忙得过来吗?
A:你怎么那么笨阿,不是有猫池么。
B:对对对,要是做不过来还可以找打码的帮忙。
A:现在前期资金不够,我们设备有限,你看看找个认识的,整个改机工具,我们也好批量注册。
B:好嘞,科技进步就是好
场景四:
A:上次买的那批卡注册的白号怎么样了?
B:那批现在在养号,咱们之前的号可以出货了。
A:那些活粉好好养着,等平台有活动咱们可以干一票,那些死粉有人需要刷粉的可以卖一卖。
场景五
A:今天站街情况怎么样?
B:还可以,有十几个,大多都压门压中了,接门没接好死了一大半,不过今天转门那里有条大鱼。
A:那还行,站街勤快点,业务量才能上去。
场景六
A:联系菜商,我们要大批进货扩大业务。
B:收到,卡头那边的资料拿到手了。
A:很好,通知水房多找点声佬,车手你也多找些,最近会有大动作。
场景七:
A:你那边最近有好马吗?
B:最近到山里的农场开了几场大会,这马一抓一大片。
A:厉害,我这医院的马现在资料都不高,老是蓝不够,这垫蓝一来二去的容易被发现,还是要跟着老哥多取经。

看了上边的七个场景对话,大家有什么想法,反正我觉得他们够专业,每天和这样的人斗智斗勇,感觉智商都不够用了,只有逼着自己不断学习,提高风控能力,才能和他们接着互相伤害。接下来我们正式进入主题:数据与模型在反欺诈模块里里究竟是怎么使用的?

一、客户画像与数据关联  

我们经常给公司的资产客户进行客户画像。尤其是获得了全面的数据来源之后,数据源的丰富性让我们的互相更准确些。请看下图:
在这里插入图片描述
而反欺诈系统的关键就是也是必须得靠这些数据关联得出具体的用户画像。因为数据本身的价值就是数据的关联性,如果数据都是割裂的就失去了价值,通过关联不同的数据来源形成具体的用户画像才能充分利用数据的价值

在这里插入图片描述
在这里插入图片描述
而整个反欺诈系统架构能否稳定、有效地工作,关键的数据能否得到及时地处理并以合适的格式呈现出来,则直接与整个系统架构的处理性能有关。
而另一块反欺诈系统架构的处理性能主要体现在系统的处理速度和系统整体的稳定性上,处理性能的高低会直接地影响用户体验和反欺诈效果。

二、反欺诈系统要求毫秒级实时处理  

反欺诈系统的处理速度是指系统从海量的数据中识别欺诈信息的速度。系统对于欺诈信息的识别速度对于反欺诈系统的成功与否有着直接影响。在欺诈领域,特别是交易欺诈具很强的实时性的特点,因此要求反欺诈系统必须能够实时地识别欺诈信息,做到毫秒级别的欺诈识别,才能有效地阻止诈骗行为。另外,针对欺诈分子的秒杀、恶意登录攻击等行为,平台也无法忍受反欺诈系统的任何延迟。 
如果反欺诈系统的处理速度过长或者出现长时间的延迟,那么会造成以下不良后果: 
•欺诈分子有机可乘,利用监管时间差进行诈骗,使用户受到交易欺诈的风险大大增加; 
•借贷平台等机构的审批流程加长,影响用户体验,进而导致平台的客户流失。

三、反欺诈系统整体稳定性要求高  

反欺诈系统的处理速度是指系统从海量的数据中识别欺诈信息的速度。系统对于欺诈信息的识别速度对于反欺诈系统的成功与否有着直接影响。在欺诈领域,特别是交易欺诈具很强的实时性的特点,因此要求反欺诈系统必须能够实时地识别欺诈信息,做到毫秒级别的欺诈识别,才能有效地阻止诈骗行为。另外,针对欺诈分子的秒杀、恶意登录攻击等行为,平台也无法忍受反欺诈系统的任何延迟。
反欺诈系统处理的稳定性也是影响系统能否有效识别欺诈行为的一大因素。由于欺诈行为并没有固定的发生时间,在一天24小时当中都有可能发生,因此反欺诈平台必须全天候待命。 
反欺诈系统处理的稳定主要体现在以下几个方面:
•能够全天候的处于有效监控状态,随时能够识别欺诈行为和判断欺诈风险;
•能够持续性的运行,系统的升级维护不会影响反欺诈功能的实现;
•系统有一定的外部风险抵御能力,例如要建立起系统数据库异地容灾机制。

四、反欺诈模型  

在反欺诈领域,随机森林算法模型是另一种常用的机器学习模型。随机森林提供了最佳的精度,紧随其后的是神经网络和另外一种集成方法AdaBoost。相比于其他算法,随机森林针对我们碰到的各类欺诈数据有许多的优势:

•基于集成方法的树可以同时很好地处理非线性和非单调性,这在欺诈信号中相当普遍。
•随机森林需要最小的特征预备和特征转换,它不需要神经网络和逻辑回归要求的标准化输入变量,也不需要聚类和风险评级转换为非单调变量。
•随机森林相比其他算法拥有最好的开箱即用的性能。
•随机森林与其他算法相比具有更好的过拟合(overfitting)容错性,并且处理大量的变量也不会有太多的过拟合,因为过拟合可以通过更多的决策树来削弱。


十年职场生涯,这个长期混迹在风控界和科技界,摸爬滚打的大叔,曾经就职于全国最大的固网运营商平台、国内最大的ERP软件公司和一家老牌的互金公司,如果你想了解他,欢迎关注 “番茄风控大数据”一起学习一起聊!

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值