目录
从刷单谈起
一年两度的618和双十一,是电商和剁手党在仲夏和金秋的两场盛宴,也是刷单党的两场狂欢。竞争与压力之下,刷单成为了新入商户和低信用商户在官方选择之外速度最快的店铺成长方式。它们按订单价格及数量向“刷单军团”支付刷单佣金来提升虚假销量和好评,从而获取更好的信誉度和搜索排名。对于时间充裕的社会群体如学生党和宝妈而言,刷单也正好可以成为其动动手指就能月入千元的低风险副业。可以说电商的发展,滋生并带火了一个由出资店铺、刷单中介、各级代理、刷手、空包物流组成的刷单产业。但其繁荣的背后,本质仍是恶意炒作信用和获取利益的不正当竞争行为,这一方面侵害了其他商家的交易公平,导致了“刷单找死”,不刷单等死’的劣币驱良币行业现状,另一方面也会误导消费者对商品和店铺的选择。为了行业的长远发展,电商平台反刷单欺诈,势在必行。
对于刷单欺诈,平台可以从订单、商品、店铺、用户、设备、物流等多个维度进行分析识别。但此类分析的弊端在于随着欺诈手段的不断变化,如刷单行业从机刷向人刷的升级、浏览下单方式的改变,都会导致已有的经验指标和模型特征的失效。这使电商平台在反欺诈的对抗过程中,总存在滞后风险。如果我们以一个更高的维度抛开细节来看问题,或许可以得到一个更好、更稳定的解决答案。刷单场景里,变的是欺诈手段和交易细节,不变的是交易结果。众多的刷手和出资店铺在一段时间内的交易关系形成了一张网络,这是电商平台在整体交易网络中的一个子网。如果我们可以有效的把欺诈子网从整体网络中识别出来,问题就得到了定位和解决。
![](https://img-blog.csdnimg.cn/20200810150623169.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl8zODIxMjg4Ng==,size_16,color_FFFFFF,t_70#pic_center)
二部图下的欺诈
两类结点组成的欺诈场景还可以举出很多例子,如电商场景下用户对商户的薅羊毛、刷好评,如社交场景下水军账号的虚假关注、转发,又如消金场景下用户与商户勾结对平台的消费贷套现欺诈。这些行为都会使两类结点之间出现异常的连接分布,从整体网络看来其呈现出了一张致密的双边连接子图,且该子图内的结点与图外结点联系相对较少。我们把这种大量的、同步的非正常关联行为模式称之为Lockstep,即在本不应出现聚集行为的二部图自然关系网络中,出现了双边聚集性行为。
只要能把欺诈行为总结成一种模式,自然可以将其分离出来。但是欺诈者往往会对自己做出某种伪装以使自己看起来有向好的一面,意图绕过风控系统。如在刷单欺诈场景下,为了尽量贴近真实用户的购买习惯,刷单平台会对刷手提出一系列要求,比如要求货比三家、要求最低浏览时长、要求滚动浏览高度及停留时间、要求对于正常热销商品做一定购买等,这些行为都会导致风控经验指标和模型特征的部分失效。在二部图交易网络中,对于正常热销商品的购买体现为刷手为自己增加了一些优异的边连接,使自己看起来更像一个正常的消费者结点。我们需要一种能从这种复杂关系网络中对抗伪装、抽丝剥茧的提取出异常致密子图的算法。接下来对症下药引入Fraudar。Fraudar算法来源于2016年的KDD会议,并获得了当年的最佳论文奖。