大数据识别“爱”的羊毛党,拒绝那些它“恨”的羊毛党

卒于“羊毛党”,P2P公司的一大死因

2014年6月,广州新成立一家互联网金融公司。为了吸引消费者购买自己的理财产品,这家公司发行了价值2个亿的各类优惠券。但仅仅不到半年的时间,公司便宣告倒闭。原来这些优惠券,全部都被一个“人”抢走了,确切的说,是一个5000人的“羊毛党”团队。


他们抢了优惠券后,全部用于购买期限在半年内兑换的理财产品,而金融公司在短期内没有足够的资金应对,最终导致破产。

在互联网金融行业中,类似这样被“羊毛党”伤害的例子还有很多。

羊毛党,起源于互联网金融的P2P平台,是指那些专门选择互联网渠道的优惠促销活动,以低成本甚至零成本换取物质上的实惠的人。拼抢这些促销活动的行为被称为“薅羊毛”。具体到互联网金融公司的业务,就是很多在手机App中抢红包、代金券的羊毛党对互联网金融有什么影响?有什么办法可以识别出他们么?

进阶的羊毛党,已开始规模化专业化

我们TalkingData团队根据羊毛党的不同特点将他们划分成了四个类型。

初级羊毛党多是一些“爱占小便宜”的散客,他们常常是零散进行薅羊毛活动。中级羊毛党常通过一些羊毛群获得相关资讯 ,积极参加薅羊毛活动,开始呈现出一种松散的组织形态。初级和中级羊毛党都属于第一代羊毛党,是“业余玩家”。

第三类是“专职羊毛党”,他们是工具化的“职业玩家”,属于第二代羊毛党。 一方面,他们会使用代理IP让反欺诈系统无法判断它的位置;另一方面,他们还使用大量的虚拟号自动注册。甚至有专门的收码平台帮你输入验证码,费用从每次1毛到2.5毛不等。

最高级的第四类是“团长羊毛党”,属于第三代羊毛党。他们是羊毛党中的“正规军”,有组织、有纪律,利用手中的羊毛联盟等资源进行刷单刷量,获取经济效益。 有一家团长羊毛党公司,凭借几千万个苹果账号刷单规模,他们可以决定每日App store中游戏的下载排名。一个月仅App刷量业务就可以达到两三个亿的流水,收入非常可观。

大数据”羊毛党,靠大数据识别

越过层层反欺诈手段、利用大量的id和帐号进行刷单……仔细一看,这些羊毛党也可以算是“大数据公司” 了。那么对付“大数据公司”,当然也要用大数据的手段。针对不同客户的需求,我们在实践中总结出了一套完整的“羊毛党反欺诈评分模型”。

我们从设备物理地址、App内部行为信息、交易信息、App竞品安装情况等四个维度大数据信息,构建了评分模型。这套模型主要用了图数据库(graph database)技术,它可以通过点和边把所有数据连在一起,便于发现数据中的关系。Neo4j是目前较优秀的一款图数据库开源软件,在处理关系型数据时效率很高。

如果想看一个设备上有多少个用户数。原始的数据库是很难看出规律的,但如果用关系型数据库做一些图谱计算和可视化处理,模型就好看多了。

上图中红点代表了一个手机设备,其他颜色的则代表了不同的元素。从图中可以清晰地看出,这一个手机设备通过多次刷机形成了19台虚拟设备,这19台设备注册了19个账号完成了19次薅羊毛行动的数据轨迹。这是通过设备物理地址来判断羊毛党的案例之一。

其次,App内的点击行为也可以是判断依据。由于羊毛党都是机器操作,它们在App中浏览优惠券并点击的时间间隔要远小于普通用户,而且往往一旦抢到红包就再也不登录了。通过这些特点我们可以找出一些疑似羊毛党。

此外,注册和交易时间间隔,单个用户参与活动频率,交易频次,提现频率、营销返现、刷订单等行为,都是羊毛党反欺诈评分模型的判断依据。通过这个模型,公司就可以将所有用户打分,找出不同类型的羊毛党。

让人“又爱又恨”的羊毛党

羊毛党虽然让很多互联网金融公司遭受了巨大损失,但是这些公司也并不想将羊毛党们“赶尽杀绝”。因为一定数量的羊毛党能够有效帮助那些处在成长期的互联网金融公司,为它们快速积累用户规模和交易规模,推动平台快速发展。这些数据的提升可以作为企业下一步找风投的融资筹码。

但这也是一枚硬币的正反面: 羊毛党如果太多,就会大大加大互联网金融公司的获客成本,使他们无法接触到自己的目标客户,甚至发生恶性挤兑,导致公司破产。

所以互联网金融公司对于羊毛党的感情是爱恨交织的:一方面要屏蔽掉那些“专职羊毛党”和“团长羊毛党”,另一方面又要吸引第一代羊毛党帮助提升流量和用户数。基于图数据库的“羊毛党反欺诈评分模型”能够帮助企业识别出它“爱”的羊毛党,拒绝那些它“恨”的羊毛党。

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
用户画像作为大数据的根基,它抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础,奠定了大数据时代的基石。 用户画像,即用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,抽象出一个用户的商业全貌作是企业应用大数据技术的基本方式。用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。 用户画像系统能很好地帮助企业分析用户的行为与消费习惯,可以预测商品的发展的趋势,提高产品质量,同时提高用户满意度。构建一个用户画像,包括数据源端数据收集、数据预处理、行为建模、构建用户画像。有些标签是可以直接获取到的,有些标签需要通过数据挖掘分析到!本套课程会带着你一步一步的实现用户画像案例,掌握了本套课程内容,可以让你感受到Flink+ClickHouse技术架构的强大和大数据应用的广泛性。 在这个数据爆发的时代,像大型电商的数据量达到百亿级别,我们往往无法对海量的明细数据做进一步层次的预聚合,大量的业务数据都是好几亿数据关联,并且我们需要聚合结果能在秒级返回。 包括我们的画像数据,也是有这方便的需求,那怎么才能达到秒级返回呢?ClickHouse正好满足我们的需求,它是非常的强大的。 本课程采用Flink+ClickHouse技术架构实现我们的画像系统,通过学习完本课程可以节省你摸索的时间,节省企业成本,提高企业开发效率。希望本课程对一些企业开发人员和对新技术栈有兴趣的伙伴有所帮助,如对我录制的教程内容有建议请及时交流。项目中采用到的算法包含Logistic Regression、Kmeans、TF-IDF等,Flink暂时支持的算法比较少,对于以上算法,本课程将带大家用Flink实现,并且结合真实场景,学完即用。系统包含所有终端的数据(移动端、PC端、小程序端),支持亿级数据量的分析和查询,并且是实时和近实时的对用户进行画像计算。本课程包含的画像指标包含:概况趋势,基础属性,行为特征,兴趣好,风险特征,消费特征,营销敏感度,用户标签信息,用户群里,商品关键字等几大指标模块,每个指标都会带大家实现。课程所涵盖的知识点包括:开发工具为:IDEA FlinkClickhouseHadoopHbaseKafkaCanalbinlogSpringBootSpringCloudHDFSVue.jsNode.jsElemntUIEcharts等等 课程亮点: 1.企业级实战、真实工业界产品 2.ClickHouse高性能列式存储数据库 3.提供原始日志数据进行效果检测 4.Flink join企业级实战演练 5.第四代计算引擎Flink+ClickHouse技术架构6.微服务架构技术SpringBoot+SpringCloud技术架构7.算法处理包含Logistic Regression、Kmeans、TF-IDF等8.数据库实时同步落地方案实操9.统计终端的数据(移动端、PC端、小程序端) 10.支撑亿级海量数据的用户画像平台11.实时和近实时的对用户进行画像计算12.后端+大数据技术栈+前端可视化13.提供技术落地指导支持 14.课程凝聚讲师多年实战经验,经验直接复制15.掌握全部内容能独立进行大数据用户平台的设计和实操企业一线架构师讲授,代码在老师的指导下企业可以复用,提供企业解决方案。  版权归作者所有,盗版将进行法律维权。 

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值