怎么做恶意刷单检测——数据分析面试刷题1

本文讲述了在数据分析面试中如何分析恶意刷单问题,包括从销量、评价、地区等多个角度进行频率分析,结合商家特征、用户行为特征、环境特征等建立机器学习模型,以及评论文本和图片相似度检测。同时总结了恶意刷单的识别要点,并分享了相关资源和案例。
摘要由CSDN通过智能技术生成

在这里插入图片描述

前言:

近日刷一波数据分析师面试题,学习别人的建议,总结和提升自己的思维。

01 自己思路

1.恶意刷单什么意思?是竞争对手恶意购买产品进行差评?
2.刷单:就是找人购买、评价、好评、晒图、差评;
3.选择因素:销量、好评、差评、地区;
4.把一整年的单量找出来,从每个月、每个星期开始,根据销量、好评、差评、地区做分段,查出的每个时间段的频率;
5.对频率进行分析,查看其密度值;
6.使用折线图,频率过高,差评量异常过高,就有可能是恶意刷单。

02 别人参考

分类问题用机器学习方法建模解决,我想到的特征有:
1)商家特征:商家历史销量、信用、产品类别、发货快递公司等;
2)用户行为特征:用户信用、下单量、转化率、下单路径、浏览店铺行为、支付账号;
3)环境特征(主要避免机器刷单):地区、ip、手机型号;
4)异常值检测:ip地址经常变动、经常清空cookie信息、账号近期交易成功率上升等;
5)评论文本检测:刷单的评论文本可能套路较为一致,计算与已标注评论文本的相似度作为特征;

  • 3
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值