挖掘分析春节用户消费特征

前沿:因为公司的需求,需要分析在春节下单和不下单的老客户的消费情况,然后找出这两类用户的最大不同特征,然后根据这些特征,做一些活动藩篱,简单说就是挖掘出来的这些特征,做出来的活动,可以刺激那些不下单的老客户在春节消费,而这些优惠活动又不会引起其他客户的不满或反感。

数据处理:筛选2017年的订单数据,去掉在17年和18年春节下单的订单,然后分别统计这两类用户的消费状况,注意去掉噪点数据。

解决方案:

1.统计的方法:简单的统计这些用户的消费数据,例如:消费频率,总金额,节假日订单数量,500元以上的订单数量,最近的一次消费之类的一些特征,统计出来后,用pychart进行可视化,可以大致找出这些用户在一些特征的差异值,也可以通过计算统一特征条件情况下,在两类用户的占比分别为多少,查看之间的差值。比如,春节不下单的老客户的平均订单均价明显会低于在春节下单的老用户,其实用户还是很真实的,就是价格高低的问题。。。

可以通过这些差异最大的特征(或者特征组合,多条件)在2018年的消费用户订单里进行筛选,筛选出那些可能在2019年春节犹豫不决下单的老用户,针对这些用户单独做一个春节活动,刺激他们消费。

我能想到的一个活动就是抽奖活动,这个最实在的,不会引起其他用户的排斥,推送给用户,以达到目的。

2.使用分类模型:使用一个二分类模型进行去筛选,我在这里使用的是lightgbm(非线形,boosting),其实可以尝试使用下autosklearn框架的,将第一步统计出来的用户特征列作为基础数据,然后经过,查看数据分布,去躁,数据平衡,编码(高基数特征可以尝试用下二进制编码,平均编码需要y值,不推荐使用),调参,验证,反复执行这几个过程,使准确率最大,将模型保存在本地。

然后可以通过plot_importance画出特征重要性图,查看分裂这两类用户的重要性特征有哪些。可以将这些特征与第一步得出的结果进行比较查看,核实情况。

最后,同样的,将用户18年消费数据筛选统计出来,然后用训练好的模型去做一个二分类。筛选出来的结果是春节下单,和春节不下单的两类用户,春节下单的用户可以不需要处理,而对于分类出来的春节不下单用户(比较多,需要做一步筛选),将之前得到的特征条件作为判断条件做进一步筛选,所需要的用户名单就出来了。

3.改进版:因为活动的名额原因,需要在春节不下单的老用户作进一步筛选,目的变成:在2018年的消费数据里找出那些会在2019年春节下过订单但是又取消的用户。

二分类变成多分类(三分类),春节下单用户,春节下单又取消的用户,春节不下单的用户。对这三类用户进行建模,分类(注意数据不平衡的问题),然后在18年的消费数据进行分类。所得到的用户名单就是所需要的了。

总结:可视化很重要,推荐pychart,或者有时间可以去看看谷歌开源的Facets,机器学习数据集可视化工具。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值