【基础数据挖掘技术】探索性数据分析

1.描述性统计(探索性的数据分析)

不是所有项目都要用复杂的方法,描述性统计是偏简单的方法。

案例1:电信公司

客户是电信公司最大的资产,客户行为存在于交换机的通话记录

了解客户行为成为电信公司的趋势,

1.帮助电信公司找出有电话线路需求的客户让其承接多几条电话线路,就能给公司带来更大的商机

2.何时客户会需要额外的连接线路呢

我们拥有交换机的数据,将时间秒数转化为开始时间和结束时间,如何对时间进行排序,得到每个时间点的占线数,发现有时会出现满额占线的情况,就可能导致客户呼入时占线,损失商机。只要多加装两条线路就可以解决这个问题。

简单的问题用简单的方法解决。

案例2:

相信我们都有在商场购物的时候都有看见过满千送百,满五百抽好礼的优惠方案。

尤其是在周年庆或者节假日,这种间隔优惠方案就是最佳营销方案,消费者一旦听到差一点点金额就会有优惠时,很可能多买一点上去达到优惠。

客单价是营销届的一个指标,代表顾客一次来店消费总金额

通常业界会通过捆绑销售,互补品摆放(手电筒电池),来提高客单价,增加业绩,而上面说的500送豪礼,1000送百,这些优惠活动可以有效的提高客单价,一般销售人员会以500,1000,1500,倍数的直观方式吸引顾客购买更多,但是这真的是最佳的优惠方案吗?有可能这会平白损失大量的业绩

本数据是某衣服电商各顾客总消费金额资料,

我们计算每个消费者每次消费的客单价

一共有21598消费者记录,ID:顾客编号

Total_Spending字段代表对某位顾客的总消费进行汇总求和。

我们利用总消费金额为横轴,顾客人数为y轴,画直方图,从图可以看出来,所有顾客分布最多的是150—200之间的区间是最多人,大约4000多人

画出这个密度图,虚线代表定价策略

如果优化策略定在500,150~200元的顾客就会觉得要再花费一倍多的钱得到优惠,肯定不想当冤大头,如果已经购买了450元则很有可能额外购买。所以500元不是合适的优惠策略。

合适的定价策略应该是根据消费者的消费习惯(200,300,500)

我们可以看出这几个高峰是消费者的消费习惯购买

于是我们可以对着几个区隔金额进行平移来提升业绩。

于是我们就可以将300,500,800作为定价数据。

(python画图)

这样简单的描述性统计可以有效的对顾客进行分层,也可以用于区隔信用卡等物品的会员层级。同样,可以不使用折扣,改为赠品(按使用者需求改变,比如之前有一个酒店,他们的消费者是出差的人,钱是公司出的,他们就更愿意赠品和按摩之类的。)。

在增加业绩的同时也能增加消费者满意度。

统计数字:以之前的杂志数据为例

描述性统计(购买各种杂志的概率):可以看出最受欢迎的是house magazine ,(平均数),comic0.081

预测准确度。Naïve predictions基础标准,如果以准确率为标准,那么naïve predictions就是基础概率。

描述性统计:分五种杂志的平均值分布(客群区分):

和naïve prediction对比可以看出关系。

2.可视化计算(探索性的数据分析)

购买多种类杂志人群的分布

购买杂志的年龄分布。(挺均匀的,可以用来与各个不同杂志对比。)

购买汽车杂志的年龄分布(有点集中)

年龄对预测是否购买汽车杂志有帮助。

运动杂志的年龄分布(年龄对它影响不是很大。)

年龄与收入是否购买音乐杂志散点图(浅色点代表购买,黑色点代表不购买)

明显购买音乐的人偏向低收入低年龄。年龄和收入对音乐杂志的购买量预测应该有帮助

总结:简单的问题就可以通过探索性数据分析。描述性统计可以搭配可视化分析进行分析。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

晴天qt01

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值