商业数据分析实战(酒卷隆志/里洋平)
第九章 案例7——决策树分析:具有哪些行为的用户会是长期用户
弄清长期参与社交游戏用户的行为特征
现在《黑猫拼图》游戏的运营状态良好,但是相比较其他应用,《黑猫拼图》的很多用户在开始游戏之后就离开了。为了改善这种情况,我们进行了探讨,希望通过数据分析弄清楚在开始游戏之后是什么样的行为会促使该用户今后也能持续来访,从而为改善现有的游戏策划方案提供参考,那么我们该怎么做呢?
9.1希望减少用户开始游戏后不久就离开的情况
和其他应用相比,用户开始游戏后不久就离开的情况较多。
9.2了解“乐趣”的结构
与其探究用户离开的原因,不如寻找用户继续访问的理由
了解“乐趣”的要素
- 战斗:对站其他用户
- 协作:和其他用户协作共同大白敌方首领
- 发送消息:向其他用户发送信息
量化“社交行为”
- 战斗次数很多的情况:喜欢在游戏中对战其他用户
- 协作次数很多的情况:喜欢在游戏中通过和其他用户协作几百敌方首领
- 发送消息次数很多的情况:喜欢在游戏中和其他用户交流
是否能将分析结果与游戏策划相结合
9.3把类作为自变量
讨论如何量化“稳定来访”
我们整理了一下前面谈到的事实和假设,并得到下面的处理流程
- 开始游戏后1周内用户的稳定来访量比较低 (事实)
- 根据初次访问游戏时用户行为的不同,其稳定来访率也不一样(战斗?协作?发送消息?)x(次数?时间段) (假设)
- 分析的结果是OO的行为模式比较容易促使用户稳定来访游戏 (假设)
- 为了使得用户养成OO的行为模式,需要实施XX (解决方案)
我们考虑了多种量化“稳定来访”的方法,例如在社交游戏中,“N日持续率”就是一种常用指标。
N日持续率=初次来访游戏N天后再次来访的用户数/初次来访游戏的用户数
这个指标适用于宏观倾向的把握而在本例中,我们需要的并非是整体的倾向,而是希望发觉和社交行为之间的关系,因此需要将每个用户稳定来访的情况进行量化。很显然,N日持续率无法计算每个用户的情况,因此这个指标不适合本例。
于是,我们考虑使用“登录密度”,通过这个指标可以计算每个用户的情况。
N日登陆密度=N日内用户到访的天数/N
从上述定义可以得知,N日登录密度的取值发范围在0和1之间,越接近1表示该用户越可能是稳定来访的用户,在分析中,我们将用户开始游戏后一周内(第0天~第6天)的行文作为自变量,而作为因变量的登录密度则由下一周(第7天~第13天)的数据得到。
找出决策树分析中影响最大的分类属性
考量实数、比率、主成分这3个分析属性
把类作为自变量来使用
7.4进行决策树分析
哪一个社交行为对登录密度的影响最大
研究每个协作主成分的倾向
7.5解决对策
使用户在开始游戏3天后自然性地发生协作行为
7.6小结
在本章中,我们利用决策树进行了数据分析。和那些利用数据分析解决问题的案例不同,本案例看不出存在什么问题。我们进行的是所谓探索型的数据分析。在这类数据分析中,为了验证各种假设,需要耗费相当的功夫来进行数据加工。另外,在验证假设的时候,由于处于一种问题较少的状态,相应的先做也比较少,因此一般会使用多次循环的方法,这就必然会用到决策树等数据分析的方法。
像这样由数据驱动(基于数据决定下一步所采取的对策)来推进的“业务改善”仍属于数据分析的范畴,而且这块业务实际上只能有数据分析来完成。
分析流程 | 第9章中数据分析的成本 |
现状和预期 | 低 |
发现问题 | 中 |
数据的收集和加工 | 高 |
数据分析 | 高 |
解决对策 | 低 |