游戏数据分析用到的模型(一)定义流失用户

本文主要参考了黎湘艳、叶洋的经典著作《游戏数据分析实战》。这本书堪称游戏数据分析的开山之作,这里向两位作者表示感谢。

关于用户留存和流失的模型

参考6.1.1节“合理定义流失用户”

这里是想回答“几天不登录算流失”这个问题。

三天不登录算不算流失,可以看一下三天不登录的用户有多少再次登录了,于是引出了定义:

流失用户回归率 = 回归用户数 ➗ 流失用户数

流失天数的选取,作者建议用“找拐点”的方法。例如在上图中,23天起明显平缓了,所以这个数据集中,判断流失的不登录天数就可以设为23天左右。

不过作者没有说明怎么找拐点,虽然这个例子可以用肉眼来找。我也不知道有没有特别炫酷的方法。不过可以尝试一下Max Kuhn的《应用预测建模》里介绍的“多元自适应回归样条”。

 R语言有一个earth包,实现了多元自适应回归样条

library(earth)

liushi <- earth(`回归率`~`流失天数`,data=game_liushi)
summary(liushi, digits = 2, style = "pmax")

 看起来,模型给我们选择第20天作为拐点。

 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
随着大数据时代的到来,大数据分析已经成为了各行各业必不可少的一部分。而大数据分析用到的工具也随着技术的发展而不断更新。下面我们来介绍一些常见的大数据分析工具。 1. Hadoop。Hadoop是由Apache基金会开发和维护的一套开源软件框架,它可以实现大规模数据的分布式存储和处理。Hadoop主要包括HDFS分布式文件系统和MapReduce计算框架,它们可以实现海量数据的存储和分析。 2. Spark。Spark是一款快速的分布式计算系统,它可以实现大规模数据的处理和分析。Spark支持多种编程语言和数据源,可以用于实时数据处理、机器学习和图像处理等领域。 3. Hive。Hive是一款基于Hadoop的数据仓库工具,它可以将结构化的数据映射到Hadoop的分布式文件系统中,并支持SQL语言进行查询和分析。Hive可以用于数据仓库的建立和数据分析。 4. Pig。Pig是一款基于Hadoop的数据分析平台,它使用Pig Latin语言进行数据处理和分析,支持多种数据源和数据类型。Pig可以用于数据清洗、数据转换和数据分析等领域。 5. R。R是一款开源的统计分析软件,它可以用于数据可视化、数据分析和机器学习等领域。R支持多种数据格式和数据源,拥有丰富的数据处理和分析函数库。 6. Python。Python是一款流行的编程语言,它可以用于数据处理和分析。Python拥有丰富的数据处理和分析库,如Numpy、Pandas和Scikit-Learn等,可以用于数据清洗、数据转换和数据分析等领域。 总之,大数据分析用到的工具随着技术的发展而不断更新,企业需要根据自身的需求选择合适的工具来实现数据的存储和分析。在未来,随着人工智能技术的不断发展,大数据分析工具也将不断创新和发展,带来更多的机会和挑战。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值