![9c127916025fa95b8cbc9db20f5f13fa.png](https://img-blog.csdnimg.cn/img_convert/9c127916025fa95b8cbc9db20f5f13fa.png)
数据来源:游戏玩家付费金额预测大赛-竞赛信息-DC竞赛
《野蛮时代》(Brutal Age)是一款SLG类型手机游戏,通过分析玩家在游戏内前7日的行为数据,能够准确了解每个玩家的价值,对游戏的广告投放策略和高效的运营活动(如精准的促销活动和礼包推荐)具有重要意义,有助于给玩家带来更个性化的体验。
以下是这一数据集的具体分析内容。
一、提出问题
1.游戏业务主要分析指标:
DNU(Daily New Users): 每日游戏中的新登入用户数量。
AU(Active Users):活跃用户,统计周期内,登录过游戏的用户数。
PU ( Paying User):付费用户
APA(Active Payment Account):活跃付费用户数
ARPU(Average Revenue Per User) :平均每用户收入,即可通过 总收入/AU 计算得出。
ARPPU (Average Revenue Per Paying User): 平均每付费用户收入,可通过 总收入/APA 计算得出。
PUR(Pay User Rate):付费比率,可通过 APA/AU 计算得出。
2.分析目标
![f5699dea05bd45aed0250d9fa1e5c21c.png](https://img-blog.csdnimg.cn/img_convert/f5699dea05bd45aed0250d9fa1e5c21c.png)
二、了解数据
1.数据字段理解
总共110列,828935条记录,每行数据代表一位用户的各项数据指标。
![23889a9229aceba690648bc483328ae2.png](https://img-blog.csdnimg.cn/img_convert/23889a9229aceba690648bc483328ae2.png)
![5218d5e31b195bd382c94f7f79e3a9b6.png](https://img-blog.csdnimg.cn/img_convert/5218d5e31b195bd382c94f7f79e3a9b6.png)
![057ec63bfe57c677077b848bd0bc8e64.png](https://img-blog.csdnimg.cn/img_convert/057ec63bfe57c677077b848bd0bc8e64.png)
![6d4fe8eff975f00391bd5c3668cd66b6.png](https://img-blog.csdnimg.cn/img_convert/6d4fe8eff975f00391bd5c3668cd66b6.png)
2.字段分类
![aa93dc0137d1fe3a996068125e2b474e.png](https://img-blog.csdnimg.cn/img_convert/aa93dc0137d1fe3a996068125e2b474e.png)
3.将数据Excel表格tap_fun_test导入Navicat中
-导入教程参考此处 猴子:Excel数据导入Mysql常见问题汇总
-导入过程中遇到的问题
![0352ac0bb2c4b7ed1b53c593c2e9b197.png](https://img-blog.csdnimg.cn/img_convert/0352ac0bb2c4b7ed1b53c593c2e9b197.png)
![7fc56573077c9767f12dc8eb098e9be5.png](https://img-blog.csdnimg.cn/img_convert/7fc56573077c9767f12dc8eb098e9be5.png)
原本以为这个问题是需要把varchar类型改为text类型,但尝试之后还是没能成功导入。其实我这里出现问题的根本原因是表格有108列,导入时,自动将每一列的数据类型都设置成了varchar(255),而varchar每列最大存储65535个字节,再加上是utf8编码,那个一个字符占3个字节,再加上2个字节的长度存储,即实际一行最大是(255*3+2)*108个字节,严重超过了65535储存范围。于是将255全部改为50,就能导入了。
4.导入后,检查时发现字段数据类型都是Varchar,为了方便接下来的数据计算,将部分字段的字符串类型修改成合适的数值类型
![0c8de0a2c1508882a7545a48691dae88.png](https://img-blog.csdnimg.cn/img_convert/0c8de0a2c1508882a7545a48691dae88.png)
三、数据分析
1.新增用户分析
-关键指标
总新增用户、总新增付费用户、付费用户占比、每日新增用户、每日新增付费用户、每日新增付费用户占比
-14日总新增用户
![7a9137dce751d3c3c8354aa7db7a9b74.png](https://img-blog.csdnimg.cn/img_convert/7a9137dce751d3c3c8354aa7db7a9b74.png)
![3037be647426eae2b1bf7bf6bca8f703.png](https://img-blog.csdnimg.cn/img_convert/3037be647426eae2b1bf7bf6bca8f703.png)
-14日总新增付费用户