在上一篇文章中,我们提到了数据分析的价值,主要列举了7点,那么要实现这些数据驱动业务的工作流程是怎么样的,请看下图:
- 数据需求
数据需求可分为自发需求和外部需求,自发需求是分析师基于对游戏业务的理解和游戏当前状态梳理出的需要分析的业务,外部需求通常是运营、市场、制作人等相关人员提出的要从数据层面解决的问题。接到相关的需求后,分析师需要了解分析需求的目的,分析范围,分析时间。确定需要分析的内容。
- 数据收集
收集需求中所要用到的数据。对于游戏数据分析,根据数据来源可以分为两大块:
a)业内部数据:又可分为游戏行为数据和问卷调查数据,其中游戏行为数据主要来源于游戏数据库,问卷调查数据来源于问卷后台数据库,在条件允许的情况下,将这两类数据定期同步至数据仓库,提高数据收集的效率,数据同步工作主要由BI部门实现;
b)企业外部数据:当需要做用户画像、舆情监控、竞品、KOL分析时,需从新闻、论坛、贴吧、QQ群、视频、直播网站等渠道收集数据,可以通过爬虫工具爬取或者手工导出至本地。
- 数据处理
数据处理可以分为两步,第一步是对数据进行清洗过滤,确保数据的有效性和可用性;第二步是根据分析需求,对数据进行聚合关联合并等操作,让数据符合下一步分析或预测的需要。
在数据处理过程中常用的技术/工具包括SQL、Python、Excel、文本处理、R等,由于数据来源不一,格式各异,数据处理一般都是占用时间最多的步骤之一,如果在数据收集阶段,提前做好数据需求,和研发、BI等相关部门做好沟通,那么在数据处理阶段就能大大提高工作效率。
- 两个分支:数据分析/机器学习
数据分析:是通过适当的数据分析方法和工具,应用成熟的分析模型,对处理过的数据进行分析,提取出有价值的信息,形成有效结论的过程。数据分析的成果是一份分析报告。分析报告中,除了数字表达之外,可视化也是必不可少的。
机器学习:通过机器学习算法,实现对数据的分类、预测和聚类等操作。当然,建模后得出的结论也可以写成分析报告。
- 评估
不论是机器学习,还是数据分析,其结果都要进行评估。
对于机器学习而言,有专门模型评估方式,再通过可视化把结果表达出来,也是一种重要手段。
机器学习的可视化和分析报告最终由项目团队评估,以制作人为主。
评估下来其结论合理,数据可用,项目团队会将其作为进行运营、市场活动方案设计的决策参考依据之一。如果不可以用,则分析师需要重新梳理需求,按上图的过程重新走一遍。
当然了, 数据是否能对项目真正产生积极影响,取决于数据结论是否能击中业务痛点以及报告对象对数据的重视程度。比如:
- 游戏预热期的用户调研,能找到目标用户的特点,发行人员是否会参考分析报告结果确定时间、地点及宣传方式。
- 游戏封测期间的用户调研,能了解用户对游戏各项功能的体验评价及相关建议,在于研发人员是否采纳,是否以数据反哺研发;测算最优市场费用,能帮助项目合理分配资源,避免资源浪费。
- 市场投放效果分析,能监控广告投放效果数据并结合各媒体的特性,在于发行人员是否通过数据去发行问题,调配资源,使其效果最大化。
- 流失用户分析能找到用户流失点,在于研发人员是否根据数据来优化游戏。
- 付费习惯分析能找到付费用户的特点,在于运营人员是否根据数据制定相关的活动,从而吸引更多的人来付费。
总体而言,数据是否会产生积极影响不在于数据本身,而在使用数据的人。
如果数据分析师做的分析报告或模型没有经过评估,其数据结论或建议没有得到业务方的使用或帮助业务方决策,那么,其该工作只是做了数据分析的基本工作,并没有实现数据驱动业务。如下图所示。
各位数据分析师朋友,在你的工作当中,数据分析流程是什么样的呢?是不是很想知道我平时的工作是怎么驱动业务的,不要着急,我在建立公众号的时候已经做好了准备,请等我慢慢分享。