数据分析是一个从数据中通过分析手段发现业务价值的过程。这个过程的起点是获取一份数据,这个过程的终点是发现业务价值。过程可以大致为分数据获取——数据清洗——数据处理——数据建模——分析结果呈现——业务价值发现——业务价值实现这几个阶段。
- 数据:数据不是简单的数字,也就是说,你告诉我一串数字77 17 88 99而没有其他信息对于我来说没有任何意义,这几个数字仅仅是数字而已,而不是数据。数据除了数字本身之外,还必须包含数字的来源,度量方式,单位,代表的业务场景等等。其中,我认为业务场景最重要!
- 业务价值:不能服务于业务的数据分析是没有任何价值的,不能产生业务价值的数据分析也是无用的,因此,能否实现业务价值决定了这是否是一次成功的数据分析。而分析工作只是实现了这个过程的第一步,它通过分析师的视角将价值呈现于业务人员面前,分析的结果只有被业务人员理解,并最终通过业务人员的努力转化为业务实施
过程的详细说明
- 数据获取:这个阶段的输入需要一个分析目标,为什么需要一个目标?在一个大型企业中,可以获取的数据往往是海量,如果没有一个目标限制,那数据分析往往是无从着手的。理论上就只是定义出可用的数据范围,比如时间周期、维度、指标等。可是这个阶段的困难之处在于理解相关的数据源,因为数据源文档不完整或者变更的情况经常在业务中发生。数据清洗:通常包括异常数据的处理、缺失数据的处理、数据的一致性变换、编码的替换等
- 数据处理:对数据进行汇总,或者形式上的变换,以便可以适用于后期的建模
- 用统计分析或机器学习算法对数据建模,以便描述数据或对未来进行预测。其实大多数分析师在这个阶段只观测数据的同比、环比的趋势上的变化,亦或对指标在不同维度上进行拆分,以观察维度对指标变化的影响
- 通常认为,这个阶段的主要任务是把建模的结果以图、表或者更加复杂的可视化方式呈现出来,但是呈现结果不仅仅是这个阶段的目的,目的应该是让业务人员对分析结果有充分的理解,通常数据分析师会在分析结果中提出对业务的价值,但是这个价值只有被业务人员认可才有可能实现
- 业务价值实现:这个阶段虽然是有业务人员控制的,但是仍然需要分析师的深度参与。因为双方对于分析结果的理解和价值的发现经常出现偏差,需要在实践中逐步达到统一
**注:**在做分析之前,一定要有目标
过程不是单向的,在后一个阶段中发现问题时可以跳回到前一阶段
过程不是一次性,而是不断循环往复的。上一次分析过程的终点,可能是下一次分析过程的起点。我们经常会在业务价值发现和实现阶段发现新的分析主题,并把它作为下一次分析的起点。
对于任何一次分析来讲,不是每个阶段都是必需的
整个过程中的大多数时间都需要分析师和业务人员的密切合作