什么是数据分析?
数据分析是基于商业目的,有目的的进行收集、整理、加工和分析数据,提炼有价值信息的一个过程,这些信息正成为很多企业业务增长、迭代更新的关键。
数据分析是让数据变成生产力的一部分,是从海量的数据中窥视背后的业务逻辑,寻找出新的业务增长目标,或者及时发现业务潜在的问题。
数据分析是服务于业务需求的,脱离了业务需求的数据分析就是在“打黑工”。
为什么需要数据分析?
数据分析有助于我们理解数据,否则数据将仍然是一堆没有价值的信息或数字。因为分析有助于人类做出决策,所以对数据的分析是必不可少的。因此,进行分析以产生决策的最佳结果是该过程的重要组成部分,恰当地呈现结果也是如此。 它是由数据分析师执行的一项内部组织职能,不仅仅是向管理层提供数字和信息,它需要更深入的方法来记录、分析和剖析数据,并以易于理解的格式呈现结果。通过数据分析,我们能够为公司提供以下关键领域的决策洞察力:
- 预测客户趋势和行为
- 以有意义的方式分析、解释和交付数据
- 提高企业生产力
- 推动决策者有效的决策
如何进行数据分析?
1 数据分析流程
数据分析流程是一个思维框架,主要帮助和指导我们如何去做数据分析。整个分析流程分为六个部分:
- 业务理解(business understanding)
- 数据理解(data understanding)
- 数据准备(data preparation)
- 建立模型(modeling)
- 评估模型(evaluation)
- 模型部署(deployment)
1.1 业务理解
业务理解核心是理解业务的背景,并评估分析需求是否可落地为数据分析项目。
1.2 数据理解
- 数据收集:识别的收集相关数据,收集的数据必须能够正确反映业务需求,否则分析结论会对业务造成误解
- 数据清洗:原始数据中存在数据缺失和脏数据,如果不处理会导致模型失效&