商业数据分析入门
1.1 什么是数据分析
数据分析:根据业务问题,对数据进行收集、清洗、处理和建模的过程,用于识别有助于业务的信息,获取关键业务结论并辅助决策制定。
这个定义是从两个层面来解释数据分析:
- 它具体是在做什么?
- 它能产生什么样的价值?
“全流程”的数据项目流程:业务问题的界定 → 数据收集与清晰 → 分析与模型
数据分析的价值最终体现在业务上
数据分析工作的作用:为企业盈利,为企业的生存与发展建立基础。
数据分析是怎么提高企业盈利的?
传统的零售企业中,
盈利 = 销售所产生的收入 - 外部市场和内部经营所产生的成本和损失
销售所产生的收入(提高收入):
- 更低成本获取顾客
- 提高现有顾客购买金额
- 让购买中低端产品的顾客购买更高价、利润更高的产品
外部市场和内部经营所产生的成本和损失(成本和风险控制):
- 帮助企业预测市场走向
- 减少产品滞销和畅销产品断货的几率
- 优化内部经营的效率
案例:互联网企业 ——领英
他们的商业模式意味着用户的数量和活跃度是获取融资直到实现盈利前的生存基础
**关注的数据:**注册数量、每日活跃用户数、客户留存比率
数据分析:
- 帮助企业提升用户从注册到活跃的比例
- 辅助降低用户流失的数量,保证客户的数量和粘度
领英对用户数据深度挖掘,推出了“你也可能认识的人”的功能,强化了用户的关系粘度,实现了用户网络的爆炸式增长。
数据分析的重要性
数据增长,用户创造了大量的数据。
在许多新兴技术支持上,上网浏览的许多细节都会被记录下来。比如点击、滚动、悬浮、视频播放的暂停、快进等。
信息本身可能占用的空间不大,但由于用户基数众多,也形成了巨大的数据量
市场环境,数据的存储与计算能力不断提升,使我们可以服务千万个用户
硬件软件各方面成本的下降 → 企业可以存储更大更丰富的数据
持续迭代优化的算法模型 → 计算能力可以逐渐满足实时的计算需求
在大数据环境下,基于分析所进行的各种场景优化,都可以进行数据采纳和验证,使数据分析的价值可以量化
以前在营销领域有句名言:“我知道自己50%的广告费是浪费了,但是我不知道是哪个50%”,而在如今丰富的数据源和强大的计算能力下,我们可以明确的知道那浪费50%的广告费的是哪些媒介与渠道。
数据分析的人才需求
数据分析人员的两个重要能力要求:
- 与人沟通协作的能力:与非技术人员明确业务问题,将数据分析结果沟通给其他成员
- 与机器工作的能力:向机器提供数据,模型与算法,并分析机器所给出的结论
覆盖以下几个领域:
- 从关系型数据库中查询,收集和整理数据的能力 ---- SQL语言
- 对数据进行清洗,整理,分析和模型的能力 ---- Python
- 对数据探索和分析结果进行可视化展示的能力 ---- Tableau和Excel
1.2 数据分析工作流程
1. 定义问题:
- 定义所需分析的业务问题,确定相对应的数据分析计划和交付物
- 三个常见的业务问题类型:what、why和how
- 和业务方一起用数据驱动问题,将原本简单是what需求背后的why和how问题挖出来,是界定问题工作的重点
2. 数据收集与评估
- 根据问题确定所需的内部和外部数据源,汇总成分析数据集,