第一节:数据分析简介
Part1:什么大数据?
1、大数据的定义与特征:
- 定义/概念:
4V模型(大量volume、速度velocity、多样variety、价值value)
- 五大特征:
活性、颗粒度、维度、时空、情绪
理解:我们在使用手机中的APP时,对不同的APP会有不同的使用频率,也就是活跃度不同,产生的数据活性也就不同;颗粒度,简单说是数据的细节程度,我们在对APP进行一系列的操作时,会产生相应的数据,这些都是有关联的,相关的数据越多越细化,颗粒度就越小,越能了解事物的全貌,反之即反之;维度,简单讲就是通常所说的时间维度、地区维度等,以一类属性来统计数据;时空,表示数据具有时间和空间特性;情绪,我们的任何行为都是带有一定的情绪的,包括语言、选择性点击等,通过分析行为数据来分析用户的情绪,进而判断是否适合某业务。
- 互联网行业的三大特征: 在线、实时、全貌
- 舍恩伯格的三大特征: 更多(全面)、更杂(多样)、更好(关系、价值)
2、大数据和传统数据的区别:
从大数据的概念上进行讨论,即从4V上分析。
3、大数据的理念:
社群思维、增强与变革、寻找机会
Part2:大数据分析师(BI)
1、什么是BI?
BI是Business Intelligence,即商业智能的缩写,这个概念是20年前出现在软件行业,当时将BI定义为由数据仓库、查询报表、数据分析、数据挖掘等部分组成,以帮助企业决策为目的的技术及应用。现在虽然单纯的数据分析师不适合成为BI,但大部分公司还是继续沿用这个概念。成立较早的互联网公司都有自己的BI团队、数据中心等数据团队。
2、为什么说BI对于公司很重要?
于其说BI很重要,不如说数据对一个公司越来越重要,有了数据,才能分析,进而才能更好的服务用户、开展业务,可以说数据就是资产。(我的拙见)
一旦需要无线的靠近客户之后,就要服务客户需求的一切,行业的边界在不断被打破数据成为资产:数据会变得越来越重要,是一切商业模式起源和重构的基础。(一篇博客摘录)
3、BI在互联网公司的种类
数据分析师是一个统称,不同的公司对于数据分析师的需求不一样,有主要负责产品、运营的数据分析师(business partner)、有负责集团管理层的分析师(类似军师)、也有行业研究的分析师(比如一些行业咨询公司)。
4、不同种类的BI在互联网公司的工作内容
-
支持产品团队:
- 产品迭代的效果分析
(迭代:产品迭代是指产品快速地适应不断变化的需求,不断推出新的版本满足或引领需求,永远快于对手一步。产品迭代是指产品快速地适应不断变化的需求,不断推出新的版本满足或引领需求,永远快于对手步。) - ABtest的实验设计与结果评估
(ABtest:简单来说就是为了同一个产品目标制定两个方案,ABTest充电) - 产品改版方案的策略输出
- 产品迭代的效果分析
-
支持运营团队:
- 活动经营的效果分析
- 用户运营的目标用户筛选
- 拉新、复购的策略输出
-
支持集团管理层:
- 公司整体的宏观情况分析
- 不同业务的横纵向对比分析(横向比较:指同类事物或在同一时期进行的对比分析;纵向比较:多指从历史的角度进行对比分析)
- 战略方向的策略输出
-
负责行业研究:
- 某个行业的大盘情况
- 竟对的供给、策略、产品等分析(竟对:竞争对手;供给:是厂商在一定时间、价格等条件下,对市场提供某种商品和服务的数量)
- 我们是否有新的机会和增长点
5、BI的必备技能
- SQL
- Excel、PPT
- Python数据分析
- 撰写分析报告
- 对业务的理解与思考
Part3:学习路线
- 基础技能(PPT、Excel)→作品保留起来
- SQL→leetcodeSQL刷题
- Python→数据可视化
- HQL(HQL是Hibernate Query Language即Hibernate查询语言)→学习
- 数据可视化→必备可视化技能的作品保存
- 统计分析方法与R→刷题
- 实战→中间的步骤、遇到的问题及解决方案等,即要多复盘几次。
Part4:推荐书单
- Excel技能:《绝了!Excel可以这样使用》、《高效商业分析:Excel建模与决策》
- PPT与设计:《用图表说话》、《写给大家看的设计书》
- 数据库:《SQL必知必会》、《数据库系统概念》
- 数据分析:《深入浅出数据分析》、《精益数据分析》、利用Python进行数据分析
- 分析方法论:《麦肯基方法》、《金字塔原理》
- 运营落地类:《增长黑客》、《运营之光》
- 谈判与演讲:《高效演讲》、《谈判力》
- 竞争与博弈:《竞争战略》、《策略思维》
- 管理类:《卓有成效的管理者》、《格鲁夫给经理人的第一课》
- 思维类:《学会提问》、《系统之美》
- 数学:《数学之美》