1.1 数据分析是什么
- 数据分析是指利用合适的工具在统计学理论的支撑下,对数据进行一定程度的预处理,然后结合具体业务分析数据,帮助相关业务部门监控、定位、分析、解决问题,从而帮助企业高效决策,提高经营效率,发现业务机会点,让企业获得持续竞争的优势。
1.2 为什么要做数据分析
1.2.1 现状分析
- 第一,告诉你现阶段的整体运营情况,通过各个关键指标的表现情况来衡量企业的运营状况,掌握企业目前的发展趋势。
- 第二,告诉你企业各项业务的构成,通常公司的业务并不是单一的,而是由很多分支业务构成的,通过现状分析可以让你了解企业各项分支业务的发展及变动情况,对企业运营状况有更深入的了解。
1.2.2 原因分析
1.2.3 预测分析
1.3 数据分析究竟在分析什么
1.3.1 总体概览指标
- 总体概览指标又称统计绝对数,是反映某一数据指标的整体规模大小,总量多少的指标。
- 经常关注的总体概览指标称为关键性指标
1.3.2 对比性指标
- 同比是指相邻时间段内某一共同时间点上指标的对比,环比就是相邻时间段内指标的对比;
1.3.3 集中趋势指标
- 集中趋势指标是用来反映某一现象在一定时间段内所达到的一般水平,通常用平均指标来表示。平均指标分为数值平均和位置平均。
- 数值平均是统计数列中所有数值平均的结果,有普通平均数和加权平均数两种
- 位置平均是基于某个特殊位置上的数或者普遍出现的数,即用出现次数最多的数值来作为这一系列数值的整体一般水平。基于位置的指标最常用的就是中位数,基于出现次数最多的指标就是众数。
1.3.4 离散程度指标
- 离散程度指标是用来表示总体分布的离散(波动)情况的指标,如果这个指标较大,则说明数据波动比较大,反之则说明数据相对比较稳定。
1.3.5 相关性指标
- 相关系数r的范围为[-1,1]。
- r的绝对值越大,表示相关性越强。
- r的正负代表相关性的方向,正代表正相关,负代表负相关。
1.3.6 相关关系与因果关系
1.4 数据分析的常规流程
1.4.1 熟悉工具
1.4.2 明确目的
1.4.3 获取数据
1.4.4 熟悉数据
1.4.5 处理数据
● 异常数据。● 重复数据。● 缺失数据。● 测试数据。