一、数据分析思维
- 业务知识和思考方式一样重要,脱离实际的方案并不可行
(1)思维结构化的方法
将思维结构化有以下方法:
- 象限法
- 多维法
- 假设法
- 指数法
- 二八法
- 对比法
- 漏斗法
(2)建立指标
建立指标要尽量贴合以下几点:
1、核心指标;
2、好的指标应该是比率;
3、好的指标应该能带来显著效果;
4、好的指标不应该虚荣;
5、好的指标不应该复杂;
例如;RFM模型
R - 最近一次消费时间
M - 总消费金额
F - 消费频次
(3)如何建立业务分析框架
- 从指标的角度出发
- 从业务的角度出发
- 从流程的角度出发
(4)如何应对各类业务场景
1、多练习
2、熟悉业务
3、应用三种核心思维
4、归纳和整理出指标
5、画出框架
6、检查、应用。修正
7、应用和迭代
二、Excel
(1)函数
1、文本清洗函数:FIND,LEFT,RIGHT,MID,CONCATENATE,REPLACE,SUBSTITUTE,TEXT,TRIM,LEN等。
2、关联匹配函数:VLOOKUP,INDEX,MATCH,ROW,COLUMN,OFFSET,HYPERINK等。
3、逻辑运算函数:TURE,FALSE,IF,ISERROR等。
4、计算统计函数:SUMPRODUCT,COUNT,RANK,RANDBETWEEN,AVERAGE,MAX,MIN,QVARTILE,STDEV,SUBTOTAL,INT,ROVNO等。
5、时间序列函数:YEAR,DAY,WEEKNVM,TODAY,MONTH,WEEKDAY,NOW,DATE等。
(2)Excel小技巧
- 常见技巧:
1.ctrl+方向键(光标快速移动)
2.ctrl+shift+方向键(快速框选)
3.ctrl+空格键(选定整列)
4.shift+空格键(选定整行)
5.ctrl+A(选择整张表)
6.alt+enter(换行) - 小技巧
1.分列ABC:分列“B”,可以得出“A”“C”
2.归一化:(int - min)/(max - min)
3.快速删除:选择性粘贴——数值——替换——空格
三、Excel数据可视化
- 数据可视化的目的是让数据更高效
让读者更高效阅读,而不单是自己使用
突出数据背后的规律
突出重要因素
最后是美观
(1)图表的基础概念
-
① 散点图:数据之间的规律
维度:0+ (作为颜色)
度量:2 -
② 气泡图:是散点图的变种,引入第三个度量作为气泡的大小
维度:1+ (作为颜色)
度量:3 (其中一个是气泡的大小) -
③ 单轴散点图:维度是Y轴,更倾向于洞察数据在不同类别下的数据规律
维度:1+ (Y轴)
度量:2 -
④ 折线图:经常用来观察数据随时间变化的趋势。折线图中的维度不宜过多,否则会非常混乱和复杂
维度:1+ (可对比)
度量:1+
时间维度:x轴 -
⑤ 面积图: 是折线图的变种。面积图更注重数据类别之间随着时间趋势的变化关系
维度:1
度量:2 -
⑥ 柱形图:柱形图是类别之间的关系
维度:2
度量:1+ -
⑦ 直方图:柱形图的统计型变种
维度:0
度量:1 -
⑧ 饼图:饼图可以理解为环状的柱形图。饼图的类别不宜过多。
维度:1
度量:1 -
⑨ 漏斗图:是对转化过程的直观展示。漏斗图的转化步骤不应该超过七个
维度:1
度量:1 -
⑩ 雷达图:适用于个体的数据和属性可视化,比较偏描述性数据,常见于CRM.用户画像
维度:1+
度量:1+
(2)高级图表
-
① 树形图:适合数据量较大的情况,尤其类别较多
维度:1+
度量:1 -
② 桑吉图:桑吉图是揭示数据复杂变化趋势的图表。面积图是线性维度而桑吉图可以一对多或者多对一
维度:2
度量:1 -
③ 热力图:数据在空间上的变化规律。譬如地理空间,网页浏览
维度:2
度量:1
(空间也不一定是纯粹空间,也可以是属性和维度的规律组合,比如星期表) -
④ 关系图:展现不同类别之间的数据关系,常见于各类社交社会媒体
维度:2
度量:0+ -
⑤ 箱线图:是统计用图表,用来研究和观察数据分布,也能对比数据分布
维度:1+
度量:1 -
⑥ 标靶图:也称为子弹图,是变种的条形图。常用于衡量业务销售完成情况
维度:1+
度量:2 -
⑦ 词云图:文本分析利器
维度:1
度量:0 -
⑧ 地理图:数据和空间之间的关系。地理图即可通过经纬度的数值度量绘制,也能通过省市的类别维度绘制
维度:1
度量:1
Excel图表的绘制 :
内容交给单元格
砍掉无用元素
注意搭配配色