谁说菜鸟不会数据分析(工具篇)----- 学习笔记2(数据分析:excel:power pivot)

1、数据分析方法:

(1)呈现现状的描述性统计(power pivot :pp ),通过对比与细分进行现状及原因分析。可制作数据透视表,通过求和、求均值以及数据组成了解其构成,还可通过不同时间维度的对比,查找数据变化原因,最后制作相关图表对现状进行呈现及描述。

(2)展望未来的预测性分析,分析现有数据间的相关性,探寻数据之间存在的联系,并进一步建立相关回归模型(分析工具库)的方式对未来进行预测。

2、power pivot:整合多数据源、处理海量数据、操作界面简洁、实现信息共享

三个数据处理分析工具优劣势对比
工具优点缺点
Access数据库

数据处理能力较强

使用SQL处理数据较为灵活

适合SQL初学者学习SQL语句

数据超千万条时性能会下降

使用SQL分析数据不如透视表灵活

Miscrosoft适合SQL初学者学习SQL语句数据处理性能弱于Access
PowerPivot

可处理大型数据集

可用数据透视表灵活分析数据

数据处理灵活性低
用户购买行为分析框架(5W2H分析法 )
WHY用户购买目的是什么?-------- 市场调查获取数据
WHAT用户主要购买的产品?-------- 各产品销量分布
WHO用户有什么特征?------那女比例、年龄分布、地域分布、学历分布、收入分布、注册时间分布
WHEN

用户何时购买?---- 购买时间分布

多久再次购买?---- 购买间隔分布

WHERE用户购买渠道有哪些?---- 渠道销量分布
HOW用户购买支付方式?---- 购买支付方式分布
HOW MUCH

用户购买什么价位段的产品?---- 价格段分布

用户再次购买意愿如何?---- 用户购买频次分布

 

峰度系数:描述对称分布曲线峰顶尖峭程度的指标,相对正态分布而言

偏度系数:以正态分布为标准来描述数据对称性的指标。

偏度系数越接近于0,偏斜程度就越低。

峰度系数>0两侧极端数据较少,比正态分布更高更瘦,呈尖峭峰分布偏度系数=0分布对称
偏度系数<0(高峰左移)长尾在右,正偏态分布
 偏度系数>0(高峰右移)长尾在左,负偏态分布
峰度系数<0两侧极端数据较少,比正态分布更矮更胖,呈平阔峰分布|偏度系数|>1高度偏态分布
0.5<|偏度系数|<1

中等偏态分布

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值