深入浅出数据分析读书笔记
一、数据分析引言
1、数据分析的基本流程:确定——分解——评估——决策。一个完整的分析项目可能经过多轮流程
-
确定:客户的论点和数据
-
分解:将手头的资料汇总为有用的格式
-
评估:比较汇总表中的各个因素,得出结论
-
决策:根据结论,提出辅助业务的建议或策略
2、数据分析师兼顾解决问题与建议决策的职责。业务问题等同于机会,向客户指出如何发现机会的数据分析师能让客户赢得竞争优势。
3、心智模型:你对外界的假设和你确信的观点,帮助你理解现实世界,而统计模型取决于心智模型。
4、优秀的数据分析的根本在于密切关注需要了解的数据。
5、基于正确的假设建立模型,对于分析结论的重要性。
二、实验——理论检验
1、比较法:统计与分析最基本的原理之一就是比较法,它指出,数据只有通过相互比较才会有意义。
- 比较越多,分析结果越正确。比较是破解观察数据的法宝。
2、实验研究法:设置控制组(对照组)与实验组,以控制组为基准,要检验的变量为两组对象的唯一变量。(可借助随机函数分组)
控制组(control group):一组体现现状的处理对象,未经过任何新的处理。
- 历史控制法(同比):使用过去的数据,并将这些数据作为控制数据
- 同期控制法:控制组与实验组在同样的时期内经历同样的事
3、观察研究法:被研究的人自行决定自己属于那个群体的一种研究方法。
- 局限性:观察分析法充满混杂因素
- 一个好的观察分析法项目,必须彻头彻尾地查找过混杂因素,并且分析结论有实际意义。
4、混杂因素:就是研究对象的个人差异,这种差异不是试图进行比较的因素,最终会导致分析结果的敏感度变差。
混杂因素分组:拆分数据块,管理混杂因素:为了控制观察研究混杂因素,将数据拆分为更小的数据块,让各小数据块内的数据具有同质性。即让小数据块不包含那些有可能扭曲分析结果及让你产生错误想法的内部偏差。
5、宏观因素:经济、政策
微观因素:价格敏感度
6、反向思考经验法则:当你开始怀疑因果关系的走向时(如价值感的下降导致销量下降),请进行反方向思考(如销量下降导致价值感下降),看看结果如何。
7、随机抽样&#x