读书笔记
总的来说,这本书适合纯入门看。每一章都假设了一个大的问题,从而引出一章的主要内容。
前面几章主要是对数据分析工作的总体思路进行了介绍,中间几章提出分析所用到的主要统计学方法,最后是一些R、EXCEL等工具介绍。
下面简单叙述下各章的主要内容:
- 数据分析的基本思路:提出问题——分解问题/数据——参与评估/提出假设——给出建议/决策支持
- 对于决策要进行检验:A/B测试、历史/同期控制法,要关注是否存在隐藏影响因素,要考虑充分
- 最优化问题:和检验一样,影响因素要考虑充分,确定可控因素、不可控因素、约束条件以及目标函数
- 数据图形化:主要介绍了散点图
- 假设检验:提出以证伪来进行假设检验,强调即使无法作出最优决策也要给出优先级,建议学习统计学
- 简单介绍条件概率和贝叶斯定理
- 主观概率:要量化主观概率,并且外部条件变化引起主观概率变化时,使用贝叶斯定理,可以避免概率修正过度
- 启发法:分析模型过于复杂时,可进行定性分析或转换目标指标进行分析
- 直方图:介绍R
- 预测:只简单介绍了线性回归
- 误差:将线性回归分段,可一定程度上减小回归的机会误差
- 数据库
- 整理数据