学习之前
- 理论部分
- 统计学:统计学是数据分析的基石,而且统计分析可以解决日常大部分的分析需求。统计学这部分内容需要学习描述统计、假设检验、贝叶斯、概率、分布、抽样、线性回归、时间序列等。
- 数据分析方法论:这里要学习一些数据分析常用到分析方法。如趋势分析、对比分析法、多维分解法、用户细查、漏斗分析、留存分析、AB测试法、4P理论、PESTEL理论、SWOT分析、5W2H、逻辑树理论、用户使用行为理论、AARRR模型等。
- 工具部分
- Excel:它是最基础的数据分析工具。需要重点掌握:常用函数的使用、快捷键操作、基础图表制作、数据透视表、Vlookup等。
- SQL:它是数据分析的核心技能,SQL要重点学习Select,聚合函数、以及条件查询(Where、Group by、Order by等)
- PPT:用来和业务部门交流需求,展示分析结果。
- Python:主要学习Numpy、Scipy、Pandas、Matplotlib、Seaborn、Sklearn等内容。Python在处理数据时候运行速度非常快。
- 数据分析的大致6个步骤:
数据获取——数据预处理——数据探索(分析)——数据可视化——数据挖掘建模——评估
1. 数据获取
- 数据仓库
- 监测与抓取
- 填写