一、理论
1、学术基础理论
(1)数学基础课:主要包括《初高中数学》 + 《微积分》 + 《线性代数》+《概率论与数理统计》,任意教材均可。当然不是里面所有的东西都会用上,不过学会这些才能形成最基础的数学体系,有助于后续学习中高级的统计学。
(2)初级统计学
[1] 推荐教材:贾俊平的《统计学》;
[2] 核心知识板块:描述统计学 + 推断统计学(区间估计、假设检验)+ 相关分析 + 回归分析 + 统计指数 + 时间序列分析。
(3)中高级统计学
[1] 多元统计分析:推荐教材为高惠璇的《应用多元统计分析》,主要掌握的知识板块为“多元统计基础 +回归分析 + 判别分析 + 聚类分析 + 主成分分析 + 因子分析”;
[2] 时间序列分析:推荐教材为王燕的《应用时间序列分析》,主要掌握的知识板块为“时间序列分析基础+ 平稳时间分析 + 非平稳时间序列分析 + 多元时间序列分析”;
2、数据分析师核心理论
(1)数据分析方法的理论学习
[1] 推荐资料:至少一本专门讲数据分析全过程的书籍(如《数据分析师养成宝典》) + 知乎、公众号等平台上关于数据分析方法的相关文章;
[2] 重点学习的内容:数据分析的全过程 + 数据分析的常用方法。
(2)数据挖掘技术的理论学习
[1] 推荐资料:至少一本专门讲数据挖掘全过程的书籍(如《数据挖掘技术与应用》)+ 知网上关于数据挖掘的相关论文 + CSDN上关于数据挖掘算法的理论性文章 + 知乎、公众号等平台上关于数据挖掘方法的相关文章;
[2] 重点学习的内容:数据挖掘的常用技术 + 数据挖掘的应用领域。
(3)数据分析工具的理论学习
[1] 推荐资料:至少一本结合工具与数据分析的书籍(如《R语言数据挖掘》、《SPSS数据分析教程》)+ CSDN上针对数据分析工具的相关技术性文章 + 知乎、公众号等平台上关于数据分析工具使用的相关文章;
[2] 重点学习的内容:数据分析工具的基础操作 + 如何使用这些工具开展实际数据分析。
(4)数据建模思想的理论学习
[1] 推荐资料:《统计学习方法(李航)》+《机器学习(周志华)》+《数学建模》相关书籍;
[2] 重点学习的内容:如何通过建立模型的方法对数据进行分析与挖掘,主要侧重点在于思想上,即看到某种类型的数据,能在脑子里想到如何去构建模型,采用何种方式去分析等。
(5)数据分析业务的理论学习
[1] 推荐资料:结合业务讲解的数据分析相关书籍(如《游戏数据分析实战》)+ CSDN、知乎、公众号等平台上结合具体业务例子讲解的数据分析文章;
[2] 重点学习的内容:业务知识 + 针对该业务如何开展数据分析。
(6)数据可视化的理论学习
[1] 推荐资料:结合具体可视化工具讲解的数据可视化相关书籍(如《ggplot2:数据分析与图形艺术》)+ CSDN、知乎、公众号等平台上关于数据可视化的相关文章;
[2] 重点学习的内容:数据可视化工具的基础操作 + 如何用该工具完成数据分析过程中的数据可视化任务。
(7)数据报告制作的理论学习
[1] 推荐资料:结合具体数据分析报告制作工具讲解的数据报告制作相关书籍 + 具体的数据报告(如《一带一路大数据报告》) + CSDN、知乎、公众号等平台上关于数据报告制作的相关文章;
[2] 重点学习的内容:数据报告的制作要点 + 如何制作一份满足要求的数据分析报告。
二、操作
1、至少一款分析型软件
(1)常用:R语言 / Python / SAS / SPSS / Excel / 大数据分析软件;
(2)基本要求:能用该分析型软件实现基本的数据分析任务(比如用R语言,就要知道数据如何导入、数据如何在R语言中整理和预处理、如何使用里面的代码对数据进行分析等)。
2、SQL语言 + 至少一款数据库软件
(1)常用数据库:MySQL / SQL Server / Oracle / 大数据库(如Hive);
(2)基本要求:能熟练运用SQL语句在这些数据库中查找想要的数据,也就是说,数据分析师对于SQL和数据库的运用,核心技能点在于查询数据。
3、至少一款数据分析报告制作工具
(1)常用工具:Office系列 / Tableau / Power BI / Markdown / Xmind / 大数据分析软件;
(2)基本要求:能够使用上述软件制作符合要求的数据分析报告。
三、实战
模拟实践 | 自行寻找数据 → 练习数据分析的全过程 → 在模拟实践中锻炼分析能力 |
参加实习 | 找到数据相关实习 → 参加实习 → 学会如何在真实场景中开展数据分析 |
经验总结 | 复盘数据分析的相关经历 → 将经历输出成经验总结 → 日积月累式提高 |
——————————————————★