第一章 欢迎来到R语言之数据可视化
目录
1-1 数据简介
课程内容包括:
- 数据科学家需要具备的知识和技能
- 了解数据的特征
- 数据可视化:R的绘图系统
- 制作并发布报告
1-2 数据科学家需要具备的知识和技能
数据科学家的分类:
不同数据科学家掌握技能分类统计:
相关技能解释:
1-3 完整的数据分析流程
假设驱动(Hypothesis Driven) vs. 数据驱动(Data Driven)
在数据分析的过程中,弄清楚需要研究的问题和意义,并不是很容易的。
第一部分:
- 定义研究问题
- 定义理想的数据集
- 确定能够获取什么数据
- 获取数据
- 清理数据
第二部分:
- 探索性分析(数据可视化)
- 统计分析/建模(机器学习)等
第三部分:
- 解释/交流结果(数据可视化)
- 挑战结果(有没有其他可能?)
- 书写报告(Reproducidle原则)