本章要点
- Python中数据可视化的一般步骤
- 导入numpy,pandas,matplotlib:其中numpy提供承载数据的底层数据结构,pandas负责处理数据,matplotlib负责最后的可视化输出。
- 利用pandas中的函数,完成对数据的处理。
- 利用matplotlib中的函数,根据需求输出图表。
- 数据可视化的意义
- 让数据变得直观易懂。
- 合适的数据可视化能帮助发现数据的模式或是趋势。
个人思考
- 常见的可视化图案:
- 条形图:比较不同类别的数值大小。
- 折线图:展示数值变化的趋势。
- 饼图:展示各部分的比例关系。
- 散点图:展示两个变量的相互关系。
- 直方图:展示数据分布频率。
- 热力图:矩阵数据可视化。
- 雷达图:多维评价比较。
- ……
- 数据可视化的一些指导思想
- 目标明确:明确需要传达的信息,和传播需要达成的目标。从而选择正确的图案。
- 理解受众:根据受众的知识背景和对数据的熟悉程度,有针对性的调整图案的复杂程度和强调重点。
- 清晰明确:避免过度的装饰和无用的信息。
- 色彩与图形:通过必要的色彩,形状与大小差异来引导受众的注意力。
- 提供上下文:标题,注释,图例等应该提供足够的上下文信息帮助受众理解图案。
- 后续的尝试
- 可以通过iPythonNotebook做一些简单的可互动图案,利用可交互性增进受众的体验。同时通过互动的数据探索,也能帮助受众发掘更多的信息。