module 1 可视化基础①
Part 1 基础概述
1.1 数据可视化
数据可视化,是关于数据视觉表现形式的科学技术研究。其中,这种数据的视觉表现形式被定义为,一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。
1.2 Python数据可视化
- Python 是一门富有表达力的语言,很适合用于数据分析。
- Python有很多数据可视化的package,主要分为探索性分析方向的(Matplotlib,Seaborn)和交互性信息可视化(Bokeh,Plotly),后者主要用于与业务结合过程中展现总体分析结果的。
- Python有很多非常优秀易用的数据可视化的库,作为入门在这里使用Python的matplotlib,事实上Python中很多可视化库都是基于matplotlib开发的,例如Seaborn等。
1.3 Matplotlib可视化
- Matplotlib是Python中最常用的可视化工具之一,可以非常方便地创建海量类型地2D图表和一些基本的3D图表,可根据数据集(DataFrame,Series)自行定义x,y轴,绘制图形(线形图,柱状图,直方图,密度图,散布图等等),能够解决大部分的需要。
- Matplotlib最早是为了可视化癫痫病人的脑皮层电图相关的信号而研发,因为在函数的设计上参考了MATLAB,所以叫做Matplotlib。
- 官方文档: https://matplotlib.org/
- Matplotlib中最基础的模块是pyplot。