1.背景介绍
数据可视化(Data Visualization)是通过数据的视觉表现形式将复杂的数据信息转化为易于理解、分析的图形或图像的过程。广义上来说,数据可视化也包括数据处理及其结果的呈现,但通常指计算机屏幕上的可视化。由于人类的注意力往往集中在视觉上,数据可视化能够将数据转化成可以直观地看出的形式,提高数据分析的效率。而本文介绍的Python数据可视化主要基于Matplotlib、Seaborn、Plotly等第三方库实现。
数据可视化一般分为两类:一是静态数据可视化,如图表,一张图片就是一个静态的数据可视化;二是动态数据可视ization,即动画或交互式可视化。传统的数据可视化工具如Excel、Tableau、Power BI等提供静态的展示功能,但是对于具有时序性的、动态的数据,传统工具并不能很好地满足需求。因此,除了传统的静态数据可视化外,Python还提供了一些交互式的数据可视化库,例如plotly、dash等。
本文介绍的Python数据可视化库有:Matplotlib、Seaborn、Plotly。Matplotlib是一个著名的开源数据可视化库,其支持常用的数据可视化类型,如折线图、散点图、柱状图等,而且提供了简洁的接口和自定义样式。Seaborn是在Matplotlib的基础上进行了优化,使得其更加美观,Seaborn提供更加丰富的统计图表类型,