1. 基础2D及3D可视化
- Matplotlib: 是一个最基础的Python可视化库,作图风格接近MATLAB,所以称为matplotlib。一般都是从matplotlib上手Python数据可视化,然后开始做纵向与横向拓展。
Seaborn:是一个基于matplotlib的高级可视化效果库,针对的点主要是数据挖掘和机器学习中的变量特征选取,seaborn可以用短小的代码去绘制描述更多维度数据的可视化效果图。
2.交互信息可视化
数据分析的一个业务场景就是用数据讲故事,交互信息可视化的工具就在此凸显出了优势。
- Bokeh: 是一个用于做浏览器端交互可视化的库,实现分析师与数据的交互。
Plotly: 同样也是做交互可视化的一把利器。Plotly同时支持Python和R语言,并且实现了在线导入数据做可视化并保存内容在云端server的功能。做演示的时候,只需要在本地的jupyter notebook与plotly server建立通信,即可调用已经做好的可视化内容做展示。Plotly同时有freemium和premium两种账户,免费账户已经可以满足基本需要。
此外,作为数据分析师,一个重要的工作场景就是为业务团队建立dashboard,plotly强大的交互功能得到了淋漓尽致的体现。
Pyecharts 是基于百度echarts的一个开源项目,相比bokeh和plotly,pyecharts的语法更简单,实现效果更佳出众。
3. 地图可视化
地理信息数据也会是部分数据分析师的业务场景。对于这类数据,可能传统的matplotlib/seaborn,交互属性的bokeh/plotly无法很好地对这类数据进行处理。我们需要使用处理地理数据引擎更强的可视化工具库。
简要总结:
基础的2D,3D可视化
主要包括了matplotlib和seaborn,其中seaborn又是基于matplotlib的高级可视化效果库。
matplotlib是最基础的可视化库
seaborn针对的点主要是数据挖掘和机器学习中的变量特征选取,seaborn可以用短小的代码去绘制描述更多维度数据的可视化效果图。(比如可以通过seaborn.heatmap画出各特征之间的相关度图,找出冗余特征)
交互信息可视化
数据分析的一个业务场景就是用数据讲故事,交互信息可视化的工具就在此凸显出了优势。
plotly实现了在线导入数据做可视化并保存内容在云端server的功能。做演示的时候,只需要在本地的jupyter notebook与plotly server建立通信,即可调用已经做好的可视化内容做展示。Plotly同时有freemium和premium两种账户,免费账户已经可以满足基本需要。
此外,作为数据分析师,一个重要的工作场景就是为业务团队建立dashboard,plotly强大的交互功能得到了淋漓尽致的体现。
另外的交互可视化库有Bokeh,Pyecharts
地图可视化库
处理地理信息数据,一般用于机器学习的可能性小,主要有Geoplotlib和Mapbox
可视化网站推荐:
- datatables (http://www.datatables.club/) Datatables是一款jquery表格插件。它是一个高度灵活的工具,可以将任何HTML表格添加高级的交互功能。
- layui (https://www.layui.com/) 经典模块化前端框架