在谈到数据可视化的时候,相信大多数的读者会想到“matplotlib”、“pyecharts”等第三方模块,今天小编要介绍的可视化框架叫做“plotly”,通过构建基于HTML的交互式图表来显示信息,可创建各种形式的精美图表。当然,除了“plotly”这个模块,本文也会提到“cufflinks”也就是对“plotly”模块封装过之后的模块,相当于是“seaborn”之于“matplotlib”的关系。
01
下载与导入数据
下载安装相关的库,通过“pip”命令行即可实现,
!pip install plotly
导入相关的模块并读取数据,并对可视化做一定的设置
# plotly standard imports
import plotly.graph_objs as go
import chart_studio.plotly as py
# Cufflinks wrapper on plotly
import cufflinks
# Data science imports
import pandas as pd
from plotly.offline import iplot
cufflinks.go_offline()
# Set global theme
cufflinks.set_config_file(world_readable=True, theme='pearl')
df = pd.read_parquet('medium_data_2019_01_06')
02
直方图
我们先从简单的画直方图开始,代码如下
df['claps'].iplot(kind='hist', xTitle='claps',
yTitle='count', title='Claps Distribution')
这和大家之前使用“matplotlib”模块十分的想类似,我们只好需要用“iplot”而不是“plot”即可,最后显示的直方图在交互性上面、以及美观程度有着显著的提升,同时我们能够对数据进行放大,看到更加具体的数据走势