作者 | 小F
来源 | 法纳斯特
头图 | CSDN下载自视觉中国
关于动态条形图,小F以前推荐过「Bar Chart Race」这个库。三行代码就能实现动态条形图的绘制。
有些同学在使用的时候,会出现一些错误。一个是加载文件报错,另一个是生成GIF的时候报错。
这是因为作者的示例是网络加载数据,会读取不到。通过读取本地文件,就不会出错。
GIF生成失败一般是需要安装imagemagick(图片处理工具)。
最近小F又发现一个可视化图库「Pandas_Alive」,不仅包含动态条形图,还可以绘制动态曲线图、气泡图、饼状图、地图等。
同样也是几行代码就能完成动态图表的绘制。
安装版本建议是0.2.3,matplotlib版本是3.2.1。
同时需自行安装tqdm(显示进度条)和descartes(绘制地图相关库)。
要不然会出现报错,估计是作者的requestment.txt没包含这两个库。
好了,成功安装后就可以引入这个第三方库,直接选择加载本地文件。
import pandas_aliveimport pandas as pdcovid_df = pd.read_csv('data/covid19.csv', index_col=0, parse_dates=[0])covid_df.plot_animated(filename='examples/example-barh-chart.gif', n_visible=15)
生成了一个GIF图,具体如下。
刚开始学习这个库的时候,大家可以减少数据,这样生成GIF的时间就会快一些。
比如小F在接下来的实践中,基本都只选取了20天左右的数据。
对于其他图表,我们可以查看官方文档的API说明,得以了解。
下面我们就来看看其他动态图表的绘制方法吧!
动态条形图
elec_df = pd.read_csv("data/Aus_Elec_Gen_1980_2018.csv", index_col=0, parse_dates=[0], thousands=',')elec_df = elec_df.iloc[:20, :]elec_df.fillna(0).plot_animated('examples/example-electricity-generated-australia.gif', period_fmt="%Y", title='Australian Electricity Generation Sources 1980-2018')
动态柱状图
covid_df = pd.read_csv('data/covid19.csv', index_col=0, parse_dates=[0])covid_df.plot_animated(filename='examples/example-barv-chart.gif', orientation='v', n_visible=15)
动态曲线图
covid_df = pd.read_csv('data/covid19.csv', index_col=0, parse_dates=[0])covid_df.diff().fillna(0).plot_animated(filename='examples/example-line-chart.gif', kind='line', period_label={'x': 0.25, 'y': 0.9})
动态面积图
covid_df = pd.read_csv('data/covid19.csv', index_col=0, parse_dates=[0])covid_df.sum(axis=1).fillna(0).plot_animated(filename='examples/example-bar-chart.gif', kind='bar', period_label={'x': 0.1, 'y': 0.9}, enable_progress_bar=True, steps_per_period=2, interpolate_period=True, period_length=200)
动态散点图
max_temp_df = pd.read_csv("data/Newcastle_Australia_Max_Temps.csv", parse_dates={"Timestamp": ["Year", "Month", "Day"]},)min_temp_df = pd.read_csv("data/Newcastle_Australia_Min_Temps.csv", parse_dates={"Timestamp": ["Year", "Month", "Day"]},)
max_temp_df = max_temp_df.iloc[:5000, :]min_temp_df = min_temp_df.iloc[:5000, :]
merged_temp_df = pd.merge_asof(max_temp_df, min_temp_df, on="Timestamp")merged_temp_df.index = pd.to_datetime(merged_temp_df["Timestamp"].dt.strftime('%Y/%m/%d'))
keep_columns = ["Minimum temperature (Degree C)", "Maximum temperature (Degree C)"]merged_temp_df[keep_columns].resample("Y").mean().plot_animated(filename='examples/example-scatter-chart.gif', kind="scatter", title='Max & Min Temperature Newcastle, Australia')
动态饼状图
covid_df = pd.read_csv('data/covid19.csv', index_col=0, parse_dates=[0])covid_df.plot_animated(filename='examples/example-pie-chart.gif', kind="pie", rotatelabels=True, period_label={'x': 0, 'y': 0})
动态气泡图
multi_index_df = pd.read_csv("data/multi.csv", header=[0, 1], index_col=0)multi_index_df.index = pd.to_datetime(multi_index_df.index, dayfirst=True)
map_chart = multi_index_df.plot_animated( kind="bubble", filename="examples/example-bubble-chart.gif", x_data_label="Longitude", y_data_label="Latitude", size_data_label="Cases", color_data_label="Cases", vmax=5, steps_per_period=3, interpolate_period=True, period_length=500, dpi=100)