plot画图 python 双线_最简洁的Python时间序列可视化实现

5a4b50d0dff08ab4c3e6c68281dfc622.png

TUSHARE  金融与技术学习兴趣小组 

翻译整理、编辑 | 一只小绿怪兽

译者简介:北京第二外国语学院国际商务专业研一在读,目前在学习Python编程和量化投资相关知识。

作者:DataCamp

时间序列数据在数据科学领域无处不在,在量化金融领域也十分常见,可以用于分析价格趋势,预测价格,探索价格行为等。

学会对时间序列数据进行可视化,能够帮助我们更加直观地探索时间序列数据,寻找其潜在的规律。

本文会利用Python中的matplotlib【1】库,并配合实例进行讲解。matplotlib库是⼀个⽤于创建出版质量图表的桌⾯绘图包(2D绘图库),是Python中最基本的可视化工具。

【工具】Python 3

【数据】Tushare

【注】示例注重的是方法的讲解,请大家灵活掌握。

01

单个时间序列

首先,我们从tushare.pro获取指数日线行情数据,并查看数据类型。

import tushare 

交易时间列'trade_date' 不是时间类型,而且也不是索引,需要先进行转化。

'trade_date'] = pd.to_datetime(df[

接下来,就可以开始画图了,我们需要导入matplotlib.pyplot【2】,然后通过设置set_xlabel()set_xlabel()为x轴和y轴添加标签。

import matplotlib.pyplot 

1e0de0b3714f0f4d54895377a0f606ec.png

matplotlib库中有很多内置图表样式可以选择,通过打印plt.style.available查看具体都有哪些选项,应用的时候直接调用plt.style.use('fivethirtyeight')即可。

print(plt.style.available)

3f542144837747aeea81625cbcca79c1.png

02

设置更多细节

上面画出的是一个很简单的折线图,其实可以在plot()里面通过设置不同参数的值,为图添加更多细节,使其更美观、清晰。

figsize(width, height)设置图的大小,linewidth设置线的宽度,fontsize设置字体大小。然后,调用set_title()方法设置标题。

ax = df.plot(color=

538d14dba19704f6edda2d7aafb052bb.png

如果想要看某一个子时间段内的折线变化情况,可以直接截取该时间段再作图即可,如df['2018-01-01': '2019-01-01']

df_subset_1 = df['2018-01-01':'2019-01-01']
ax = df_subset_1.plot(color='blue', fontsize=10)
plt.show()

6e347f4217b1207e62d4a68c85170047.png

如果想要突出图中的某一日期或者观察值,可以调用.axvline().axhline()方法添加垂直和水平参考线。

ax = df.plot(color=

e6f5a58e9b8453a4fc499c457f4032bf.png

也可以调用axvspan()的方法为一段时间添加阴影标注,其中alpha参数设置的是阴影的透明度,0代表完全透明,1代表全色。

ax = df.plot(color=

02487e3989969c2e7ac51f03499a1390.png

03

移动平均时间序列

有时候,我们想要观察某个窗口期的移动平均值的变化趋势,可以通过调用窗口函数rolling来实现。下面实例中显示的是,以250天为窗口期的移动平均线close,以及与移动标准差的关系构建的上下两个通道线upper和lower。

ma = df.rolling(window=

0ce23fba698fec53467f205603c60341.png

04

多个时间序列

如果想要可视化多个时间序列数据,同样可以直接调用plot()方法。示例中我们从tushare.pro上面选取三只股票的日线行情数据进行分析。

# 获取数据
06c6ce9e4c2cf3ebb7862b499735c087.png

调用.plot.area()方法可以生成时间序列数据的面积图,显示累计的总数。

ax = df.plot.area(fontsize=12)
ax.set_xlabel('trade_date')
ax.legend(fontsize=15)
plt.show()

c266be8cd633b698753a8676d40c04c8.png

如果想要在不同子图中单独显示每一个时间序列,可以通过设置参数subplots=True来实现。layout指定要使用的行列数,sharexsharey用于设置是否共享行和列,colormap='viridis' 为每条线设置不同的颜色。

True,

ba01e4374854b16872d5d5e07720b69d.png

05

总结

本文主要介绍了如何利用Python中的matplotlib库对时间序列数据进行一些简单的可视化操作,包括可视化单个时间序列并设置图中的细节,可视化移动平均时间序列和多个时间序列。

相关的官方文档和参考资料已附下面,感兴趣的话可以自行查阅更多内容!

95485b6f252f1b8d6af00f2148277876.png

END

更多内容请关注“挖地兔”公众号。

d03e324bc93ed8fe039551c0d15f779b.png 【参考链接】

https://matplotlib.org/【1】

https://matplotlib.org/api/_as_gen/matplotlib.pyplot.html#module-matplotlib.pyplot【2】

https://www.datacamp.com/courses/visualizing-time-series-data-in-python【Datacamp】 【扩展阅读】

Pandas必备技能之“分组聚合操作”

Pandas必备技能之“花式拼接表格”

Pandas必备技能之“时间序列数据处理”

Python+SQL无敌组合,值得你Pick!

如何正确使用Pandas库提升项目的运行速度?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值