L18-利用Pandas清洗与可视化时序数据

本文介绍如何利用tushare接口获取股票数据,通过Pandas进行数据清洗,包括将日期字段转化为datetime类型并设为索引,以及数据合并。接着展示了如何使用matplotlib进行时序数据的可视化,包括绘制单一股票的年度趋势图,设置图表主题和X轴日期格式,以及进行多股票对比分析。
摘要由CSDN通过智能技术生成

获取时序数据并进行数据清洗与可视化分析

1. 准备工作

tushare是一个第三方财经数据接口包,需要安装包并完成注册。

  • 安装tushare包
pip install tushare 
  • 为防恶意调用接口数据,官方()需要新用户完成注册、提高积分(例如达到200)、取得访问权限token ID(例如:1797f6915fbc1e612c33c6ed4cf85a2b7b349d85db80bf0860337fff))。可通过如下链接(https://tushare.pro/register?reg=285935)进入官网完成注册。

2. 加载数据

首先需要导入包已安装的tushare包。然后通过tokenID获取一个有访问权限的API接口,最终通过官方文档说明,使用index_daily() 来获取样例数据。这里取’399401.SZ’的交易日期和收盘价。

import tushare as ts 

ts.set_token("1797f6915fbc1e612c33c6ed4cf85a2b7b349d85db80bf0860337fff")
pro=ts.pro_api()
df1=pro.index_daily(ts_code="399401.SZ")[['trade_date', 'close']]

3. 数据处理-转化与合并

  • 数据类型转化为datetime
    导入数据后,先观察源数据的字段类型是否符合预期。通过执行如下脚本,得到当前数据集中,trade_date为object 并非日期类型
# 查看数据类型
print(df1.dtypes)
# 查看样例数据
print(df1.head())

在这里插入图片描述
pandas中改变某列的数据类型为日期时,可用pd.to_datetime。修改完成后,将数据集中的日期字段重新设为索引。注意不要漏掉inplace=True。

df1.sort_values('trade_date', inplace=True)
# 转换列数据类型为日期
df1['trade_date']=pd.to_datetime(df1['trade_date'])
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值