Pandas对行情数据的预处理

库里是过去抓取的行情数据,间隔6秒,每分钟8-10个数据不等,还有开盘前后的一些数据,用Pandas可以更加优雅地进行处理。

image

需要把当前时间设置为index

df=df.set_index('time') #设置时间为索引字段

但是还是字符串,需要改为datetime类型:

ii=[datetime.strptime(idx,'%Y-%m-%d %H:%M:%S') for idx in df['time']] #索引列
df['newc']=ii
df=df.set_index('newc')

这样就得到datetime类型的index了,要保留分钟的数据,有两个方法,重新采样或者分组。

重采样:

fz=df.resample('T')
pr=fz['price'].mean()
am=fz['amount'].max()

分组:

df=df.groupby(lambda x:x.minute).mean()

或者直接用字符串进行分组,同时对价格取平均值,对成交量取最大值:

df=df.groupby(lambda x:x[:16])
pr=df['price'].mean()
am=df['amount'].max()

对于分组/采样结果,还可以用ohlc方法,很酷:

image

对比起来,用时间索引重采样的方式,可能更加灵活。因为诸如1分钟、5分钟、10分钟、半小时等各种时间节点,可以快速表示无需复杂的代码。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值