tushare股票数据分析中遇到的问题

本文记录了使用tushare对沪深300成分股进行聚类分析时遇到的挑战:不同股票数据索引datetime格式不一致导致concat错误,以及个股因停牌导致的数据不完整问题。解决方法包括统一索引格式,以及手动填充缺失交易日信息,确保数据处理的准确性。
摘要由CSDN通过智能技术生成

基于tushare数据对沪深300成分股进行聚类分析,参考https://scikit-learn.org/stable/auto_examples/applications/plot_stock_market.html

在处理过程中遇到的问题记录一下:

1.不同函数获得数据索引的datetime格式不同

import tushare as ts
HS300=ts.get_h_data(code='000300',start='2018-01-01',end='2019-05-28',index=True)
PFbank=ts.get_hist_data(code='600000',start='2018-01-01',end='2019-5-27')

type(HS300.index)和type(PFbank.index)的结果是不一样的,所以如果直接pd.concat会报错。

建议使用pd.to_datetime()将两个索引变为同样的格式。


2.个股交易信息在停牌日是略过的,有的个股会有非交易日的错误信息

某只股票在2019年5月30日停牌,用ts.get_hist_data就不会有5月30日的索引。所以在相同时间区间内,返回的数据的长度是不一致的,这个要注意。对沪深300成分股下载同一年度的数据,就会出现有的股票少了几十行的数据,不利于后面数据处理。

tushare提供的API不能对缺失的交易日信息

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值