Python量化交易学习笔记(39)——BaoStock股票数据下载

鉴于近几篇文章都与多周期回测相关,因此用这篇文章来记录下多周期股票的数据的获取方式。
前面在zwPython的框架下,使用的是Tushare来获取A股的日线数据,如果想获取其他周期的数据,就要使用Tushare Pro,并且还要有足够的积分。苦于家里没矿,手里没银子,转投向可以免费下载数据的BaoStock,以下简单记录数据下载流程。

安装

使用国内源安装:

pip install baostock -i https://pypi.tuna.tsinghua.edu.cn/simple/ --trusted-host pypi.tuna.tsinghua.edu.cn

版本升级

pip install --upgrade baostock

使用前提

  • 安装Python

  • 安装pandas(pip install pandas)

数据时间范围说明

股票数据
  • 日、周、月K线数据,时间范围:1990-12-19至今。
  • 5、15、30、60分钟K线数据,时间范围:1999-07-26至今。
指数数据
  • 日、周、月K线已经包含指数:综合指数,规模指数,一级行业指数,二级行业指数,策略指数,成长指数,价值指数,主题指数,基金指数,债券指数。
  • 时间范围:2006-01-01至今。
季频财务数据
  • 已经包含的财务数据:部分上市公司资产负债信息、上市公司现金流量信息、上市公司利润信息、上市公司杜邦指标信息。
  • 时间范围:2007年至今。
季频公司报告
  • 上市公司业绩预告信息,时间范围:2003年至今。
  • 上市公司业绩快报信息,时间范围:2006年至今。

每日最新数据更新时间

  • 当前交易日17:30,完成日K线数据入库;
  • 当前交易日20:30,完成分钟K线数据入库;
  • 第二自然日1:30,完成前交易日“其它财务报告数据”入库。

A股K线数据下载

API
query_history_k_data_plus(code, fields, start_date=None, end_date=None, frequency='d', adjustflag='3')
参数含义
  • code:股票代码,sh或sz.+6位数字代码,或者指数代码,如:sh.601398。sh:上海;sz:深圳。此参数不可为空;
  • fields:指示简称,支持多指标输入,以半角逗号分隔,填写内容作为返回类型的列。详细指标列表见历史行情指标参数章节,日线与分钟线参数不同。此参数不可为空;
  • start_date:开始日期(包含),格式“YYYY-MM-DD”,为空时取2015-01-01;
  • end_date:结束日期(包含),格式“YYYY-MM-DD”,为空时取最近一个交易日;
  • frequency:数据类型,默认为d,日k线;d=日k线、w=周、m=月、5=5分钟、15=15分钟、30=30分钟、60=60分钟k线数据,不区分大小写;指数没有分钟线数据;周线每周最后一个交易日才可以获取,月线每月最后一个交易日才可以获取;
  • adjustflag:复权类型,默认不复权:3;1:后复权;2:前复权。已支持分钟线、日线、周线、月线前后复权。
几点说明
  1. 可以通过query_all_stock(date)获取指定日期的指数和股票数据,提取指数和股票代码后,就可以用于后续的各周期数据的下载。如果只需要下载股票数据,而不需要下载指数数据,可以使用返回结果的code字段进行过滤。
  2. 使用文末所附代码下载各周期数据前,需要新建相应文件夹。
  3. 日线、周线和月线、分钟数据所能下载的数据字段不同,可根据需求选择下载字段。
  4. 股票停牌时,对于日线,开、高、低、收价都相同,且都为前一交易日的收盘价,成交量、成交额为0,换手率为空。因此,如果不需要这部分数据的话,需要进行数据过滤,删除volume为0的数据。此外,由于网络原因可能导致数据下载失败,引发访问volume字段时报错,因此需要做进一步条件判断处理,使下载程序能够继续执行。
        if DROP_SUSPENSION and 'volume' in list(out_df):
            out_df.drop(out_df[out_df.volume == '0'].index, inplace = True

使用BaoStock下载股票数据代码:

import baostock as bs
import pandas as pd
import datetime

'''
日线指标参数包括:'date,code,open,high,low,close,preclose,volume,amount,adjustflag,turn,tradestatus,pctChg,peTTM,pbMRQ,psTTM,pcfNcfTTM,isST'
周、月线指标参数包括:'date,code,open,high,low,close,volume,amount,adjustflag,turn,pctChg'
分钟指标参数包括:'date,time,code,open,high,low,close,volume,amount,adjustflag'

adjustflag:复权类型,默认不复权:3;1:后复权;2:前复权。已支持分钟线、日线、周线、月线前后复权。
'''

# 是否删除停盘数据
DROP_SUSPENSION = True

def update_stk_list(date = None):
    # 获取指定日期的指数、股票数据
    stock_rs = bs.query_all_stock(date)
    stock_df = stock_rs.get_data()
    stock_df.to_csv('./stk_data/all_list.csv', encoding = 'gbk', index = False)
    stock_df.drop(stock_df[stock_df.code < 'sh.600000'].index, inplace = True)
    stock_df.drop(stock_df[stock_df.code > 'sz.399000'].index, inplace = True)
    stock_df = stock_df['code']
    stock_df.to_csv('./stk_data/stk_list.csv', encoding = 'gbk', index = False)
    return stock_df.tolist()

def load_stk_list():
    df = pd.read_csv('./stk_data/stk_list.csv')
    return df['code'].tolist()

def convert_time(t):
    H = t[8:10]
    M = t[10:12]
    S = t[12:14]
    return H + ':' + M + ':' + S


def download_data(stk_list = [], fromdate = '1990-12-19', todate = datetime.date.today(), 
                   datas = 'date,open,high,low,close,volume,amount,turn,pctChg', 
                   frequency = 'd', adjustflag = '2'):
    for code in stk_list:
        print("Downloading :" + code)
        k_rs = bs.query_history_k_data_plus(code, datas, start_date = fromdate, end_date = todate.strftime('%Y-%m-%d'),
                                            frequency = frequency, adjustflag = adjustflag)
        datapath = './stk_data/' + frequency + '/' + code + '.csv'
        out_df = k_rs.get_data()
        if DROP_SUSPENSION and 'volume' in list(out_df):
            out_df.drop(out_df[out_df.volume == '0'].index, inplace = True)
        # 做time转换
        if frequency in ['5', '15', '30', '60'] and 'time' in list(out_df):
            out_df['time'] = out_df['time'].apply(convert_time)
        out_df.to_csv(datapath, encoding = 'gbk', index = False)

if __name__ == '__main__':
    
    bs.login()

    # 首次运行
    stk_list = update_stk_list(datetime.date.today() - datetime.timedelta(days = 31))
    # 非首次运行
    #stk_list = load_stk_list()

    # 下载日线
    download_data(stk_list)
    # 下载周线
    download_data(stk_list, frequency = 'w')
    # 下载月线
    download_data(stk_list, frequency = 'm')
    # 下载5分钟线
    download_data(stk_list, fromdate = '2020-6-1', frequency = '5', datas = 'date,time,open,high,low,close,volume,amount,adjustflag')
    # 下载15分钟线
    download_data(stk_list, fromdate = '2020-6-1', frequency = '15', datas = 'date,time,open,high,low,close,volume,amount,adjustflag')
    # 下载30分钟线
    download_data(stk_list, fromdate = '2020-6-1', frequency = '30', datas = 'date,time,open,high,low,close,volume,amount,adjustflag')
    # 下载60分钟线
    download_data(stk_list, fromdate = '2020-6-1', frequency = '60', datas = 'date,time,open,high,low,close,volume,amount,adjustflag')
    bs.logout()



博客内容只用于交流学习,不构成投资建议,盈亏自负!

个人博客:http://coderx.com.cn/(优先更新)
项目最新代码:https://gitee.com/sl/quant_from_scratch
欢迎大家转发、留言。有微信群用于学习交流,感兴趣的读者请扫码加微信!
如果认为博客对您有帮助,可以扫码进行捐赠,感谢!

微信二维码微信捐赠二维码
在这里插入图片描述在这里插入图片描述
  • 25
    点赞
  • 112
    收藏
    觉得还不错? 一键收藏
  • 26
    评论
Baostock 是一个基于 Python股票数据接口,可以获取国内外股票、期货等金融数据,并且提供了一些数据可视化和分析的功能。使用 Baostock 前,需要先注册一个账号并获取 AppKey。 以下是使用 Baostock 获取股票历史行情数据并保存为 CSV 文件的示例代码: ```python import baostock as bs import pandas as pd # 登录系统 lg = bs.login() if lg.error_code != &#39;0&#39;: print(&#39;登录失败&#39;) exit() # 获取沪深A股历史K线数据 rs = bs.query_history_k_data_plus(&#39;sh.600000&#39;, &#39;date,open,high,low,close,volume&#39;, start_date=&#39;2020-01-01&#39;, end_date=&#39;2021-12-31&#39;, frequency=&#39;d&#39;, adjustflag=&#39;3&#39;) if rs.error_code != &#39;0&#39;: print(&#39;请求失败&#39;) exit() # 打印结果集 data_list = [] while (rs.error_code == &#39;0&#39;) & rs.next(): row = rs.get_row_data() data_list.append(row) df = pd.DataFrame(data_list, columns=rs.fields) # 保存数据到 CSV 文件 df.to_csv(&#39;sh.600000.csv&#39;, index=False) # 登出系统 bs.logout() ``` 在上面的示例代码中,我们先使用 `bs.login()` 方法登录 Baostock 系统,然后调用 `bs.query_history_k_data_plus()` 方法获取指定股票的历史行情数据,并将数据存储在 pandas 的 DataFrame 中。最后,我们使用 `df.to_csv()` 方法将数据保存为 CSV 文件。注意,Baostock 的接口返回的数据类型是 `bscore.resultset.ResultSet`,需要通过循环遍历该对象获取数据。最后,我们使用 `bs.logout()` 方法退出 Baostock 系统。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 26
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值