(python)从Baostock下载股票K线数据保存到本地Mysql数据库

量化 专栏收录该内容
2 篇文章 0 订阅

最近在下载数据的时候发现很多原来免费的数据库现在都开始收费了,于是就想写个小程序把数据保存到本地,一开始想保存到CSV里,但是想起好久没用的mysql的知识都生疏了,正好写个小DEMO练练手。

前期准备

  1. 在本地安装Mysql (安装方法请百度 菜鸟教程 Mysql)
  2. Python 3.6

Mysql

import mysql.connector

class MysqlConnector():
    def __init__(self, host, user, passwd, auth_plugin):

        self.host = host
        self.user = user
        self.passwd = passwd
        self.auth_plugin = auth_plugin
        self.connection = mysql.connector.connect(
            host=self.host,  # 数据库主机地址
            user=self.user,  # 数据库用户名
            passwd=self.passwd,  # 数据库密码
            auth_plugin=self.auth_plugin # 解决MYSQL 8.0默认加密模式不匹配问题
        )

    def createCursor(self):
        myCursor = self.connection.cursor()
        return myCursor

    def get_connection(self):
        return self.connection

if __name__ == "__main__":
    pyMysql = MysqlConnector(host="localhost", user="root", passwd="Your Password", auth_plugin="mysql_native_password")
    myCursor = pyMysql.createCursor()
    # myCursor.execute("CREATE DATABASE TestDatabase")
    myCursor.execute("SHOW DATABASES")
    for x in myCursor:
        print(x)
    myCursor.execute("USE TestDatabase")
    # myCursor.execute("CREATE TABLE Test (name VARCHAR(255), url VARCHAR(255))")
    myCursor.execute("SHOW TABLES")
    for x in myCursor:
        print(x)

这里我把mysql.connector稍稍做了一最简单的在封装方便自己使用

BaoStock

import baostock as bs
import pandas as pd

class BaostockRebuild():

    def __init__(self):
        #### 登陆系统 ####
        lg = bs.login()
        # 显示登陆返回信息
        if lg.error_msg == "success":
            print("登录成功")
            print('login respond error_code:' + lg.error_code)
            print('login respond  error_msg:' + lg.error_msg)
        else:
            print("登录错误")
            print('login respond error_code:' + lg.error_code)
            print('login respond  error_msg:' + lg.error_msg)

    def baostock_logout(self):
        bs.logout()

    def k_data_query(self,code, char, start_date, end_date, frequency, adjustflag):
        """
        获取某只标的的K线数据
        :param code: 标的代码 eg;"000001.SH"
        :param char: 需要下载的数据特征 eg 分钟线指标:date,time,code,open,high,low,close,volume,amount,adjustflag
                                        周月线指标:date,code,open,high,low,close,volume,amount,adjustflag,turn,pctChg
        :param start_date:  开始日期
        :param end_date:  结束日期
        :param frequency:  频率 数据类型,默认为d,日k线;d=日k线、w=周、m=月、5=5分钟、15=15分钟、30=30分钟、60=60分钟k线数据,
                            不区分大小写;指数没有分钟线数据;周线每周最后一个交易日才可以获取,月线每月最后一个交易日才可以获取。
        :param adjustflag:  复权类型,默认不复权:31:后复权;2:前复权。已支持分钟线、日线、周线、月线前后复权
        :return: result
        """
        rs = bs.query_history_k_data_plus(code,
                                          char,
                                          start_date=start_date, end_date=end_date,
                                          frequency=frequency, adjustflag=adjustflag)
        data_list = []
        while (rs.error_code == '0') & rs.next():  # 获取一条记录,将记录合并在一起
            data_list.append(rs.get_row_data())
        result = pd.DataFrame(data_list, columns=rs.fields)
        return result

    def div_info_query(self, code, year, yearType):
        """
        通过API接口获取除权除息信息数据(预披露、预案、正式都已通过)
        :param code: 股票代码,sh或sz.+6位数字代码,或者指数代码,如:sh.601398。sh:上海;sz:深圳。此参数不可为空;
        :param year: 年份,如:2017。此参数不可为空;
        :param yearType: 年份类别,默认为"report":预案公告年份,可选项"operate":除权除息年份。此参数不可为空。
        :return: rs_list
        """
        rs_list = []
        rs_dividend_2015 = bs.query_dividend_data(code=code, year=year, yearType=yearType)
        while (rs_dividend_2015.error_code == '0') & rs_dividend_2015.next():
            rs_list.append(rs_dividend_2015.get_row_data())
        return rs_list

    def profitability_info_query(self, code, year, quarter):
        """
        通过API接口获取季频盈利能力信息,可以通过参数设置获取对应年份、季度数据,提供2007年至今数据
        :param code: 股票代码,sh或sz.+6位数字代码,或者指数代码,如:sh.601398。sh:上海;sz:深圳。此参数不可为空;
        :param year: 统计年份,为空时默认当前年;
        :param quarter:统计季度,可为空,默认当前季度。不为空时只有4个取值:1234:return: result_profit
        """
        profit_list = []
        rs_profit = bs.query_profit_data(code=code, year=year, quarter=quarter)
        while (rs_profit.error_code == '0') & rs_profit.next():
            profit_list.append(rs_profit.get_row_data())
        result_profit = pd.DataFrame(profit_list, columns=rs_profit.fields)
        return result_profit

    def opeation_info_query(self, code, year, quarter):
        """
        通过API接口获取季频营运能力信息,可以通过参数设置获取对应年份、季度数据,提供2007年至今数据
        :param code: 股票代码,sh或sz.+6位数字代码,或者指数代码,如:sh.601398。sh:上海;sz:深圳。此参数不可为空;
        :param year: 统计年份,为空时默认当前年;
        :param quarter:统计季度,可为空,默认当前季度。不为空时只有4个取值:1234:return: result_profit
        """
        profit_list = []
        rs_profit = bs.query_operation_data(code=code, year=year, quarter=quarter)
        while (rs_profit.error_code == '0') & rs_profit.next():
            profit_list.append(rs_profit.get_row_data())
        result_profit = pd.DataFrame(profit_list, columns=rs_profit.fields)
        return result_profit

    def growth_info_query(self, code, year, quarter):
        """
        通过API接口获取季频成长能力信息,可以通过参数设置获取对应年份、季度数据,提供2007年至今数据
        :param code: 股票代码,sh或sz.+6位数字代码,或者指数代码,如:sh.601398。sh:上海;sz:深圳。此参数不可为空;
        :param year: 统计年份,为空时默认当前年;
        :param quarter:统计季度,可为空,默认当前季度。不为空时只有4个取值:1234:return: result_profit
        """
        profit_list = []
        rs_profit = bs.query_growth_data(code=code, year=year, quarter=quarter)
        while (rs_profit.error_code == '0') & rs_profit.next():
            profit_list.append(rs_profit.get_row_data())
        result_profit = pd.DataFrame(profit_list, columns=rs_profit.fields)
        return result_profit

    def balance_info_query(self, code, year, quarter):
        """
        通过API接口获取季频偿债能力信息,可以通过参数设置获取对应年份、季度数据,提供2007年至今数据
        :param code: 股票代码,sh或sz.+6位数字代码,或者指数代码,如:sh.601398。sh:上海;sz:深圳。此参数不可为空;
        :param year: 统计年份,为空时默认当前年;
        :param quarter:统计季度,可为空,默认当前季度。不为空时只有4个取值:1234:return: result_profit
        """
        profit_list = []
        rs_profit = bs.query_balance_data(code=code, year=year, quarter=quarter)
        while (rs_profit.error_code == '0') & rs_profit.next():
            profit_list.append(rs_profit.get_row_data())
        result_profit = pd.DataFrame(profit_list, columns=rs_profit.fields)
        return result_profit

    def cashflow_info_query(self, code, year, quarter):
        """
        通过API接口获取季频现金流量信息,可以通过参数设置获取对应年份、季度数据,提供2007年至今数据
        :param code: 股票代码,sh或sz.+6位数字代码,或者指数代码,如:sh.601398。sh:上海;sz:深圳。此参数不可为空;
        :param year: 统计年份,为空时默认当前年;
        :param quarter:统计季度,可为空,默认当前季度。不为空时只有4个取值:1234:return: result_profit
        """
        profit_list = []
        rs_profit = bs.query_cash_flow_data(code=code, year=year, quarter=quarter)
        while (rs_profit.error_code == '0') & rs_profit.next():
            profit_list.append(rs_profit.get_row_data())
        result_profit = pd.DataFrame(profit_list, columns=rs_profit.fields)
        return result_profit

    def query_dupont_data(self, code, year, quarter):
        """
        通过API接口获取季频杜邦指数信息,可以通过参数设置获取对应年份、季度数据,提供2007年至今数据
        :param code: 股票代码,sh或sz.+6位数字代码,或者指数代码,如:sh.601398。sh:上海;sz:深圳。此参数不可为空;
        :param year: 统计年份,为空时默认当前年;
        :param quarter:统计季度,可为空,默认当前季度。不为空时只有4个取值:1234:return: result_profit
        """
        profit_list = []
        rs_profit = bs.query_cash_flow_data(code=code, year=year, quarter=quarter)
        while (rs_profit.error_code == '0') & rs_profit.next():
            profit_list.append(rs_profit.get_row_data())
        result_profit = pd.DataFrame(profit_list, columns=rs_profit.fields)
        return result_profit

    def performance_express_report_query(self, code, start_date, end_date):
        """
        通过API接口获取季频公司业绩快报信息,可以通过参数设置获取起止年份数据,提供2006年至今数据。除几种特殊情况外,交易所未要求必须发布。
        :param code: 股票代码,sh或sz.+6位数字代码,或者指数代码,如:sh.601398。sh:上海;sz:深圳。此参数不可为空;
        :param start_date: 开始日期,发布日期或更新日期在这个范围内;
        :param end_date: 结束日期,发布日期或更新日期在这个范围内。
        :return: result
        """
        rs = bs.query_performance_express_report(code=code, start_date=start_date, end_date=end_date)
        print('query_performance_express_report respond error_code:' + rs.error_code)
        print('query_performance_express_report respond  error_msg:' + rs.error_msg)

        result_list = []
        while (rs.error_code == '0') & rs.next():
            result_list.append(rs.get_row_data())
            # 获取一条记录,将记录合并在一起
        result = pd.DataFrame(result_list, columns=rs.fields)
        return result

    def forcast_report_query(self, code, start_date, end_date):
        """
        通过API接口获取季频公司业绩预告信息,可以通过参数设置获取起止年份数据,提供2003年至今数据。除几种特殊情况外,交易所未要求必须发布。
        :param code: 股票代码,sh或sz.+6位数字代码,或者指数代码,如:sh.601398。sh:上海;sz:深圳。此参数不可为空;
        :param start_date: 开始日期,发布日期或更新日期在这个范围内;
        :param end_date: 结束日期,发布日期或更新日期在这个范围内。
        :return: result
        """
        #### 获取公司业绩预告 ####
        rs_forecast = bs.query_forecast_report(code=code, start_date=start_date, end_date=end_date)
        print('query_forecast_reprot respond error_code:' + rs_forecast.error_code)
        print('query_forecast_reprot respond  error_msg:' + rs_forecast.error_msg)
        rs_forecast_list = []
        while (rs_forecast.error_code == '0') & rs_forecast.next():
            # 分页查询,将每页信息合并在一起
            rs_forecast_list.append(rs_forecast.get_row_data())
        result_forecast = pd.DataFrame(rs_forecast_list, columns=rs_forecast.fields)
        #### 结果集输出到csv文件 ####
        return result_forecast

"下一个方式是证券基本资料  http://baostock.com/baostock/index.php/%E8%AF%81%E5%88%B8%E5%9F%BA%E6%9C%AC%E8%B5%84%E6%96%99"

if __name__ == "__main__":
    bao = BaostockRebuild()
    sh000001 = bao.k_data_query(code="000001.SH", char="date,code,open,high,low,close,volume,amount,adjustflag,turn,pctChg",
                 start_date="2019-01-10", end_date="2020-01-01", frequency="d", adjustflag="3")
    sh000001.to_csv("Test.csv")

    div_info_test = bao.div_info_query(code="sh.600000", year="2015", yearType="report")
    print()

    profitability_info = bao.profitability_info_query(code="sh.600000", year=2017, quarter=2)
    print(profitability_info)

    bao.baostock_logout()

这里是我自己的臭毛病,总喜欢把人家写好的包做个在封装。。。不喜欢的无视就好,,哈哈哈

Run

from Mysql_operation import *
from BaoStock import *

if __name__ == "__main__":
    bao = BaostockRebuild()
    pyMysql = MysqlConnector(host="localhost", user="root", passwd="Your Password", auth_plugin="mysql_native_password")
    myCursor = pyMysql.createCursor()
    connection = pyMysql.getConnection()

    sh000001 = bao.k_data_query(code="000001.SH", char="date,code,open,high,low,close,volume,amount,adjustflag,"
                                                       "turn,pctChg",
                 start_date="2019-01-10", end_date="2020-01-01", frequency="d", adjustflag="3")
    myCursor.execute("USE TestDatabase")
    print(sh000001.keys())
    for item in sh000001.values:
        print(item)
        date = item[0]
        code = item[1]
        open = float(item[2])
        high = float(item[3])
        low = float(item[4])
        close =float(item[5])
        volume = float(item[6])
        amount = float(item[7])
        adjustflag = int(item[8])
        turn = float(item[9])
        pctChg = float(item[10])
        myCursor.execute("INSERT INTO %s "
                         "VALUES ('%s', '%s',%s,%s,%s,%s,%s,%s,%s,%s,%s)" % ('sh000001', item[0], item[1], item[2], item[3], item[4], item[5], item[6], item[7], item[8], item[9]
        ,item[10]))
        connection.commit()

因为是DEMO 所以写的比较粗糙,很多细节还没有优化,见谅见谅,亲测可用,下面附上mysql表的结构,为了省事,表我是用Shell创建的,代码如下

CREATE TABLE `testdatabase`.`new_table` (
  `date` DATE NOT NULL,
  `code` VARCHAR(45) NULL,
  `open` DECIMAL(10,5) NULL,
  `high` DECIMAL(10,5) NULL,
  `low` DECIMAL(10,5) NULL,
  `close` DECIMAL(10,5) NULL,
  `volume` DECIMAL(25,9) NULL,
  `amount` DECIMAL(25,9) NULL,
  `adjustflag` INT NULL,
  `turn` DECIMAL(15,10) NULL,
  `new_tablecol` DECIMAL(15,10) NULL,
  PRIMARY KEY (`date`));
  • 5
    点赞
  • 2
    评论
  • 16
    收藏
  • 一键三连
    一键三连
  • 扫一扫,分享海报

©️2021 CSDN 皮肤主题: 游动-白 设计师:白松林 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值