Python 获取股票K线数据

前言

玩过股票的几乎都知道,股票历史交易日的开盘价、收盘价、最高价、最低价等指标是选股的重要依据。虽然仅仅依靠它们无法在股市中盆满钵满,但是运用好它确实能在较大程度提高我们的赚钱概率

当前的金融数据查看工具确实够多,例如东方财富、同花顺等知名财经网站。它们的数据很全,但是集成程度太高了,难以满足每个人的个性化需求。比如说我以A股的4000多只股票为研究对象,想研究它们的历史日k线数据,那么导出这么多数据无疑是一个巨大的工程。并且这些财经网站可能并不会给免费用户提供批量导出数据的功能。

这个时候还想获取这些数据怎么办呢?冲会员当然是一个选择,不过这样子还是容易受制于人,即使是会员,个性化程度还是不够高。

为了解决“股票k线数据难以个性化导出”这个问题,我们可以尝试使用 Python 对财经网站进行爬虫以获取源数据,再从里面提取出我们需要的信息,比如本次的k线数据,之后再保存到表格文件里面。

开始之前

Python版本要求

Python 3

如果没有安装 Python,可以参考我写的这篇安装教程

Win下快速搭建Python编程环境67 赞同 · 19 评论文章正在上传…重新上传取消

需要安装的库

pandas
requests

库的安装方法是:打开 cmd(命令提示符或者其他终端工具),输入以下代码

pip install pandas requests

输入完毕,按 Enter 键执行代码,等待 successfully 出现即可

代码展示

需求 1 描述

获取 代码为 600519 这只股票从 2020年1月1日 到 2020年11月1日 的k线数据并将数据保存到以股票代码命名的csv文件中,例如 600519.csv

示例代码 1

from urllib.parse import urlencode
import pandas as pd
import requests


def gen_secid(rawcode: str) -> str:
    '''
    生成东方财富专用的secid

    Parameters
    ----------
    rawcode : 6 位股票代码

    Return
    ------
    str: 指定格式的字符串

    '''
    # 沪市指数
    if rawcode[:3] == '000':
        return f'1.{rawcode}'
    # 深证指数
    if rawcode[:3] == '399':
        return f'0.{rawcode}'
    # 沪市股票
    if rawcode[0] != '6':
        return f'0.{rawcode}'
    # 深市股票
    return f'1.{rawcode}'


def get_k_history(code: str, beg: str, end: str, klt: int = 101, fqt: int = 1) -> pd.DataFrame:
    '''
    功能获取k线数据
    -
    参数

        code : 6 位股票代码
        beg: 开始日期 例如 20200101
        end: 结束日期 例如 20200201

        klt: k线间距 默认为 101 即日k
            klt:1 1 分钟
            klt:5 5 分钟
            klt:101 日
            klt:102 周
        fqt: 复权方式
            不复权 : 0
            前复权 : 1
            后复权 : 2 
    '''
    EastmoneyKlines = {
        'f51': '日期',
        'f52': '开盘',
        'f53': '收盘',
        'f54': '最高',
        'f55': '最低',
        'f56': '成交量',
        'f57': '成交额',
        'f58': '振幅',
        'f59': '涨跌幅',
        'f60': '涨跌额',
        'f61': '换手率',


    }
    EastmoneyHeaders = {
  
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; Touch; rv:11.0) like Gecko',
        'Accept': '*/*',
        'Accept-Language': 'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
        'Referer': 'http://quote.eastmoney.com/center/gridlist.html',
    }
    fields = list(EastmoneyKlines.keys())
    columns = list(EastmoneyKlines.values())
    fields2 = ",".join(fields)
    secid = gen_secid(code)
    params = (
        ('fields1', 'f1,f2,f3,f4,f5,f6,f7,f8,f9,f10,f11,f12,f13'),
        ('fields2', fields2),
        ('beg', beg),
        ('end', end),
        ('rtntype', '6'),
        ('secid', secid),
        ('klt', f'{klt}'),
        ('fqt', f'{fqt}'),
    )
    params = dict(params)
    base_url = 'https://push2his.eastmoney.com/api/qt/stock/kline/get'
    url = base_url+'?'+urlencode(params)
    json_response: dict = requests.get(
        url, headers=EastmoneyHeaders).json()

    data = json_response.get('data')
    if data is None:
        if secid[0] == '0':
            secid = f'1.{code}'
        else:
            secid = f'0.{code}'
        params['secid'] = secid
        url = base_url+'?'+urlencode(params)
        json_response: dict = requests.get(
            url, headers=EastmoneyHeaders).json()
        data = json_response.get('data')
    if data is None:
        print('股票代码:', code, '可能有误')
        return pd.DataFrame(columns=columns)

    klines = data['klines']

    rows = []
    for _kline in klines:

        kline = _kline.split(',')
        rows.append(kline)

    df = pd.DataFrame(rows, columns=columns)

    return df


if __name__ == "__main__":
    # 股票代码
    code = '600519'

    # 开始日期
    start_date = '20200101'
    # 结束日期
    end_date = '20201101'

    print(f'正在获取 {code} 从 {start_date} 到 {end_date} 的 k线数据......')
    # 根据股票代码、开始日期、结束日期获取指定股票代码指定日期区间的k线数据
    df = get_k_history(code, start_date, end_date)
    # 保存k线数据到表格里面
    df.to_csv(f'{code}.csv', encoding='utf-8-sig', index=None)
    print(f'股票代码:{code} 的 k线数据已保存到代码目录下的 {code}.csv 文件中')

示例代码 1 运行结果

  • 屏幕输出
正在获取 600519 从 20200101 到 20201101 的 k线数据......
股票代码:600519 的 k线数据已保存到代码目录下的 600519.csv 文件中
  • 生成一个表格文件(csv格式)

需求 2 描述

获取股票代码分别为 600519、300750 的这两只股票从 2020年1月1日 到 2020年11月1日 的k线数据并将数据保存到以股票代码命名的csv文件中

示例代码 2

from urllib.parse import urlencode
import pandas as pd
import requests


def gen_secid(rawcode: str) -> str:
    '''
    生成东方财富专用的secid

    Parameters
    ----------
    rawcode : 6 位股票代码

    Return
    ------
    str: 指定格式的字符串

    '''
    # 沪市指数
    if rawcode[:3] == '000':
        return f'1.{rawcode}'
    # 深证指数
    if rawcode[:3] == '399':
        return f'0.{rawcode}'
    # 沪市股票
    if rawcode[0] != '6':
        return f'0.{rawcode}'
    # 深市股票
    return f'1.{rawcode}'


def get_k_history(code: str, beg: str, end: str, klt: int = 101, fqt: int = 1) -> pd.DataFrame:
    '''
    功能获取k线数据
    -
    参数

        code : 6 位股票代码
        beg: 开始日期 例如 20200101
        end: 结束日期 例如 20200201

        klt: k线间距 默认为 101 即日k
            klt:1 1 分钟
            klt:5 5 分钟
            klt:101 日
            klt:102 周
        fqt: 复权方式
            不复权 : 0
            前复权 : 1
            后复权 : 2 
    '''
    EastmoneyKlines = {
        'f51': '日期',
        'f52': '开盘',
        'f53': '收盘',
        'f54': '最高',
        'f55': '最低',
        'f56': '成交量',
        'f57': '成交额',
        'f58': '振幅',
        'f59': '涨跌幅',
        'f60': '涨跌额',
        'f61': '换手率',


    }
    EastmoneyHeaders = {
     
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; Touch; rv:11.0) like Gecko',
        'Accept': '*/*',
        'Accept-Language': 'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
        'Referer': 'http://quote.eastmoney.com/center/gridlist.html',
    }
    fields = list(EastmoneyKlines.keys())
    columns = list(EastmoneyKlines.values())
    fields2 = ",".join(fields)
    secid = gen_secid(code)
    params = (
        ('fields1', 'f1,f2,f3,f4,f5,f6,f7,f8,f9,f10,f11,f12,f13'),
        ('fields2', fields2),
        ('beg', beg),
        ('end', end),
        ('rtntype', '6'),
        ('secid', secid),
        ('klt', f'{klt}'),
        ('fqt', f'{fqt}'),
    )
    params = dict(params)
    base_url = 'https://push2his.eastmoney.com/api/qt/stock/kline/get'
    url = base_url+'?'+urlencode(params)
    json_response: dict = requests.get(
        url, headers=EastmoneyHeaders).json()

    data = json_response.get('data')
    if data is None:
        if secid[0] == '0':
            secid = f'1.{code}'
        else:
            secid = f'0.{code}'
        params['secid'] = secid
        url = base_url+'?'+urlencode(params)
        json_response: dict = requests.get(
            url, headers=EastmoneyHeaders).json()
        data = json_response.get('data')
    if data is None:
        print('股票代码:', code, '可能有误')
        return pd.DataFrame(columns=columns)

    klines = data['klines']

    rows = []
    for _kline in klines:

        kline = _kline.split(',')
        rows.append(kline)

    df = pd.DataFrame(rows, columns=columns)

    return df


if __name__ == "__main__":
    # 股票代码列表
    codes = ['600519','300750']
    # 开始日期
    start_date = '20200101'
    # 结束日期
    end_date = '20201101'
    for code in codes:

        print(f'正在获取 {code} 从 {start_date} 到 {end_date} 的 k线数据......')
        # 根据股票代码、开始日期、结束日期获取指定股票代码指定日期区间的k线数据
        df = get_k_history(code, start_date, end_date)
        # 保存k线数据到表格里面
        df.to_csv(f'{code}.csv', encoding='utf-8-sig', index=None)
        print(f'股票代码:{code} 的 k线数据已保存到代码目录下的 {code}.csv 文件中')

示例代码 2 运行结果

  • 屏幕输出
正在获取 600519 从 20200101 到 20201101 的 k线数据......
股票代码:600519 的 k线数据已保存到代码目录下的 600519.csv 文件中
正在获取 300750 从 20200101 到 20201101 的 k线数据......
股票代码:300750 的 k线数据已保存到代码目录下的 300750.csv 文件中
  • 在代码运行目录生成两个csv文件
  • 表格内容展示(其中的一个表格)

写在最后

本篇文章展示了如何使用python获取并保存1只以及多只股票的历史日k线数据到表格文件中,当然代码不仅限于获取日k数据,诸如 5 分钟,1分钟等数据均是可以获取的,具体如何实现可以看代码里面的注释信息,这里不过多描述。实在搞不懂的可以私信我提供帮助。感谢大家阅读!

更加强大的版本在下面

顺手牵羊:免费、快速获取基金、股票、期货数据:基于我独立开发的 Python 库 efinance188 赞同 · 375 评论文章正在上传…重新上传取消

  • 11
    点赞
  • 53
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值