这篇文章的主要内容:
- Python基础操作
- Tushare pro中关于财报数据的function
规避调用次数的小技巧
虽然是第二篇文章了,但难度依然为零,依然适合Python初学者。
首先让我们按照惯例先吹一波米哥:tushare是国内现有的免费数据接口中,最好的股票/基金数据获取方式(让我们继续膜拜米哥,感谢大佬让我们的工作轻松了许多)。这篇文章的主要目的依然是介绍tushare的基本使用方法。
与上一篇文章不同,这次使用的是tushare pro的接口,旧版tushare的API已经停止维护了,不知道什么就会连不上。以后都会以pro接口为主,建议大家开始习惯使用pro。
本人的专业和技能偏数据分析方向,不是学习编程专业出身的专业人士,主要使用的软件是R,Python的编程水平有限,写的代码相比大神肯定存在低效和冗长问题,请大家见谅。
推荐的IDE和上次的文章一样,依然是Anaconda自带的Spyder。最近我终于明白了用Anaconda自带的pip安装tushare的方法,不会的同学可以在评论里留言或者想办法私信我。(以前都是通过安装包在C盘的路径里折腾了半天,远不如pip方便 = = )
下面正式开始看代码:
先读取包,pandas和numpy都是tushare的必备包,请记得读取。
额外读取了一个叫做time的包。用来绕开提取次数限制。
import numpy as np
import pandas as pd
import tushare as ts
import time
下面这段代码读取了沪深300成分股的基本信息而且设定了pro接口
hsdata = pd.read_excel("C:完整路径/hs300Basic.xlsx") #请在完整路径这里填上你自己的文件路径
pro = ts.pro_api('your token here') #tushare pro官网上注册自己的账号,成功之后就有了token
沪深300成分股基本信息的数据是我自己整合的,因为tushare对输入数据的要求会比较高,所以前期的数据整合是必不可少的。这部分数据最重要的就是股票代码以及它的格式。
新版的tushare pro对于提取数据有积分要求,具体要求详见tushare pro官网。(水积分也是我写文章的主要动力)
贴上整合后的数据样式: