毕业论文的内容是利用机器学习算法对次新股进行量化投资。进行该研究首当其冲就是要下载相关数据,再此记录一下我利用Tushare下载股票数据的过程,分享给大家。我只是Python的初学者,所以程序中难免有贻笑大方之处,希望各位大神指出不足之处,共同进步!
首先感谢Tushare平台,为在校学生提供免费的数据下载平台
1、初始化端口:
import tushare as ts
mytoken = 'tushare平台分配给用户的token'
ts.set_token(mytoken)
pro = ts.pro_api()
save_path = '数据保存路径'
2、确定股票池
本文下载次新股数据,次新股没有固定的定义,再此我暂定为发行时间超过1个月且不超过一年的股票。
假定需要2020-2021内发行的股票代码
pool = pro.stock_basic(exchange='',
list_status='L',
adj='qfq',
fields='ts_code,symbol,name,area,industry,list_date, market,exchange,is_hs')
stockpool=pool[pool.list_date>='20200101']
stockpool=stockpool[stockpool.list_date<='20210101']
3、下载股票数据
利用datetime来对股票数据进行筛选,得到上市后30天-360天的次新股数据:
Daily_basic 接口下载数据
import datetime