—— 本篇文章 by 丁智
数据服务:使用聚宽jqdatasdk获取分钟数据按vnpy的Bar格式导入至mongodb中
提供downloadAllMinuteBar(),可以通过定时任务的形式,按vnpy的数据格式,每日获取分钟数据写入到mongodb当中
提供downloadMinuteBarByDate,可以输入开始日期与结束日期,将时间段内的分钟数据写入到mongodb当中
在config文件中配置jqdatasdk的用户名密码
每日增量数据获取(作为数据服务,每日自动运行,将当日的增量数据插入到数据库中):
#----------------------------------------------------------------------
# 当日数据下载,定时任务使用
def downloadAllMinuteBar():
jqdatasdk.auth(JQDATA_USER, JQDATA_PASSWORD)
"""下载所有配置中的合约的分钟线数据"""
print('-' * 50)
print(u'开始下载合约分钟线数据')
print('-' * 50)
today = datetime.today().date()
trade_date_list = jqdatasdk.get_trade_days(end_date=today, count=2)
symbols_df = jqdatasdk.get_all_securities(types=['futures'], date=today)
for index, row in symbols_df.iterrows():
downMinuteBarBySymbol(index, row, str(today), str(trade_date_list[-2]))
print('-' * 50)
print(u'合约分钟线数据下载完成')
print('-' * 50)
return
某段时间内的全量数据(为了补全某一段时间的全量数据进行使用):
#----------------------------------------------------------------------
# 按日期一次性补全数据
def downloadMinuteBarByDate(start_date, end_date=datetime.today().date()):
jqdatasdk.auth(JQDATA_USER, JQDATA_PASSWORD)
"""下载所有配置中的合约的分钟线数据"""
print('-' * 50)
print(u'开始下载合约分钟线数据')
print('-' * 50)
trade_date_list = jqdatasdk.get_trade_days(start_date=start_date, end_date=end_date)
i = 0
for trade_date in trade_date_list:
if i == 0:
i = 1
continue
symbols_df = jqdatasdk.get_all_securities(types=['futures'], date=trade_date)
for index, row in symbols_df.iterrows():
downMinuteBarBySymbol(index, row, str(trade_date_list[i]), str(trade_date_list[i-1]))
i += 1
print('-' * 50)
print(u'合约分钟线数据下载完成')
print('-' * 50)
return
具体合约当日的数据下载函数与vnpy的Bar类型数据的生成插入数据库的过程:
#----------------------------------------------------------------------
def generateVtBar(symbol, time, d):
"""生成K线"""
bar = VtBarData()
bar.vtSymbol = symbol
bar.symbol = symbol
bar.open = float(d['open'])
bar.high = float(d['high'])
bar.low = float(d['low'])
bar.close = float(d['close'])
bar.date = datetime.strptime(time[0:10], '%Y-%m-%d').strftime('%Y%m%d')
bar.time = time[11:]
bar.datetime = datetime.strptime(bar.date + ' ' + bar.time, '%Y%m%d %H:%M:%S')
bar.volume = d['volume']
return bar
#----------------------------------------------------------------------
def downMinuteBarBySymbol(symbol, info, today, pre_trade_day):
start = time()
symbol_name = info['name']
cl = db[symbol_name]
cl.ensure_index([('datetime', ASCENDING)], unique=True) # 添加索引
# 在此时间段内可以获取期货夜盘数据
minute_df = jqdatasdk.get_price(symbol, start_date=pre_trade_day + " 20:30:00",end_date=today + " 20:30:00", frequency='minute')
# 将数据传入到数据队列当中
for index, row in minute_df.iterrows():
bar = generateVtBar(symbol_name, str(index), row)
d = bar.__dict__
flt = {'datetime': bar.datetime}
cl.replace_one(flt, d, True)
e = time()
cost = (e - start) * 1000
print(u'合约%s数据下载完成%s - %s,耗时%s毫秒' % (symbol_name, pre_trade_day, today, cost))
vnpy中提供了好几个数据服务的实现,功能也比较简单,但是能有不错的功效,聚宽的jqdatasdk也提供了很好的数据服务,十分有利于建立本地的体系。
Github: