去年想研究日内高频交易,以为研究快照数据数据就是做高频,想在看来还是自己太菜了。温故尔知新,总结一下之前做的东西。
阅读了以下研报,并进行复现
《市场微观结构探析系列之二:订单簿上的 alpha》
《海通证券-选股因子系列研究(四十七):捕捉投资者的交易意愿》
《初探市场微观结构:指令单薄与指令单流》
《IF 市场微观结构特征分析之“庖丁解牛”》
《市场微观结构探析系列之二:订单簿上的 alpha》
原理:
若短期价格取决于当前多头需求量和空头供给量构建的均衡价格,那么盘口信息将是判断个股短期走势的重要依据。
方法:
构建了 Spread 指标以度量当前时间的盘口买卖挂单的强弱差异。
分别定义指标 BID、 ASK 度量买、 卖盘口所提供的流动性强弱:
定义本文的指标Spread_Tick以度量每个 Tick 时间点盘口买卖挂单的强弱差异:
结果:
评价: 以一个快照数据去预测N(5,10,20,40,100,200)后收益,似乎没有很强的逻辑关系。就好比一条河流,根据随意的一个横截面去预测后面水面高低。
《海通证券-选股因子系列研究(四十七):捕捉投资者的交易意愿》
原理:盘口委托快照数据包含买一至买十的委买量、卖一至卖十的委卖量、总委买量以及总委卖量,因此可考虑计算各时点间、各档位委买量以及委卖量的变化,并计算委买变化量与委卖变化量的差值,得到净委买变化量。若假定委买量的增加代表了投资者买入意愿的增强,而委卖量的增加代表了投资者卖出意愿的增强,那么可以认为净委买变化量体现了投资者买入意愿的变化。考虑到委托挂单的变化与股票本身股本有一定的关联,因此本文将净委买变化量除以股票流通股本,得到净委买变化率。
指标计算方法:
净委买变化率Tk,t率k,t,T为T日t至t+1时刻间,使用前k档数据计算得到的净委买变化率,净委买变化量Tk,t量k,t,T为T日t至t+1时刻间,使用前k档数据计算得到的净委买变化量,流通股本T本T为T日股票的流通股本,委买变化量Tj,t量j,tT为T日t至t+1时刻间,第j档委买的变化量,委卖变化量Tj,t量j,tT为T日t至t+1时刻间,第j档委卖的变化量
绘图:一分钟,研报中的净委买变化量net_bid与日内分时图
评价:相对于前一研报,使用区间的变化量。假设t至t+1时长为1分钟,就有20个快照数据。再用河流举例,20个横截面数据去预测后面水面位置。
《初探市场微观结构:指令单薄与指令单流》
快照数据价格发现功能:
分歧点主要是知情交易者采取何种方式将私有信息传递到价格。订单簿需求和供给的不平衡与未来短期收益是否具有显著的相关性。
成交量符号
成交量本身是没有符号的,目前主流的赋符号的方法主要是tick test 和Lee-Ready 算法:
2、Lee-Ready 算法
依赖于买卖中间价,当笔成交价高于上一笔中间价为+,反之为-,如果相等则再进行tick test,即比较当比价格与上一笔价格高低。
3、一些其他的算法(作者)
我们再介绍一个简单的算法:把成交量分为三类,成交价大于上一tick 卖一的,视作向上量,小于买一则视为向下量,如果在买一与卖一中间,则视为模糊的量,此时利用上一tick 成交价和卖一/买一的价格,分解成交量。即如下:
if close>=qofask[1] then
begin
//成交量计为正向主动攻击
end
else if close<=qofbid[1] then
begin
//成交量计为负向主动攻击
end
else if close<qofask[1] and close>qofbid[1] then
begin
if close>close[1] then
begin
//成交量按比例分解为主动正向攻击与被动正向攻击部分
end
else if close<close[1] then
begin
//成交量按比例分解为主动负向攻击与被动负向攻击部分
end
else if close=close[1] then
begin
//成交量按照qofask, qofbid, qofask[1], qofbid[1]关系进行分解
end;
end;
评价:算法1、2在美国市场产生,不适合A股。国内的数据是快照数据,算法3有缺陷。
举例:切片间隔时间为500ms的五档行情举例
(主动卖出3手)
(主动买入5手)
整个过程:03.200以4500价格主动卖盘3手,03.300以价格5000主动买盘5手,所以是正向主动攻击5(2)手。
按照算法3:正向主动攻击8手。
这种情况下,方向是正确的,但是量不对。
假设:03.200有以4500价格主动卖盘6手,03.300以价格5000主动买盘5手,所以是负向主动攻击6(1)手。
按照算法3:正向主动攻击11手。
这种情况下,方向不正确。
评价:由于存在新增挂单,撤单,所以根据快照数据和成交量不可能准确的计算出正的主动攻击量和负的主动攻击量。
《IF 市场微观结构特征分析之“庖丁解牛”》
(统计标的在N个相邻的快照数据的价格差分布规律,作为高频策略持仓最短周期的判断)
(订单不平衡和短期价格变化高度相关,买一量大于卖一量50手时,价格变化的期望值为上涨0.08.主要还是高频信号低频化,例如:统计一段时间内买一量大于卖一量50手时的次数)
(筛选大单,例如:统计特殊时段内大单出现次数)
特定形态下的快照数据分析
概述
1、对股票的日内分时图进行价格分段,选取波幅最大的波段,并选取波幅最小的波段作为对比。
2、分析特定波段起始时间内,快照数据的规律。
任务详述
- 日内分时图价格分段
1、对股票的日内分时图进行分段,统计。如图:
(红线:股票日内一分钟收盘价;蓝线:波段,由一个波段的低点和高点连接而成;绿线:柱状图,股票日内一分钟成交量)
2、将数据保存至表格
(price:价格;hl:高低点(高点标记为:1,低点标记为:-1);index:索引;time:时间;band:波幅)
3、波段筛选
选取band(波幅)最大的波段,记录下这个波段起始时间(开始时间和结束时间),起始时间的作用:用于对快照数据切片,分析这一特定时间内,快照数据的规律。选取band(波幅)最小的波段,记录下这个波段起始时间(开始时间和结束时间)。这样做的作用是用作对比
- 分析特定波段起始时间内,快照数据规律
1、快照数据中,价格和成交量的关系
(红线:价格;蓝线:成交量)
2、快照数据中,价格与(买一量减去卖一量)的关系
(红线:价格;蓝线:买一量减去卖一量)
3、快照数据中,价格与(加权委买量减去加权委卖量)的关系
(红线:价格;蓝线:加权委买量减去加权委卖量)
快照数据分析反思总结
1、快照数据并不等同tick数据,只是时间戳下的一个照相。
2、我上面的做法可以概括为:提出假设,分析数据,发现规律,制定策略。这种模式属于经验驱动型策略中数据挖掘的方式,这个对技术的要求很高,自己驾驭不了,在统计工具和数学知识方面都还不够。