多因子量化投资模型策略深度研究

| 来源:交易极客

量化投资模型的开发步骤一般是:数据处理、寻找因子、回测验证、实盘模拟、风险归因。

数据处理:去极值、标准化、中性化;数据预处理。

寻找因子:寻找Alpha;寻找收益波动比因子

 

风险归因:简单策略归因,大家有时间可以慢慢研究

其实,除模型开发之外,交易系统的构建、回测系统、风控和数据清理等每个部分都很关键。比如数据处理,你用的工具是Matlab还是R,或者c++以及python,如果是工具本身的格式速度会快很多,就像python的npy格式,或者c++的二进制格式。再有就是根据你的不同需求用什么数据,切片数据、分钟数据或者tick数据。每一块都可以是一个坑。

而量化的模型大致可分为:

1.趋势形、回复型,都依赖价格数据。

2.价值型/收益型、成长型和品质型,此类型策略都基于基本面数据。

 3.技术情绪型,较少见,通常都只作为一个辅助因子。

趋势跟随策略

趋势跟随策略是基于以下的基本假定:市场在一定时间里通常朝着同一方向变化,据此对市场趋势做出判断,就可以作为制定交易策略的依据。定义趋势通常用移动平均线交叉来定义趋势。

MACD移动平均线示例

MACD(Moving Average Convergence and Divergence)是Geral Appel 于1979年提出的,利用收盘价的短期(常用为12日)指数移动平均线与长期(常用为26日)指数移动平均线之间的聚合与分离状况,对买进、卖出时机作出研判的技术指标。从双移动平均线发展而来的,由快的移动平均线减去慢的移动平均线。MACD的意义和双移动平均线基本相同。但阅读起来更方便。

指标应用法则:

  1.DIF向上交叉MACD,买进;DIF向下交叉MACD,卖出。

  2.DIF连续两次向下交叉MACD,将造成较大的跌幅。

  3.DIF连续两次向上交叉MACD,将造成较大的涨幅。

  4.DIF与股价形成背离时产生的信号,可信度较高。

  5.MDA、MACD、TRIX三者构成一组指标群,互相验证。

当MACD从负数转向正数,是买的信号。当MACD从正数转向负数,是卖的信号。当MACD以大角度变化,表示快的移动平均线和慢的移动平均线的差距非常迅速的拉开,代表了一个市场大趋势的转变。MACD是Geral Appel 于1979年提出的,它是一项利用短期(常用为12日)移动平均线与长期(常用为26日)移动平均线之间的聚合与分离状况,对买进、卖出时机作出研判的技术指标。

公式算法:

短期EMA:短期(例如12日)的收盘价指数移动平均值(Exponential Moving Average)

长期EMA:长期(例如26日)的收盘价指数移动平均值(Exponential Moving Average)

DIF线: (Difference)短期EMA和长期EMA的离差值

DEA线: (Difference Exponential Average)DIF线的M日指数平滑移动平均线

MACD线: DIF线与DEA线的差

参数:SHORT(短期)、LONG(长期)、M天数,一般为12、26、9。指数加权平滑系数为:

短期EMA平滑系数:2/(SHORT+1)

长期EMA平滑系数:2/(LONG+1)

DEA线平滑系数:2/(M+1)

DIF从下而上穿过DEA,买进;

相反,如DIF从上往下穿过DEA,卖出。

mport quartz
import quartz.backtest    as qb
import quartz.performance as qp
from   quartz.api         import *

import pandas as pd
import numpy  as np
from datetime   import datetime
from matplotlib import pylab

import talib



start = datetime(2013, 1, 1)
end = datetime(2015, 1, 22)
benchmark = 'HS300'
#universe = ['601398.XSHG', '600028.XSHG', '601988.XSHG', '600036.XSHG', '600030.XSHG',
           #'601318.XSHG', '600000.XSHG', '600019.XSHG', '600519.XSHG', '601166.XSHG']
universe = set_universe('SH50')
capital_base = 200000
refresh_rate = 1
window = 1

initMACD = -10000.0
histMACD = pd.DataFrame(initMACD, index = universe, columns = ['preShortEMA', 'preLongEMA', 'preDIF', 'preDEA'])
shortWin = 26    # 短期EMA平滑天数
longWin  = 52    # 长期EMA平滑天数
macdWin  = 15    # DEA线平滑天数

def initialize(account):
   account.amount = 10000
   account.universe = universe
   add_history('hist', window)
   account.days = 0
   
def handle_data(account):
   account.days = account.days+1
   
   for stk in account.universe:
       prices = account.hist[stk]['closePrice']
       if prices is None:
           return
       
       preShortEMA = histMACD.at[stk, 'preShortEMA']
       preLongEMA = histMACD.at[stk, 'preLongEMA']
       preDIF = histMACD.at[stk, 'preDIF']
       preDEA = histMACD.at[stk, 'preDEA']
       if preShortEMA == initMACD or preLongEMA == initMACD:
           histMACD.at[stk, 'preShortEMA'] = prices[-1]
           histMACD.at[stk, 'preLongEMA'] = prices[-1]
           histMACD.at[stk, 'preDIF'] = 0
           histMACD.at[stk, 'preDEA'] = 0
           return
           
       shortEMA = preShortEMA*1.0*(shortWin-1)/(shortWin+1) + prices[-1]*2.0/(shortWin+1)
       longEMA = preLongEMA*1.0*(longWin-1)/(longWin+1) + prices[-1]*2.0/(longWin+1)
       DIF = shortEMA - longEMA
       DEA = preDEA*1.0*(macdWin-1)/(macdWin+1) + DIF*2.0/(macdWin+1)
       
       histMACD.at[stk, 'preShortEMA'] = shortEMA
       histMACD.at[stk, 'preLongEMA'] = longEMA
       histMACD.at[stk, 'preDIF'] = DIF
       histMACD.at[stk, 'preDEA'] = DEA
           
       if account.days > longWin and account.days%1 == 0:
           #if DIF > 0 and DEA > 0 and preDIF > preDEA and DIF < DEA:
           if preDIF > preDEA and DIF < DEA:
               order_to(stk, 0)
           #if DIF < 0 and DEA < 0 and preDIF < preDEA and DIF > DEA:
           if preDIF < preDEA and DIF > DEA:
               amount = account.amount/prices[-1]
               order_to(stk, amount)


上证指数上的MACD线指标实例:





from CAL.PyCAL import *

# DataAPI.MktIdxdGet返回pandas.DataFrame格式
sh_index =  DataAPI.MktIdxdGet(indexID = "000001.ZICN", beginDate = "20140101", endDate = "20140731")

# calculate DIF, DEA, and MACD
initMACD = -1000.0
sh_index['shortEMA'] = initMACD
sh_index['longEMA']  = initMACD
sh_index['DIF']     = initMACD
sh_index['DEA']  = initMACD
sh_index['MACD']     = initMACD

shortWin = 12
longWin  = 26
macdWin  = 9

index = sh_index.index

for i in range(0, index.shape[0]):
   if i == 0:
       sh_index['shortEMA'].iloc[i] = sh_index['closeIndex'].iloc[i]
       sh_index['longEMA'].iloc[i]  = sh_index['closeIndex'].iloc[i]
       sh_index['DIF'].iloc[i]     = sh_index['shortEMA'].iloc[i] - sh_index['longEMA'].iloc[i]
       sh_index['DEA'].iloc[i]  = sh_index['DIF'].iloc[i]
       sh_index['MACD'].iloc[i]  = sh_index['DIF'].iloc[i] - sh_index['DEA'].iloc[i]
   else:
       sh_index['shortEMA'].iloc[i] = sh_index['closeIndex'].iloc[i]*2.0/(shortWin+1) + sh_index['shortEMA'].iloc[i-1]*(shortWin-1)/(shortWin+1)
       sh_index['longEMA'].iloc[i]  = sh_index['closeIndex'].iloc[i]*2.0/(longWin+1) + sh_index['longEMA'].iloc[i-1]*(longWin-1)/(longWin+1)
       sh_index['DIF'].iloc[i]     = sh_index['shortEMA'].iloc[i] - sh_index['longEMA'].iloc[i]
       sh_index['DEA'].iloc[i]  = sh_index['DIF'].iloc[i]*2.0/(macdWin+1) + sh_index['DIF'].iloc[i-1]*(macdWin-1)/(macdWin+1)
       sh_index['MACD'].iloc[i]  = sh_index['DIF'].iloc[i] - sh_index['DEA'].iloc[i]

sh_index = sh_index.set_index('tradeDate')

# plot data
pylab.figure(figsize=(15,6))
pylab.plot(sh_index.index, sh_index.closeIndex)
pylab.plot(sh_index.index, sh_index.longEMA)
pylab.plot(sh_index.index, sh_index.shortEMA)
pylab.legend([u'ShangZheng Index', u'long period EMA', u'short period EMA'], loc = 'best', fontsize = 12)
pylab.grid()

pylab.figure(figsize=(15,6))
pylab.plot(sh_index.index, sh_index.DIF)
pylab.plot(sh_index.index, sh_index.DEA)
pylab.plot(sh_index.index, sh_index.MACD)
pylab.legend([u'DIF line', u'DEA line', u'MACD signal'], loc = 'best', fontsize = 12)
pylab.grid()

拓展阅读:

1.一个量化策略师的自白(好文强烈推荐)

2.市面上经典的量化交易策略都在这里了!(源码)

3.期货/股票数据大全查询(历史/实时/Tick/财务等)

4.干货| 量化金融经典理论、重要模型、发展简史大全

5.从量化到高频交易,不可不读的五本书

6.高频交易四大派系大揭秘

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值