| 来源:交易极客
量化投资模型的开发步骤一般是:数据处理、寻找因子、回测验证、实盘模拟、风险归因。
数据处理:去极值、标准化、中性化;数据预处理。
寻找因子:寻找Alpha;寻找收益波动比因子
风险归因:简单策略归因,大家有时间可以慢慢研究
其实,除模型开发之外,交易系统的构建、回测系统、风控和数据清理等每个部分都很关键。比如数据处理,你用的工具是Matlab还是R,或者c++以及python,如果是工具本身的格式速度会快很多,就像python的npy格式,或者c++的二进制格式。再有就是根据你的不同需求用什么数据,切片数据、分钟数据或者tick数据。每一块都可以是一个坑。
而量化的模型大致可分为:
1.趋势形、回复型,都依赖价格数据。
2.价值型/收益型、成长型和品质型,此类型策略都基于基本面数据。
3.技术情绪型,较少见,通常都只作为一个辅助因子。
趋势跟随策略
趋势跟随策略是基于以下的基本假定:市场在一定时间里通常朝着同一方向变化,据此对市场趋势做出判断,就可以作为制定交易策略的依据。定义趋势通常用移动平均线交叉来定义趋势。
MACD移动平均线示例
MACD(Moving Average Convergence and Divergence)是Geral Appel 于1979年提出的,利用收盘价的短期(常用为12日)指数移动平均线与长期(常用为26日)指数移动平均线之间的聚合与分离状况,对买进、卖出时机作出研判的技术指标。从双移动平均线发展而来的,由快的移动平均线减去慢的移动平均线。MACD的意义和双移动平均线基本相同。但阅读起来更方便。
指标应用法则:
1.DIF向上交叉MACD,买进;DIF向下交叉MACD,卖出。
2.DIF连续两次向下交叉MACD,将造成较大的跌幅。
3.DIF连续两次向上交叉MACD,将造成较大的涨幅。
4.DIF与股价形成背离时产生的信号,可信度较高。
5.MDA、MACD、TRIX三者构成一组指标群,互相验证。
当MACD从负数转向正数,是买的信号。当MACD从正数转向负数,是卖的信号。当MACD以大角度变化,表示快的移动平均线和慢的移动平均线的差距非常迅速的拉开,代表了一个市场大趋势的转变。MACD是Geral Appel 于1979年提出的,它是一项利用短期(常用为12日)移动平均线与长期(常用为26日)移动平均线之间的聚合与分离状况,对买进、卖出时机作出研判的技术指标。
公式算法:
短期EMA:短期(例如12日)的收盘价指数移动平均值(Exponential Moving Average)
长期EMA:长期(例如26日)的收盘价指数移动平均值(Exponential Moving Average)
DIF线: (Difference)短期EMA和长期EMA的离差值
DEA线: (Difference Exponential Average)DIF线的M日指数平滑移动平均线
MACD线: DIF线与DEA线的差
参数:SHORT(短期)、LONG(长期)、M天数,一般为12、26、9。指数加权平滑系数为:
短期EMA平滑系数:2/(SHORT+1)
长期EMA平滑系数:2/(LONG+1)
DEA线平滑系数:2/(M+1)
DIF从下而上穿过DEA,买进;
相反,如DIF从上往下穿过DEA,卖出。
mport quartz
import quartz.backtest as qb
import quartz.performance as qp
from quartz.api import *
import pandas as pd
import numpy as np
from datetime import datetime
from matplotlib import pylab
import talib
start = datetime(2013, 1, 1)
end = datetime(2015, 1, 22)
benchmark = 'HS300'
#universe = ['601398.XSHG', '600028.XSHG', '601988.XSHG', '600036.XSHG', '600030.XSHG',
#'601318.XSHG', '600000.XSHG', '600019.XSHG', '600519.XSHG', '601166.XSHG']
universe = set_universe('SH50')
capital_base = 200000
refresh_rate = 1
window = 1
initMACD = -10000.0
histMACD = pd.DataFrame(initMACD, index = universe, columns = ['preShortEMA', 'preLongEMA', 'preDIF', 'preDEA'])
shortWin = 26 # 短期EMA平滑天数
longWin = 52 # 长期EMA平滑天数
macdWin = 15 # DEA线平滑天数
def initialize(account):
account.amount = 10000
account.universe = universe
add_history('hist', window)
account.days = 0
def handle_data(account):
account.days = account.days+1
for stk in account.universe:
prices = account.hist[stk]['closePrice']
if prices is None:
return
preShortEMA = histMACD.at[stk, 'preShortEMA']
preLongEMA = histMACD.at[stk, 'preLongEMA']
preDIF = histMACD.at[stk, 'preDIF']
preDEA = histMACD.at[stk, 'preDEA']
if preShortEMA == initMACD or preLongEMA == initMACD:
histMACD.at[stk, 'preShortEMA'] = prices[-1]
histMACD.at[stk, 'preLongEMA'] = prices[-1]
histMACD.at[stk, 'preDIF'] = 0
histMACD.at[stk, 'preDEA'] = 0
return
shortEMA = preShortEMA*1.0*(shortWin-1)/(shortWin+1) + prices[-1]*2.0/(shortWin+1)
longEMA = preLongEMA*1.0*(longWin-1)/(longWin+1) + prices[-1]*2.0/(longWin+1)
DIF = shortEMA - longEMA
DEA = preDEA*1.0*(macdWin-1)/(macdWin+1) + DIF*2.0/(macdWin+1)
histMACD.at[stk, 'preShortEMA'] = shortEMA
histMACD.at[stk, 'preLongEMA'] = longEMA
histMACD.at[stk, 'preDIF'] = DIF
histMACD.at[stk, 'preDEA'] = DEA
if account.days > longWin and account.days%1 == 0:
#if DIF > 0 and DEA > 0 and preDIF > preDEA and DIF < DEA:
if preDIF > preDEA and DIF < DEA:
order_to(stk, 0)
#if DIF < 0 and DEA < 0 and preDIF < preDEA and DIF > DEA:
if preDIF < preDEA and DIF > DEA:
amount = account.amount/prices[-1]
order_to(stk, amount)
上证指数上的MACD线指标实例:
from CAL.PyCAL import *
# DataAPI.MktIdxdGet返回pandas.DataFrame格式
sh_index = DataAPI.MktIdxdGet(indexID = "000001.ZICN", beginDate = "20140101", endDate = "20140731")
# calculate DIF, DEA, and MACD
initMACD = -1000.0
sh_index['shortEMA'] = initMACD
sh_index['longEMA'] = initMACD
sh_index['DIF'] = initMACD
sh_index['DEA'] = initMACD
sh_index['MACD'] = initMACD
shortWin = 12
longWin = 26
macdWin = 9
index = sh_index.index
for i in range(0, index.shape[0]):
if i == 0:
sh_index['shortEMA'].iloc[i] = sh_index['closeIndex'].iloc[i]
sh_index['longEMA'].iloc[i] = sh_index['closeIndex'].iloc[i]
sh_index['DIF'].iloc[i] = sh_index['shortEMA'].iloc[i] - sh_index['longEMA'].iloc[i]
sh_index['DEA'].iloc[i] = sh_index['DIF'].iloc[i]
sh_index['MACD'].iloc[i] = sh_index['DIF'].iloc[i] - sh_index['DEA'].iloc[i]
else:
sh_index['shortEMA'].iloc[i] = sh_index['closeIndex'].iloc[i]*2.0/(shortWin+1) + sh_index['shortEMA'].iloc[i-1]*(shortWin-1)/(shortWin+1)
sh_index['longEMA'].iloc[i] = sh_index['closeIndex'].iloc[i]*2.0/(longWin+1) + sh_index['longEMA'].iloc[i-1]*(longWin-1)/(longWin+1)
sh_index['DIF'].iloc[i] = sh_index['shortEMA'].iloc[i] - sh_index['longEMA'].iloc[i]
sh_index['DEA'].iloc[i] = sh_index['DIF'].iloc[i]*2.0/(macdWin+1) + sh_index['DIF'].iloc[i-1]*(macdWin-1)/(macdWin+1)
sh_index['MACD'].iloc[i] = sh_index['DIF'].iloc[i] - sh_index['DEA'].iloc[i]
sh_index = sh_index.set_index('tradeDate')
# plot data
pylab.figure(figsize=(15,6))
pylab.plot(sh_index.index, sh_index.closeIndex)
pylab.plot(sh_index.index, sh_index.longEMA)
pylab.plot(sh_index.index, sh_index.shortEMA)
pylab.legend([u'ShangZheng Index', u'long period EMA', u'short period EMA'], loc = 'best', fontsize = 12)
pylab.grid()
pylab.figure(figsize=(15,6))
pylab.plot(sh_index.index, sh_index.DIF)
pylab.plot(sh_index.index, sh_index.DEA)
pylab.plot(sh_index.index, sh_index.MACD)
pylab.legend([u'DIF line', u'DEA line', u'MACD signal'], loc = 'best', fontsize = 12)
pylab.grid()
拓展阅读: