前言
从股票市场开始到现在,已经研究出了众多的指标,但是在使用的时候会发现,由于第二天股价的未知波动,指标显示的情况并不一定每次都准确,总是会存在误判的情况。对于这种不可避免的情况而言,我们只能想办法将其量化、计算根据策略操作后的收益率、估计误判的概率等
本文先选择了 DMA、DMI、MACD、KDJ、BOLL 五种指标来量化(一共会考虑了三十多种指标,由于篇幅问题一次讨论五种),然后用十支股票来测试这五种策略的效果(实际情况是用了 3600+ 股票来统计策略效果,目前不方便展示结果)
免责声明
此构想和分析中的任何内容均不应解释为投资建议,过去的表现并不一定表示未来的结果。
数据准备
选择了 600519 贵州茅台、600031 三一重工、002594 比亚迪、601633 长城汽车、002074 国轩高科、300750 宁德时代、300014 亿纬锂能、000591 太阳能、002475 立讯精密、600862 中航高科 这十支股票 2020年1月1日 ~ 2021年1月15日 的数据来测试
部分代码片段
import pandas_datareader.data as web
import datetime
start = datetime.datetime(2020, 1, 1)
end = datetime.datetime(2021, 1, 15)
df = web.DataReader(ticker, "yahoo", start, end)
指标介绍
DMA指标
_ma是移动平均线的计算函数
def dma(df, n=10, m=50, k=10):
_dma = pd.DataFrame()
_dma['date'] = df['date']
_dma['ddd'] = _ma(df.close, n) - _ma(df.close, m)
_dma['ama'] = _ma(_dma.ddd, k)
return _dma
DMI指标
def dmi(df, n=14, m=6):
tr = pd.Series(np.vstack([df.high - df.low, (df.high - df.close.shift()).abs(),
(df.low - df.close.shift()).abs()]).max(axis=0), index=df.index)
trz = tr.rolling(n).sum()
_m = pd.DataFrame()
_m['hd'] = df.high - df.high.shift()
_m['ld'] = df.low.shift() - df.low
_m['mp'] = _m.apply(lambda x: x.hd if x.hd > 0 and x.hd > x.ld else 0, axis=1)
_m['mm'] = _m.apply(lambda x: x.ld if x.ld > 0 and x.hd < x.ld else 0, axis=1)
_m['dmp'] = _m.mp.rolling(n).sum()
_m['dmm'] = _m.mm.rolling(n).sum()
_dmi = pd.DataFrame()
_dmi['date'] = df.date
_dmi['pdi'] = 100 * _m.dmp.div(trz)
_dmi['mdi'] = 100 * _m.dmm.div(trz)
_dmi['adx'] = _ma((_dmi.mdi - _dmi.pdi).abs() / (_dmi.mdi + _dmi.pdi) * 100, m)
_dmi['adxr'] = (_dmi.adx + _dmi.adx.shift(m)) / 2
_dmi.set_index(df.index)
return _dmi
MACD指标
_ema是指数移动平均线的计算函数
def macd(df, n=12, m=26, k=9):
_macd = pd.DataFrame()
_macd['date'] = df['date']
_macd['diff'] = _ema(df.close, n) - _ema(df.close, m)
_macd['dea'] = _ema(_macd['diff'], k)
_macd['macd'] = _macd['diff'] - _macd['dea']
return _macd
KDJ指标
sma是平滑移动指标的计算函数
def kdj(df, n=9):
_kdj = pd.DataFrame()
_kdj['date'] = df['date']
rsv = (df.close - df.low.rolling(n).min()) / (df.high.rolling(n).max() - df.low.rolling(n).min()) * 100
_kdj['k'] = sma(rsv, 3)
_kdj['d'] = sma(_kdj.k, 3)
_kdj['j'] = 3 * _kdj.k - 2 * _kdj.d
return _kdj
BOLL指标
_md是标准差的计算函数
def boll(df, n=26, k=2):
_boll = pd.DataFrame()
_boll['date'] = df.date
_boll['mid'] = _ma(df.close, n)
_mdd = _md(df.close, n)
_boll['up_line'] = _boll.mid + k * _mdd
_boll['low_line'] = _boll.mid - k * _mdd
return _boll
最后的量化结果
由于篇幅和展示不便,不在文章中展示可视化的买入卖出点位以及资金变动曲线
为了最简洁的了解策略效果,初始资金设置为10000元,并且为了简便不考虑必须整手买入的限制,每次都10000元全部买入,测试五种指标策略效果的同时测试2020.1.1买入并持有到2021.1.15的策略,比较最后资金多少来衡量策略效果
HOLD行是表示2020.1.1买入并持有到2021.1.15的策略最后的资金
数据可视化在这里不作展示,有数据后可以按照自己的习惯绘图制表;更多的评估数据也不作展示
结果中很多策略最后的收益都不如一直持有的收益高,但是策略没有持股的时候作为交易员当然会寻找新的机会,创造收益!