量化交易入门

1.量化交易简介

1.1 量化交易系统的基本结构

在这里插入图片描述

  • 阿尔法模型用来预测宽客准备交易的金融产品未来的走势,从而获得投资回报;风险控制模型用来限制宽客的风险敞口规模;交易成本模型主要用来辅助为了构建投资组合而产生交易后所发生的成本;
  • 投资组合构建模型在追逐利润,限制风险和相关成本发生之间做出权衡给出最优的目标投资组合;
  • 执行模型通过交易将现有的投资组合转换成目标投资组合。

2.阿尔法模型

2.1 什么是阿尔法模型?
  • 根据传统定义,阿尔法是指扣除市场基准回报以后的投资回报,或者说仅仅由投资者决策所增加的或减少的那部分价值,用来度量投资者的水平。
  • 追求阿尔法回报的策略,本质上就是投资组合的资产配置及设置其头寸规模的择时决策,核心思想:没有永远好的金融产品也没有永远坏的金融产品,即趋势跟随策略,这个策略的关键因素就是决定何时持多以及何时持空。
  • 阿尔法模型就是用来构建预测并完成择时的软件系统,在一定范围内,在扣除偶尔犯错导致的风险损失和交易产生的成本之后,他都能通过预测来赚钱。
2.2 理论驱动型模型

从一些符合经济学理论的对市场的行为的解释出发,构建理论模型,然后检验理论是否可以成功预测未来。模型分类如下:
在这里插入图片描述

  • 基于价格相关数据的策略
    价格相关数据是指交易所发布的有关金融产品的价格信息或者诸如交易量的其他信息,来预测价格走势。

    • 趋势跟随
      a.基本定义:市场可能在一段时间内都会朝着一个方向运动。
      b.支持理论:1.市场参与者需要慢慢形成对金融产品产生价值的共识;2.博傻理论,人们本身就相信存在趋势,于是倾向于追涨杀跌,这种交易力量就形成了推动力。
      c.判断方式:我们可以用短周期跟长周期的移动平均线交叉,来判断趋势,当短周期位于长周期下方,市场出现下跌的趋势,反之,上升。
    • 均值回复
      a.基本定义:为了博取价格朝着与之前的趋势相反方向运动的机会
      b.支持理论:1.价格波动围绕着一个中心,我们能够识别出这个中心,也能判断出波动幅度,从而可以从中获利。价格短期的上抬也会提高未来在某个时间点被反转的概率
      c.好处:逆趋势交易向市场提供了流动性,降低了买卖价差。
      d.统计套利:相似的股票如果价格出现了偏离,那么最终会收敛回去。

    趋势跟随的优点一般在较长的投资期限里表现出来,而均值回复倾向于较短的投资期限。

  • 基于基本面数据的策略

    • 价值型/收益型
      a.金融产品的收益率(市盈率的倒数E/P)越高,价格越便宜。多数情况下,价值型投资意味着买入便宜的金融产品。基于对市场的风险的高估或低估,买入风险相对更高的资产。
      b.背后的思想:有时金融产品的回报会比基本面所暗含的回报更高。
      c.携带交易:同时买入价值相对低估的股票而卖出相对高估的股票;携带所得(安全边际):高收益与低收益的收益差;
      d.市净率:息税折旧前收益对企业价值的比率,是一个公允的衡量价值的共同因素;
      e.量化多空策略:交易者按照自己的喜好根据一组因素对股票进行排序,然后买入排序最高的股票,卖出排序最低的股票;这个操作的假设就是更高市净率的股票在接下来的时间会有更好的表现。
    • 成长型
      a.基本定义:根据历史上观测到的关于资产的某些变量的增长水平对未来进行预测。
      b.PEG比率:价格/盈利增长或者是市盈率/盈利增长率,只是一个度量增长的指标。
      c.解释:强势增长的公司,往往能从增长缓慢的竞争对手中夺得市场占有率。
    • 品质型
      a.在其他条件相同的情况下,持有高品质的金融产品是更好的选择,本金安全的重要性至上。
      b.关注资产负债率,低杠杆率的公司比高杠杆率的公司有更健康的财务状况;关注公司的盈利来源或者经济增长驱动力的多样性。
2.3 数据驱动模型
  • 可以通过一些数据分析的技术,通过数据预测出市场的走势。
  • 优势:
    1.数据挖掘在技术上更具有挑战性,门槛较高,竞争者比较少;
    2.数据驱动策略可以捕获一些潜在的市场行为
  • 缺点:
    1.需要确定输入模型的是什么样的数据,如果输入与预测之间没什么联系,那么模型就不适用。但是如果输入量太大,会导致计算量很大;
    2.这种策略依赖的是历史和未来的相似性,可能这种相似性并不能长久的存在,所以需要经常调整数据挖掘策略,以适应市场的变化。
    3.可信度检验,输入的噪声可能会将模型带入数据陷阱。
2.4 如何实施策略,实施策略需要确定的地方?
  • 预测目标:涨跌?涨幅?可信度?

  • 投资期限:高频交易(不超过当天收盘)<短线策略(一天到两周)<中线策略(数周到数月)<长线策略(数个月)

  • 投注结构:

    • 关注相对价值,通常比关注绝对价值有着更稳定的回报;
    • 通常选取一对可以直接比较的金融产品来配对交易,但很难找到能直接比较的配对;
    • 在更大的范围中投注,通过因素分离将证券分门类,并消除同组证券间的共同因素,专注于相对运动。分组方式可以按照直觉,基本面,或者数据的统计规律,也可以相互结合。
  • 投资范围

    • 金融产品所在的地域;
    • 资产类别;
    • 金融产品种类;

    流动性好的交易标的,交易成本可控;在富有流动性和发达的市场往往容易获得高质量数据;容易用系统化模型来预测 的金融产品。

  • 模型设置
    不同的策略定义会有不同的交易行为,所以需要明确定义,使模型精确化

  • 运行频率

    • 如果模型运行太频繁,将导致大量的交易,更高的交易成本;也使得依据毫无用处的噪声而建仓平仓的概率加大
    • 如果运行太少,那每一次订单的规模会很大,增加了交易成本;大规模订单有着较大的市场冲击;也会错失很多市场机会。
2.5 阿尔法因素的混合
  • 线性混合
    对每个阿尔法因素赋予权重,寻找最能解释金融产品历史行为的阿尔法因素的加权组合。在线性模型中,因素之间相互独立。
  • 非线性混合
    假设变量之间不是相互独立,也不是随时间一成不变。
    • 条件模型
      赋予某一因素的权重依赖于如何对其他因素的解释,当某些变量存在一致性,才会触发操作。
    • 旋转模型
      随着时间的推进,最近的数据用来确定新的权重,使得模型权重与当前市场条件接近,择时跟随。
  • 机器学习

3.风险控制模型

风险控制模型的意义在于控制可预测的敞口的规模,处理不可预测的敞口类型,回避可能引起损失或者不确定性的因素。

3.1 限制风险的大小
  • 通过约束或者惩罚来限制
    约束:严格的约束条件是通过硬约束限制风险;
    惩罚:理论驱动型方法通过设置,测试和调整约束边界,一直到产生一个可以接受的结果;
  • 如何度量风险的大小?
    纵向法:通过计算不同种类的金融产品的回报随着时间的推移的标准差,这个概念也叫作波动率,波动率越大,市场呈现的风险也越大;
    横向法:在给定的投资范围中,度量不同种类的产品之间的相似性。通过计算给定时间段内相关金融产品的横截面的标准差。标准差越大,波动行为越多样,意味着市场的风险越小;
  • 风险限制的应用
    • 可以限制单个头寸的大小或者一组头寸的大小;
    • 限制不同类型的风险的敞口规模(市值因素,市场因素);
    • 管理投资组合整体的财务杠杆的大小;
    • 风险价值模型:考虑一个投资组合敞口的市值,根据当前的波动率来预测这种投资组合的期望回报或损失能否在一个给定的置信区间。

3.2 限制风险的类型

  • 理论驱动型风险控制模型
    使用一套先前已定义的系统性风险(不可分散的风险),通过度量他们校准投资组合的敞口。
  • 经验型风险控制模型
    利用历史数据来决定这些风险是什么,并且判断一个给定的投资组合如何暴露于风险中

4. 交易成本模型

交易成本模型就是用来量化给定交易规模条件下所发生的交易成本,与阿尔法模型和风险控制模型,共同决定最优投资组合。

4.1 交易成本的定义
  • 佣金和费用
    支付给经纪人,交易所和监管者,因为他们给市场参与者提供了通道,提高交易的安全性和运作交易基础设施。基本上是固定的,占比很小。
  • 滑点
    交易者在决定交易开始到订单实际被执行的时间段之间的价格变化。有时是正向的,有时是反向的。
    • 滑点受时间间隔决定,趋势跟随策略对滑点比较敏感;均值回复趋向于承担较少的滑点。
    • 滑点也是金融产品波动率的函数。
  • 市场冲击(最重要)
    当交易者买入一种金融产品时,交易者订单可能会导致价格上涨;卖出,则价格下跌。订单规模比较小时,价格通常会在最优买卖价之间波动,大订单引起的波动是巨大的。
    • 市场冲击定义订单进入交易所到交易被执行时间段的价格差。
    • 影响因素:被执行订单规模;可以吸引订单的可获得的流动性的大小;金融产品的供求关系。
4.2 滑点跟市场冲击之间存在模糊
4.3 交易成本模型的类型

交易成本对交易规模的关系:

  • 常数交易成本模型:交易规模几乎永远相同,市场还能保持充足的流动性。
  • 线性交易成本模型:可能会在很小的交易规模下,过高估计成本;很大的交易规模下过低估计成本。
  • 分段线性交易成本模型
  • 二次型交易成本模型

5 投资组合构建模型

处理期望回报,风险控制,交易成本之间的平衡

5.1 基于规则的投资组合构建模型
  • 相等头寸权重
    信号强度足够强,则建立头寸,分配相等权重;否则忽略。
  • 相等风险权重
    依据头寸波动率或者其他风险度量反向调整头寸规模。
  • 阿尔法驱动的权重
    利用阿尔法模型,估计出信号强度,信号强度决定头寸规模,风险控制模型限制单个头寸的最大规模上限。
  • 决策树权重
    顺序计算,计算量很大,用的不多。
5.2 投资组合的最优化工具
  • 输入
    • 期望回报:阿尔法模型的结果包括期望回报或者期望方向
    • 期望波动率:用随机波动模型预测波动率,基本观点是波动率的高水平波动期紧随着低水平波动期,同时伴随着偶然的跳跃。换句话说,波动率经过相对平静的聚集期之后,将经历显著增大的聚集期,然后又归于平静,周而复始。
    • 期望相关性:相关性是衡量两个金融产品回报变动的相似性。使用相关性度量量化交易面临着很多问题,不同时期两个金融产品关系的度量值不稳定。
  • 优化技术
    • 布莱克-莱特曼方法
      通过使用投资者对涉及的各种不同金融产品的回报预测,来调整历史相关性。如果投资者对一些事情的预测更有信心,而在其他事情上的预测没那么可靠,那么可以结合历史相关性。
    • 格里诺德-卡恩方法:最优化因素投资组合
      建立一些因素投资组合,这些因素投资组合都基于规则,并且是基于一个阿尔法预测的单独的投资组合类型。通过在历史数据上模拟因素投资组合的回报时间序列最优化权重。
    • 重新取样的效率
      通过蒙特卡洛技术重采样数据样本,基于这些观测值产生大量的时间序列数据,降低模型对历史的依赖,从而提高鲁棒性。
    • 基于数据挖掘的最优化方法
      通过遗传算法或者有监督学习搜寻许多可能的投资组合并且视图找到表现最符合特征的那一个投资组合。
  • 输出
    投资者想要的每个头寸和各个头寸的目标规模。
5.3 相对阿尔法策略与绝对阿尔法策略的比较?

绝大多数采用基于规则的权重分配的宽客采用绝对阿尔法方法,采用最优化工具的人倾向于关注相对阿尔法方法。

  • 采用相对阿尔法策略的人相信金融产品之间关系的稳定性,如果关系不稳定,则策略注定失败。
  • 采用绝对阿尔法的人认为投资组合主要由独立的投注构成,因素相关性的信息不重要,所以会关注交易成本约束下的风险控制和阿尔法预测,通常采用基于规则的模型。

6 执行模型

6.1 订单执行算法
  • 有两类订单可以选择
    • 市价订单:一般是没有条件的,一定会满足
    • 限价订单:允许交易者控制他所愿意交易的最差价格,可能不会被满足
  • 限价订单簿:一个给定证券的所有可能的报买价订单和报卖价订单。
  • 优先级:最优的报买价或者报卖价>明订单优于暗订单>先到先得;
  • 积极和消极执行策略
    • 动量型的阿尔法策略与积极执行策略配对,均值回复型的与消极策略配对
    • 信号的强度以及模型对信号的置信度也会影响执行策略
  • 大订单和小订单
    大订单花费更多的成本,流动性需求会支付越来越贵的流动性效应。所以需要分散交易。
  • 明订单和暗订单
    明订单会被所有人看到,当一个金融产品的订单越来越多,价格上涨很快,会导致交易成本增加,买卖的失衡;暗订单不会被人看到,以牺牲优先权为代价,有助于打破买卖失衡。
  • 何处下单
    每个流动性池子最优价格不同,现在最优报买价和报卖价必须公开。
  • 撤销和重置订单
    如果订单未被完全执行,交易者可以撤销。快速撤销以测试市场对流动性深度变化的反应。也会被交易所惩罚。
6.2 高频交易

以微小,短期,高概率投注为特征

  • 鲨鱼策略
    通过发送一系列小订单侦测隐藏的冰山大订单,小订单提交优于冰山大订单价格的明订单来促使冰山推高价格以满足余下的未执行的交易,同时鲨鱼保持相对于冰山较高的报买价依附在冰山上,这样会存在一个快速的相对无风险的利润头寸。
  • 利用机器学习识别市场中其他交易者的订单模式。短时间的交易行为,数据量大,模式也比较稳定。
6.3 交易基础设施
  • 直接市场通道:使用经纪人的服务和通过他们递交订单到各种不同的流动性池子。
  • 同地结点:尽量让交易服务器的地理位置接近交易所,降低通信延迟,适用于高频交易。
  • FIX协议:各种市场参与者在交易过程中进行通信的标准。引擎开源,对于高频交易,往往特色化定制。
  • 使用一个有效率的软硬件平台,比如Linux系统

7. 数据

7.1 数据的类型
  • 价格相关数据:比如金融产品的价格或者各种指数的变化率,交易量,每笔成交的时间和规模,整个订单簿等
  • 基本面数据:除了价格相关数据以外的数据,有助于判断金融产品现在的状况和未来的价格。比如财务稳健状况,财务绩效,价值,情绪等

价格相关数据倾向于关注更短的时间尺度,而基本面数据倾向于关注更长的时间尺度。

7.2 数据的来源
  • 一手的数据获取比较有难度
  • 第三方数据供应商
7.3 数据的整理
  • 数据的缺失,解决方法
    • 建立一个能够识别数据缺失的系统,设置缺失数据为未知
    • 插入一个可以替代缺失值的合理值
  • 数据存在错误值
    • 奇点过滤器:寻找异常的数据,进行平滑或消除
    • 交叉检查不同数据源提供的数据
    • 可能是公司行为的信息未更新,需要独立的跟踪公司行为。
    • 错误的交易时间记录,实时存储数据,从而跟踪校对接收到的时间序列跟存储的时间序列的一致性
    • 前视偏差:在昨天之前得到了昨天的信息
      • 来源于数据的异步性。处理方法:当有新信息到来时,记录下来,在合适的时机对数据进行检验。在数据中参入人为的滞后因素。
      • 来源于市场的异步性,世界上各个市场有着不同的收盘时间。
7.4 数据的储存
  • 指针型平面文件夹,即虚拟的二维表
  • 关系型数据库,典型代表是数据立方体,第一维表示所有的金融产品,第二维表示给定属性的值,第三位表示其他属性。
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值