所用方法的原因和简要背景
流动性市场的大量参与者,他们在经营时会基于不同的投资期限,这便产生了很多市场噪音。 因此,市场的信噪比较低。 尝试整数型时间序列差分能令情况恶化,其会消除残余记忆,并将报价转换为以平稳性为特征的序列。 价格序列有记忆性,因为每个数值都建立在具有悠久历史的价位之上。 时间序列变换,例如增量对数,会裁剪记忆,因为它们是基于有限的窗口长度来创建的。 当转换平稳地消除市场记忆时,统计学家使用复杂的数学方法来提取残余的记忆。 这就是为什么许多相关的经典统计方法会导致虚假的结果。 长期依赖的概念 长期依赖(LRD),也称为长期记忆或长期持续,是一种分析金融时间序列时可能出现的现象。 它可表示为两个价格之间的统计依赖性的衰减率随时间间隔(或它们之间的距离)的增加而增加。 当依赖性衰减慢于指数衰减时,这种现象则被认为具有长期依赖性。 长期依赖通常也与自相似过程相关。 有关 LRD(长期依赖)的详情,请参阅维基百科文章。 平稳性和记忆存在的问题
价格图表的一个共同特征是非平稳性:它们有很长的价位历史,随时间的推移平均价格会改变。 为了进行统计分析,研究人员需要处理价格增量(或增量的对数),盈利能力或波动性的变化。 这些变换可从价格序列中消除记忆,令时间序列更加平稳。 虽然平稳性是统计结论的必要属性,但并非总需要消除整个记忆,因为记忆是预测模型的基础属性。 例如,均衡(平稳)模型必须包含一些记忆,以便能够评估价格偏离其预期价值的程度。
问题在于价格增量是固定的,但不包含过去的记忆,而价格序列包含全部数量的可用记忆,但它是非稳定性的。 问题出现了:如何差分时间序列令其平稳,同时最大程度地保留可能记忆。 因此,赫兹股票量化理应概括价格增量的概念,以便研究平稳性系列,其中并非所有记忆都被消除。 在这种情况下,比之其他可用方法,价格增量不是价格变换的最优解。
为此,将引入分数型差分的概念。 两个极端之间存在广泛的可能性:单一和零差分。 在一侧来看,它们是完全不同的价格。 从另一侧来看,价格没有任何差别。
分数型差分的应用范围足够广泛。 例如,差分序列通常作为机器学习算法的输入。 问题是,必须在机器学习模型可识别的前提下,显示相应历史阶段的新数据。 在非平稳序列的情况下,由于模型可能地错误操作,新数据也许位于已知数值范围之外。
分数型差分的历史
在各种科技文献中论述的几乎所有用于分析和预测金融时间序列的方法,都提出了整数型差分的概念。 在这方面会出现以下问题:
-
为什么整数型差分(例如,单位滞后)是最优的?
-
这种过度差分是不是经济理论容易产生有效市场假设的原因之一&