量化交易基础 - 011 - 样本外检验

11 - 样本外检验

样本外检验(out-of-sample testing)是检验流程中的第二部分,是告知研究员去除样本内检验中那些虚拟表格(cheat sheet)的帮助后,策略在实际中是否起作用。

许多宽客使用的另一个统计量是样本外检验的R2与样本内检验的R2的比值。这个比率是度量模型鲁棒性的另一种方法。如果样本外检验的R2与样本内检验的R2相当接近(即,如果比率大于等于0.5),则被认为是一个好的模型。如果比值显著小,研究者必须对模型的成功应用持怀疑态度。

最简单的方法是使用除去样本内检验数据的剩下部分进行检验。一些研究员使用滚动样本外数据的方法(rolling out-of-sample technique),在这种方法中,最古老的数据点将会被丢弃,最新的数据点被用来拟合(样本内)和检验(样本外)模型。另一种方法是可以使用不断增长的数据窗口,随着时间不断改变,更多的数据被收集,样本外检验将持续进行。

新的有趣的事情会混淆我们的理解。正因如此,检验当前最好的想法优于过去已经存在的情况是一种痴心妄想。这是前视偏差的一种微妙和可恶的形式,是研究中的一个重要问题。当研究员对用来检验模型有效性的样本外数据集越来越熟悉时,很可能他们正暗中假设他们对未来会有很多了解,实际上,历史上询问同样的问题时,他们并不了解。这种情况被一些宽客称为加工数据(burning data)。

另一种方法是首先判定样本外检验是有点神秘的,尤其对于有经验的、善于观察的研究员而言。样本外检验被放弃,这是出于对样本内数据结果的额外警惕和拟合参数的最小化的综合考虑。在这个方法中,宽客尽可能使用较少的参数,将参数值设置在合理的水平,简单地测试策略,寻找有良好表现的参数。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
近年来,神经网络被广泛应用于股票市场的研究中,其中基于PCA-BP神经网络的量化选股策略被认为是一种有效的择时策略。 基于PCA-BP神经网络的量化选股策略主要包括以下几个步骤: 第一步,数据预处理。选取一定数量的股票样本进行数据的采集和整理,包括股票的历史交易数据、财务数据、市场数据等。然后对原始数据进行预处理,包括数据清洗、数据归一化、数据平滑和特征工程等操作,以减少异常数据的影响和提高模型的预测性能。 第二步,利用PCA降维。通过PCA降维方法,减少原始数据的维度,提取重要的特征变量,以达到优化神经网络的目的。PCA降维的原理是将原始数据通过线性变换转化为新的空间,使得新空间的维度比原始空间的维度要小,从而减少数据特征的冗余,提高模型训练的效率和泛化性能。 第三步,构建BP神经网络。基于PCA降维后的数据,构建BP神经网络模型,并进行参数优化和模型选择,以达到最佳的预测效果。BP神经网络是一种具有隐层的前向反馈神经网络,可以适应非线性、复杂和动态的金融时间序列数据模型。 第四步,模型预测和实证分析。通过采用交叉验证方法,检验模型的泛化性能,进行预测和实证分析,对模型的有效性和适用性进行评估和比较。 总之,基于PCA-BP神经网络的量化选股策略是一种广泛应用于股市的量化分析方法,具有一定的市场研究和交易实践价值。同时需要注意模型的建立和优化过程,避免数据过拟合和过度参数化的问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值