数据的预处理是深度学习的关键

传统量化投资的主要工具方法是统计分析。

读过《量化投资:以Python为工具》,据说它是国内最受欢迎的这类书。

当进入数学公式的堆砌、推导章节时,放弃了继续。

最终的选择是 Deep Learning。

深度学习、神经网络的最大优点是:处理数据的算法由模型自动进行,你无需制造计算方法。

但是,你提供的数据必须适合模型的要求。

从Github上找了些现成“系统”观摩学习。直觉的第一感,它们对数据的预处理都不行。

我怀疑,Deep Learning 在量化投资上不太成功的原因之一,是数据预处理的问题。

用现成的深层网络模型,验证了以上看法。

作业是:根据20个交易日的价格变化,预测其后接连3个交易日的价格。

使用A股10年来全部个股的日线数据。

数据不做预处理,10个回合(Epoch)的训练,神经网络的预测准确度约50%;

经过数据预处理,同样10个回合,神经网络的预测准确度升至65%;

训练次数加大一倍,20 回合的预测准确度为 68 %;

训练次数增大到 50 回合,预测准确度为 72.8 %;

100回合的训练,折腾2个半小时,结果是预测准确度 74.3547 %,比50回合提高了约 1.5 %。

看来、极限、瓶颈这种东西是真实的存在。

我用的模型和数据预处理,只能做到近 75% 的准确。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值