摘要: 股票跌跌不休?用神经网络预测一波啊!
机器学习和深度学习已经成为定量对冲基金为了实现最大化利润而通常使用的新的有效策略。作为一个人工智能和金融爱好者,这是一个令人兴奋的消息,因为神经网络结合了我感兴趣的两个领域。本文将介绍如何使用神经网络预测股票市场,特别是股票(或指数)的价格。这篇文章基于我GitHub上的python项目,在项目中可以找到完整的python代码以及如何运行这个程序。另外,要了解更多类似的内容,请查看我自己的页面:Engineer Quant。
金融是高度非线性的而且有时股票价格数据甚至看起来完全随机的。如ARIMA和GARCH模型这些传统的时间序列方法,只有在序列是静止的情况下才有效,这是一种需要对序列进行日志返回(或其他转换)预处理的限制假设。然而,在实时交易系统中实现这些模型时出现的主要问题是,随着新数据的添加,无法保证序列的静止。
这是通过使用不需要任何平稳性的神经网络来解决的。此外,神经网络天生就能有效地发现数据之间的关系,并利用它来预测(或分类)新数据。
一个典型的全堆栈数据科学项目有以下工作流程:
1、数据采集——这为我们提供了特征;
2、数据预处理——这是使数据可用的一个常见且必要的步骤;
3、开发和实现模型-选择神经网络的类型和参数;
4、回溯模型——在任何交易策略中都是非常关键的一步;
5、优化——找到合适的参数;
神经网络的输入数据是过去十天的股价数据,我们用它来预测第二天的股价数据。
数据采集
幸运的是,这个项目所需的股价数据很容易通过使用它们的Python API,即get_yahoo_data(ticker, start_date, end_date)在Yahoo Finance中得到,或直接从它们的网站获取。
数据预处理
在我们的例子中,我们需要将数据分解成过去10天股价和第二天价格的训练集。我通过定义一个preprocessing类,将其分解为训练和测试数据,并定义一个方法get_train(self, seq_len),该方法返回训练数据(输入和输出)为numpy数组,给定一个特定的窗口长度(在例子中是10)。完整代码如下:
def gen_train(self, seq_len):