LSTM 无法预测股票价格

本文探讨了为何LSTM在预测股票价格方面表现不佳。引用了随机游走理论,强调股票价格的随机性使得任何基于历史数据的预测模型,如LSTM,都难以准确预测。此外,股票市场受众多复杂因素影响,仅依靠先前价格无法捕捉到这些影响,从而降低了预测的有效性。因此,尝试用LSTM预测股票价格可能并非明智之举。
摘要由CSDN通过智能技术生成

莱顿·阿里顿

尽管 LSTM 是一种非常流行的方法,但它本质上是一种估计股票价格的糟糕方法

长短期记忆 (LSTM) 网络是一种非常流行的循环神经网络,主要用于学习序列和顺序依赖。因此,在学习音频、语言,当然还有时间序列数据——任何具有时间维度的东西时,它们通常是一个非常可靠的选择。人们很自然地会尝试在可以说是最流行的时间序列数据上使用这种时间学习能力:股票市场。然而,尽管这种技术可能很受欢迎,但我们会发现它本质上是一种试图预测股市的非常糟糕的方法。

猴子是优秀的理财师

1973 年,普林斯顿经济学家伯顿·戈登·马尔基尔 (Burton Gordon Malkiel) 出版了相当著名的著作《华尔街的随机漫步》,其中他提出:

“一只蒙着眼睛的猴子在报纸的财经版上投掷飞镖,可以选择与专家精心挑选的投资组合一样出色的投资组合。”

Malkiel 将被证明是正确的,因为存在许多对这种情况的模拟——针对专业策划的投资组合的随机选择——确立了他的说法。中详细介绍了一个这样的实验作者从 1,000 只股票中随机选择了 30 只股票。这一过程重复了 100 次,值得注意的是,100 个投资组合中有 96 个的表现平均每年超过基准指数 1.7%。

《华尔街日报》描述了类似的模拟, 记者向报纸股票上市投掷飞镖,然后继续将他们随机挑选的股票与纽约 Sohn 会议上的基金经理进行比较。随机挑选的股票比基金经理高出 22 个百分点——只有 33% 的 Sohn 挑选股票的表现优于标准普尔 500 指数。

事实上,为了将这种说法发挥到极致,1999 年,一只名叫 Raven “Thorogood III”的猴子选择了一个由 10 只股票组成的投资组合,向董事会投掷飞镖。Raven 成为美国第 22 位最成功的基金经理,并以 213% 的收益超越华尔街 6,000 多家专业经纪人。这一成就将很快为瑞文赢得吉尼斯世界纪录的一席之地。

这样的结果现在显然只能归因于股票大多是随机的这一事实。不管一个人可能做多少分析和研究,投资组合的成功很大程度上取决于运气和机会。股票走势基本上是随机的。LSTM,更不用说任何类型的机器学习模型,都无法预测本质上是随机的东西。根据其定义,随机性无法始终如一地预测。

漫无目的地走来走去

股票在很大程度上是随机的信念被称为随机游走理论,它声称股票价格的变化具有相同的分布并且彼此独立。随机游走理论表明,股票走的是一条随机且不可预测的路径,这使得所有一致预测股票价格的方法都徒劳无功。因此,任何以前的股票价格、趋势或信息都不能用来预测未来的走势。然而,重要的是要注意,并不是每个人都真正赞同随机游走理论。

让我们首先熟悉一下究竟什么随机游走。随机游走不是随机数序列,而是前一个随机修改的数字序列。

例如,给定一个值,我们可以随机选择添加 -1 或 1。然后我们取该新值,并在接下来的时间步骤中再次重复相同的随机过程。我们可以对任意数量的时间步重复此操作。这是一次“随机行走”。

将此与前面描述的随机游走理论联系起来,我们将模拟一个虚构的股票作为示例。随机游走理论规定股票价格的变化具有相同的分布并且彼此独立。为简单起见,我们假设我们的虚构股票随机波动,正态分布在 -2.5% 到 2.5% 的每日价格变化之间。简而言之,给定日的股票价格将与前一个价格相比随机增加/减少百分比变化,变化通常分布在 -2.5% 和 2.5% 之间。

我们将从 100 美元开始初始值,并运行一个 Python 脚本,该脚本将模拟和绘制这个虚构股票的 1000 个时间步长。

这些是结果:

正如我们所看到的,我们想象中的股票可能看起来很熟悉,因为它具有相当真实的行为。这是另一个例子:

这些是随机游走。请记住,这些示例完全是我们虚构的股票的虚构代与我们的虚构参数,当然都是基于随机游走理论。它们看起来就像真正的交易,但它们是完全随机的!如果我们要计算其中一个生成的随机游走的百分比变化并将它们绘制为直方图,我们可以观察到以下内容:

正如预期的那样,百分比变化正态分布,平均值为 0,介于 -2.5% 和 2.5% 之间。

为了进一步探索,我们将以一些真实世界的 IBM 股票数据为例进行一些实验。

以下是 IBM 股票过去一年的收盘价:

它已经看起来很像随机游走。让我们计算每天的百分比变化并将它们排列成直方图:

坦率地说,这再完美不过了。IBM 股票价格的日常变化几乎是完全正态分布的,平均值为 0,大约在 -10% 到 10% 之间。这只股票实际上是随机游走。

诚然,并不是每一只现存的股票都可能这么漂亮。但是,通常只需要进行少量数据转换即可得出类似的结论。随机游走理论也不要求分布特别漂亮,重要的是每天的价格变化具有相同的分布。

随机游走理论绝对有强有力的证据,其中过去的价格和趋势与未来的价格无关,因为它们都是完全随机的。事实上,在尝试预测股票价格时,常有这样的说法:

“对明天股票价格的最佳预测,就是今天的价格”

使用过去股票价格来学习预测未来股票价格的 LSTM 从定义上讲是不可能的,因此,从广义上讲,它是无用的。

真的没那么简单

如果我们完全无视随机游走理论,并假设确实存在某种可能的模型来一致地预测股票价格,那么 LSTM 仍然不合适。

这是因为如果要对股票市场进行建模,它肯定会是一个比以前价格值之间的某种关系复杂得多的模型。股市走势至少会受到各种现实世界变量的影响。公司的业绩、新产品的推出或产品召回、员工裁员——甚至是 CEO 的推文都会对股价和未来走势产生巨大影响。

股票价格受所有可用信息影响的信念是有效市场假说的一种形式。有效市场假说有 3 个不同版本:

  • 弱形式:弱形式表明今天的股票价格反映了过去价格的所有数据,没有任何形式的技术分析可以有效地帮助投资者做出交易决策。
  • 半强形式:半强形式表明,由于所有公开信息都用于计算股票的当前价格,因此投资者不能利用技术或基本面分析来获得更高的市场回报。
  • 强形式:强形式版本表明,所有信息,包括私人信息,都完全计入当前股价,没有任何类型的信息可以让投资者在市场上获得优势。

假设先前的股价是未来股价的主要影响因素是荒谬的!通常,当 LSTM 在某些股票数据上进行训练时,问题的建立使得 LSTM 试图仅在股票价格中找到对先前值的顺序依赖性。这是一个粗略的假设,因为它根本不足以正确构建任何类型的股票市场模型,只要这样的东西甚至可以存在。股票市场是一个极其复杂、精密和错综复杂的系统,它依赖于整个世界——股票价格无法预测股票价格。

结论性想法

尽管尝试使用 LSTM 预测股票价格的方法非常流行,但不幸的是,这样的事情完全是神话。

股票价格本质上是随机游走的,随后的每个未来价格都独立于上一个。并不是说 LSTM 是一个没有足够预测能力的弱模型——它们可以是非常强大的时间序列和序列数据预测器——而是事实上,从一开始就没有什么是可预测的就其定义而言,随机性无法可靠地预测。因此,试图学习对本身没有顺序依赖的数据的顺序依赖显然是不可能的。

无论如何,仅以前的价格本身并不能提供足够的信息。股票市场极其复杂和错综复杂,任何受现实世界中数百个变量影响的偶然非随机变化都无法通过将预测问题设置为仅使用之前的收盘价来解释。

坦率地说,使用 LSTM 进行股票价格预测可能完全是徒劳的,但是仍然应该仅仅因为这种练习提供的教育价值而鼓励它。该项目通常在初学者中很受欢迎,并且在教育背景下,它无疑是了解更多关于 LSTM 和一般时间序列数据的好方法。

然而,如果你追求的是经济上的成功,那么你最好还是玩一场飞镖游戏。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值