今天分享的论文来自 AAAI
2021,名为 Stock Selection via Spatiotemporal Hypergraph Attention Network: A Learning to Rank Approach。
0. Abstract
当前深度学习在股票预测中面临的问题:
- 不会直接优化投资盈利的目标
- 股票之间是相互独立的,忽略了相关股票之间丰富的价格走势信息
基于这两个缺陷,作者将股票预测问题构建为一个排序学习问题,提出 STHAN-SR
,一个神经网络的超图结构来进行股票的选择。工作的关键创新在于通过超图对股票中复杂的关系进行建模,和通过同时对股票之间的相互依赖和他们股价在时序上的变化建模,得到的一个时序的
Hawkes 超图注意力网络,基于股票盈利对股票进行排序。
1. Introduction
- 现存的问题:
- 问题1:并不会直接对预测目标进行优化
- 要么是对股票进行分桶,构建分类任务:涨、跌、或没有明显变化
- 要么是预测股票未来价格,而非使用最大盈利选择股票
- 这些指标更好,但最终的盈利指标不一定会更好,如下图所示
- 问题2:大多数工作都将股票走势看作是独立的,或者是使用一个过度简单的市场模型,通过使用 pairwise
的独立股票的信息来构建的图,但是这往往与真实的市场函数相反。
- 问题1:并不会直接对预测目标进行优化
- 假设股票的关系是一个集合。比如都属于医疗行业,都被伯克希尔控股,比如在新冠下,航空股大跌,医疗行业大涨
- 超图(hypergraph)是图的泛化形式,可以通过超边(hyperedge)来同时代表这样的多个股票之间的信息
- 工作总结
- 提出一种新的时空超图注意力网络,可以对不同类型的股票关系建模,来进行股票的排序
- 通过超图注意力机制,将时间的 Hawkes 注意力和空间的超图卷积结合起来,来捕捉相关股票的走势关系
- 通过三个现实世界中 NYSE,NASDAQ,TSE 市场中的超过2852支股票,超过1174个交易日上的实验,展示了 STHAN-SR
对于量化股票交易的应用能力
2. Related Work
- 金融上的传统方法
。这个问题会被建模为回归问题或者分类问题,之前的方法会只依赖于数值型的特征;新一点的方法依赖于有效市场假说,开始寻找一些新闻、社交媒体和财报电话等的因子。这些方法的缺陷是它们假设股票的走势彼此之间是独立的,因此限制了学习相关股票之间潜在信息的能力。另一个限制是没有直接对收益率进行优化。 - 当代的方法 。最近的方法使用基于图的方法来表示一对股票之间的关系,例如行业数据和两个股票CEO相同等。
- Kim et al. 2019 基于注意力机制的图神经网络进行股票走势预测,指出太多 pairwise 的股票关系会增加图的噪声,降低预测表现
- Feng et al. 2019b 带有时序卷积的增强图卷积神经网络,展示使用股票间的关系优化时序上股票的走势是有用的
- 这些方法的缺陷在于,只能有 pairwise 的股票关系。高阶的股票关系信息,使用超图可以更好的表示
- 超图表示学习。传统的pairwise表示股票信息的方式,会带来很大的信息损失。
3. Methodology
股价时序特征
特征提取。 历史的股价是未来股价很强的指示。论文中使用了前 T
个交易日的历史价格信息作为输入特征,对每个股票,计算了5个时序特征:1天回报率和5天、10天、20天和30天的移动平均值,分别代表日、周、月的趋势。然后使用了
LSTM 来捕捉时序上的依赖,最终,每个股票在每天都得到一个蕴含时序特征的隐向量。
h τ = LSTM ( q τ , h τ − 1 ) , t − T ≤ τ ≤ t − 1 h_{\tau} = \text{LSTM}(q_{\tau}, h_{\tau-1}) , t-T \le \tau \le t - 1 hτ=LSTM(qτ,hτ−1),t