1. Introduction
股票走势受到多方面影响,没有了解相关信息的投资决策会面临金融风险以及金钱损失,而仔细考虑过的投资可以使收益增大。传统的方法依赖于时间序列,以及对股票的分析,比如利用历史价格。然而只利用价格信号,难以捕捉一些突然发生的事件造成的影响。正如社交媒体,对股票的影响,然后举了个特朗普发推特导致洛克希德马丁公司股票下跌的例子。
提到有效市场假说(Efficient Market Hypothesis,EMH),股票的价格反映了所有已知信息,
2. Related Works
传统啊的方法依赖于TA(Technical Analysis),这种方法只关注于数字特征,比如历史价格,或者宏观经济参数GDP。
而新的方法,依赖于EMH, 被认定为一种FA(Fundamental Analysis)
3. Problem Formulation
MAN-SF的主要目标是暂时学习来自推文和历史价格信号的相关信息,并利用股票之间的公司关系来预测走势,本文进行的是一个二元预测,
p
d
c
p_d^c
pdc是指第d天的收盘价, 所以0表示下跌,1表示涨
4. MAN-SF:Components and Learning
整体结构如下图:
模型首先会编码某一个范围内的市场信息data:
x
t
=
B
(
c
t
,
q
t
)
x_t= \Beta (c_t, q_t)
xt=B(ct,qt), 其中
c
t
c_t
ct是基于一个lag时间窗口关于一系列股票
S
=
[
s
1
,
s
2
,
.
.
,
s
S
]
S=[s_1,s_2, .., s_S]
S=[s1,s2,..,sS]的编码Tweet, 而
q
t
q_t
qt 是历史股价信息
4.1 Price Encoder
Price Encoder整体结构
这个结构会编码历史股价的走势从而产生价格特征(price feature)
q
t
q_t
qt, 它从过去的 T 天获取每日价格特征,并对价格的时间趋势进行编码。使用GRU获取交易日之间的序列依赖(sequential dependencies)。
p
i
=
[
p
i
c
,
p
i
h
,
p
i
l
]
p_i=[p_i^c, p_i^h,p_i^l]
pi=[pic,pih,pil]分别对应收盘价,最高价,最低价。
然后会进行normalize:
p
i
=
p
i
c
/
p
i
−
1
c
p_i = p_i^c/p_{i-1}^c
pi=pic/pi−1c
由于每天的trend对最终trend的预测贡献不同,所以应用到attention
h
ˉ
z
\bar{h}_z
hˉz是concat之后的GRU hidden states,
β
i
\beta_i
βi是对每一个交易日的attention weight,(大致的attention计算都一样的,具体可以看我的另一篇文章attention的矩阵表示及理解),
4.2 Social Media Information Encoder(SMI)
第一段说,社交媒体不仅提供实际信息,也刻画了用户对于股票的情感,而这个社交媒体特征
c
t
c_t
ct就靠以下结构Figure3获得:
关于Tweet的Embedding,本文会用到Glove,FastText以及USE(Universal Sentence Encoders),最终根据经验,用到了效果最好的USE。
其中
[
m
1
,
m
2
,
.
.
,
m
K
]
[m_1, m_2 ,.., m_K]
[m1,m2,..,mK]是经过了USE之后的Tweet表示,K是第i个交易日平均每支股票的相关Tweet数量。
由于Tweet的影响力也是不同的,所以这里用到News-Level Attention,
这里的attention结构和前面类似,由于
r
i
r_i
ri只表示第i天的表示,他要对过于T天的表示进行一个整合
总结第 i 天股票 s 的推文以及前几天的推文,同时关注第 i 天, 最后对于素有T天,
c
t
=
ζ
(
h
ˉ
s
)
c_t=\zeta(\bar{h}_s)
ct=ζ(hˉs)
4.3 Blending Multimodal Information
获得了两方面的表示之后,就可以联合到一起了
来自不同模式的信号通常携带有关市场中不同事件的补充信息,
正如前面提到的
x
t
x_t
xt就是联合表示
4.4 Graph Attention Network(GAT)
这一层的输入就是一系列的
x
t
x_t
xt也就是stock 联合信息,
h
=
[
x
1
,
x
2
,
.
.
.
,
x
∣
S
∣
]
h=[x_1, x_2, ..., x_{|S|}]
h=[x1,x2,...,x∣S∣]
然后又是一层attention:
其中
⨁
\bigoplus
⨁是concat的意思,
学习到的注意力系数
α
i
j
α_{ij}
αij 用于加权和聚合来自具有非线性 σ 的相邻特征向量,
更新后的节点特征
最后的目标函数
5. Experiments
具体数据有哪些请直接看论文,
evaluation metrics会用到MCC
Baselines:
Fundamental Analysis:
这里跟我前几天的另一篇提到的论文导读: Stock Movement Prediction from Tweets and Historical Prices是差不多的(果然天下文章全靠水啊)。