1)Motivation :
本文的Stock2Vec embedding 是基于标准普尔500指数股票日价格变化的数值数据生成的。其次,之前的工作主要集中在使用公司特征来预测股票走势,但都没有利用Word2Vec算法来构建一个利用股票价格来预测公司特征的嵌入。
2)创建 Stock2Vec embedding:
- Dataset:第一个数据集是S & P 500股票数据,该数据集是关于2013年至2018年S & P 500指数中所有公司的历史股票价格。该数据集包含每日交易信息,包括交易日、开盘价、最高价、最低价、收盘价、交易股数、公司股票名称等。另一个数据集是具有Financial Information的S & P 500公司,从中得到S & P 500公司的名称,部门和符号。
- Preprocessing:首先根据公司的股票名称合并两个数据集,去除不相关的信息,如交易的股票数量。预处理后的数据集包含了S & P 500股票的日价格变化、对应的板块和日期。505只股票中的每一只用1826个数据点( 365 * 5 + 1 )表示,包含了2013 - 2018年每一天的每日股票价格变化。
每日的股票价格变化 = (收盘价-开盘价)/