使用TensorFlow进行股票价格预测的简单深度学习模型

使用TensorFlow进行股票价格预测的简单深度学习模型(翻译)

原文链接:https://medium.com/mlreview/a-simple-deep-learning-model-for-stock-price-prediction-using-tensorflow-30505541d877
深度学习在金融市场的应用越来越广泛,这篇来自作者 Sebastian Heinz 的好文起到了抛砖引玉的作用

作者:Sebastian Heinz
CEO @ STATWORX。十多年来做数据科学,统计和机器学习。食品,葡萄酒和鸡尾酒爱好者。查看我们的网站:https://www.statworx.com

对于我们最近在STATWORX上做过的黑客马拉松(技术研讨聚会),我们的一些团队成员从谷歌财务API中略微收集了标准普尔500指数的数据。 该数据包括标准普尔500指数成份股的指数和股票价格。 掌握了这些数据后,立即有了开发一种基于500种成分价格预测标准普尔500指数的深度学习模型的想法。

使用TensorFlow来处理数据并构建深度学习模型很有趣,因此我决定编写我的第一个Medium.com故事:一个关于预测标准普尔500股票价格的TensorFlow小教程。 您将阅读的内容不是深入的教程,而是对TensorFlow模型的重要构建块和概念的高级介绍。 我创建的Python代码没有针对效率进行优化,而是可理解性。 我用过的数据集可以从这里下载(40MB)。http://files.statworx.com/sp500.zip

请注意,这是关于TensorFlow的动手教程。实际的股票价格预测是一项非常具有挑战性和复杂性的任务,需要付出巨大的努力,尤其是在更高的频率下,例如此处使用的分钟为周期

导入和准备数据

我们的团队从我们的数据搜集服务器导出了股票数据作为csv文件。 该数据集包含n = 41266分钟的数据,范围从2017年4月至8月,500种股票以及标准普尔500指数的总价格。 指数和股票以宽幅格式排列。

# Import data
data = pd.read_csv('data_stocks.csv')
# Drop date variable
data = data.drop(['DATE'], 1)
# Dimensions of dataset
n = data.shape[0]
p = data.shape[1]
# Make data a numpy array
data = data.values

数据已经清理和准备,意味着缺少的股票和指数价格是LOCF’(last observation carried forward)(最后一次收盘价格延展),因此该文件不包含任何缺失值。

快速浏览标准普尔时间序列:

pyplot.plot(data['SP500'])

在这里插入图片描述
注意:这实际上是标准普尔500指数的领先,意味着它的价值在未来1分钟内转移(这已经在数据集中完成)。 此操作是必要的,因为我们想要预测索引的下一分钟而不是当前分钟。 从技术上讲,数据集中的每一行都包含标准普尔500指数在t + 1的价格和成分股在T = t时的价格。

准备训练和测试数据

数据集分为训练和测试数据。 训练数据包含总数据集的80%。 数据没有改组,而是按顺序切片。 数据范围从4月到大约2017年7月底,测试数据将于2017年8月底结束。<

  • 10
    点赞
  • 55
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值