标星★公众号,第一时间获取最新研究
本期作者:Alexandr Honchar
本期翻译:LIN | 公众号翻译部
近期原创文章:
♥ 基于无监督学习的期权定价异常检测(代码+数据)
♥ 5种机器学习算法在预测股价的应用(代码+数据)
♥ 深入研读:利用Twitter情绪去预测股市
♥ Two Sigma用新闻来预测股价走势,带你吊打Kaggle
♥ 利用深度学习最新前沿预测股价走势
♥ 一位数据科学PhD眼中的算法交易
♥ 基于RNN和LSTM的股市预测方法
♥ 人工智能『AI』应用算法交易,7个必踩的坑!
♥ 神经网络在算法交易上的应用系列(一)
♥ 预测股市 | 如何避免p-Hacking,为什么你要看涨?
♥ 如何鉴别那些用深度学习预测股价的花哨模型?
♥ 优化强化学习Q-learning算法进行股市交易
♥ 搭建入门级高频交易系统(架构细节分享)
这是公众号关于神经网络在金融领域特别是算法交易上的一个连载系列:
1、简单时间序列预测(已发表)
2、正确的时间序列预测+回测
3、多变量时间序列预测
4、波动率预测和自定义损失函数
5、多任务和多模式学习
6、超参数优化
7、用神经网络增强传统策略
8、概率编程和Pyro进行预测
欢迎大家关注公众号查看此系列。本期我们从讲第二部分。
前言
在第二部分中,我们想描述更正确处理金融数据的方法。与前一篇文章相比,我们想展示不同的数据标准化方法,并多讨论些过拟合的问题(在处理具有随机特性的数据时肯定会出现过拟合问题)。我们不会比较不同的架构(CNN, LSTM),你可以在之前的文章中查看它们。但即使只使用简单的前馈神经网络,我们也能看到一些重要的东西。
数据准备
让我们看看从2005年到今天苹果股价的历史时间序列。你可以很容易地从雅虎财经下载到csv格式的文件。在这个文件中数据的顺序是“颠倒”的——从2017年到2005年,所以我们需要先把它颠倒过来,如图:
data = pd.read_csv('./data/AAPL.csv')[::-1]
close_price = data.ix[:, 'Adj Close'].tolist()
plt.plot(close_price)
plt.show()