岛主简介:
目前纽约对冲基金在职,哥伦比亚大学客座讲师。主要研究方向:基于机器学习的量化投资策略。
摘要
这篇文章的内容来自我的一个关于机器学习在量化投资中的应用的讲座。讲座原文内容是一个半小时。由于原文的内容非常多,在这里我截取部分内容按照要点的形式和大家做个简要的分享。
截取的内容分为准备分为三个部分:
机器学习应用最简单的场景 - 时间序列预测。
量化投资中的数据集(传统与另类)。
基于机器学习的量化交易策略构建基本流程及注意事项。
今天这篇文章将覆盖第一部分内容。
正文
01
金融数据集和传统机器学习数据集的不同
目前市面上常见的机器学习数据集有很大一部分都已经被类似于sklearn这样的包收录了,可以很方便一键调用。一般机器学习入门都是靠这些数据集,同一个数据集可能用不同的模型来回反复地做。还有一个有代表性的数据集是房屋价格预测,这个数据集的特殊性在于有hedge fund面试喜欢用这个做例子。传统数据集和金融数据集的区别在哪儿呢?
source: https://www.kaggle.co