这是一篇对前面部分内容的一个总结,利用机器学习从0到1开发量化选股策略。本篇文章没有代码,只是从文字角度叙述策略开发的流程。
目前有很多量化回测的平台可以供大家开发策略,但使用这些回测平台有个弊端。其弊端在于若需要构造一些复杂的策略,那些平台就无法满足我们的要求,因为1)当我们训练的策略模型比较复杂时,比如训练深度学习模型,可能需要好一点的机器,而这些机器平台可能无法提供或代价昂贵;2)平台很多东西都是封装好的,你无法添加自己想要的操作。
因此本篇文章将从0到1利用机器学习构造自己的中期股票选取的量化策略。利用机器学习构建策略的流程图如下:
Step 1:获取数据存入本地。
Step 2:对原始数据进行预处理及标签制作。
Step 3:特征工程:提取特征。
Step 4:选择机器学习模型并进行模型训练。
Step 5:利用训练好的模型进行回测。
Step 6:模型超参调整,重复step 4、step 5、及step 6。选择较优的超参组合。
对于模型的超参调整后文不作介绍,基本方法就是单独调整某一超参观察效果的改变情况再决定超参的设置。
1 数据获取
数据获取是进行一个机器学习项目研究中的第一个步骤。tushare提供了一个很好的数据获取接口。如下图我们可以通过tushare获取一些股票数据。
这里我们获取的数据主要有:
1) 股票基础信息,包括股票代码、名称、上市日期、退市日期等。
2) 每支股票日线信息,包括股票的开盘价、收盘价、最高价、最低价、换手率、成交量等。
3) 每日涨停跌停的统计。
4) 个股资金流向(大中小单流量)
详细的数据获取步骤可以见下面