股票趋势预测——随机森林算法(一)
今天我对随机森林算法进行了简单的了解。
随机森林:随机森林是一种机器学习的算法。学习随机森林算法之前我们要先了解决策树和集成学习的概念。
决策树:决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。常见的决策树算法有C4.5、ID3和CART。
集成学习:它的工作原理是生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合成单预测,因此优于任何一个单分类的做出预测。
随机森林是一个包含多个决策树的分类器, 其输出的类别是由个别树输出的类别的众数而定。也就是说,每棵决策树都是一个分类器(假设现在针对的是分类问题),那么对于一个输入样本,N棵树会有N个分类结果。而随机森林集成了所有的分类投票结果,将投票次数最多的类别指定为最终的输出。这就是随机森林的算法思想。
因此我们可以采用随机森林算法对股票进行趋势预测,大致思路是:
1.提取预测股票的数据
2.选取特征
3.生成模型
4.运用模型进行预测