随机森林是有许多个决策树组成的,每个决策树在构建的过程中互不相关,因此容易用并行实现来减少时间开销。(可以R语言的random forest包来实现)
构建主要步骤:
1. 有放回的随机重采样
2. 分裂准则:论文 A new method to study the change of miRNA–mRNA interactions due to environmental exposures(2017 bioinformatics)采用父节点样本集合方差与左右节点样本集合方差之和的差值最大来分类。
随机森林的具体介绍可参考:
http://blog.csdn.net/zrjdds/article/details/50133843