目录
一、随机森林
1.1 随机森林介绍
随机森林是一种监督学习算法。随机森林可以用于分类和回归问题,通过使用随机森林回归器,我们可以在回归问题上使用随机森林。但是我们在这个项目中使用了随机森林分类,所以我们只考虑分类部分。
1.2 随机森林算法介绍
- 从总共m个特征中随机选择k个特征(k<m)
- 在k个特征中,使用最佳分割点计算节点d
- 使用最佳分割将节点分割为子节点
- 重复步骤1-3,直到达到1个节点
- 通过重复步骤1-4 n次来创建n个树构建森林
1.3 随机森林预测伪代码
- 获取测试特征并使用每个随机创建的决策树的规则来预测结果,并存储预测结果
- 计算每个预测目标的投票数
- 从随机森林算法中考虑最高投票预测目标作为最终预测值
二、核心代码
首先需要导入相应库和数据集:
import pandas as pd