今天我们将使用XGBoost Boosted Trees来回归官方人类发展指数数据集。 谁说监督学习是关于分类的?
XGBoost: What is it?
XGBoost是一个Python框架,它允许我们训练使用多核并行性的Boosted Trees。 它也可以在R中获得,但我们不会在这里介绍它。
The task: Regression
Boosted Trees是回归的机器学习模型。 也就是说,给定一组输入和数字标签,它们将估计在给定相应输入的情况下输出标签的功能。
与分类不同,我们对标签的连续值感兴趣,而不是一组离散的类。
例如,我们可能想要根据体重和年龄预测一个人的身高,而不是将其标记为男性,女性或其他人。
对于每个决策树,我们将从根开始,并根据决策的结果移动到左或右子。 最后,我们将返回我们到达的叶子上的值。
XGBoost’s model: What are Gradient Boosted Trees?
提升的树木与随机森林相似:它们是决策树