工具简介
【基于森林的增强分类与回归 (空间统计)】工具使用两种监督机器学习方法之一创建模型并生成预测:一种是由 Leo Breiman 和 Adele Cutler 开发的随机森林算法的改编版,另一种是由 Tianqi Chen 和 Carlos Guestrin 开发的极限梯度提升 (XGBoost) 算法。可以针对类别变量(分类)和连续变量(回归)执行预测。解释变量可以采取用于计算邻域分析值的训练要素、栅格数据集和距离要素的属性表中字段的形式,以用作附加变量。除了基于训练数据对模型性能进行验证之外,还可以对要素或预测栅格进行预测。
ArcGIS Pro3.3对本工具进行了更新,增加了分类预测功能。
示例演示:山林野火概率预测
数据来自FEMA 的国家风险指数和加利福尼亚州的历史野火记录。
下面是加利福尼亚州人口普查区的地图,阴影部分表示该地区历史上是否每年至少发生过一次野火。
假设您想要创建一个模型来预测每年发生野火的风险,并使用有关人口普查区的其他因素。例如:干旱频率、强风频率、雷电频率、冬季风暴频率以及有关农业用地的信息。
下面设置基于森林和增强分类与回归工具,并启用新参数“包括所有预测概率” 。
该模型的输出预测如下。模型预测会发生火灾的人口普查区域以橙色显示。这是一个简单的二进制“是”或“否”,这是 ArcGIS Pro 3.3 之前此工具的主要输出。
现在,新的概率输出为该预测提供了更精细的粒度。以下是映射的野火类别的概率。
根据预测,颜色最浅的区域发生至少一次野火的概率最低,颜色最深的红色区域发生至少一次野火的概率最高。这为分类预测提供了更大的效力。作为分析师,您会以不同的方式处理 5%、40%、80% 或 90% 的野火概率。
下面是历史上观察到的野火发生概率图。概率图上最深的红色阴影与观察到的野火区域对齐。
随着未来干旱、气候模式和土地利用不断变化,可以计算出新的概率并协助资源分配。
ArcGIS Pro 3.3 中基于森林和增强分类与回归工具的这一新增强功能为分类预测带来了更多细节,并可以对预测结果进行更可靠的评估和操作。
作者:ArcGIS中国培训中心