随机森林等机器学习方法的分类和回归问题评价以及哑变量的设置

本文探讨了随机森林在回归问题中的应用,对比了全变量与重要变量选择的效果,发现保留所有变量更可靠。在土壤质地分类问题上,随机森林表现最佳,但直接预测比通过回归转换更准确。同时,介绍了哑变量设置的两种方法,并提出需要进一步研究。
摘要由CSDN通过智能技术生成

一、 关于随机森林的回归问题中,比较了原始数据和ilr数据结合所有环境变量和根据importance函数挑选出的重要性较高的部分环境变量,做30次取平均值后得到的表格(以sand为例),并比较了几个评价指标:

RandomForest and GLM regression

INDEX

RandomForest_ilr_all

RandomForest_ilr_part

RandomForest_ogrin_all

GLM

ME

-0.0000000000000011

0.0000000000000034

0.0000000000000033

0.00000000000000148

MAE

10.40466314

10.92294871

10.55936747

11.86528444

MSE

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值