python随机森林求权重过程遇到的问题

博客讨论了在利用随机森林算法确定因素权重时,数据预处理的影响。虽然随机森林对归一化的数据没有提升效果,但归一化有时能帮助稳定模型。遇到权重全为0的问题可能源于原始数据的特性。此外,数据中存在空值会导致错误,应该通过适当方法处理,如删除含有空值的行。
摘要由CSDN通过智能技术生成

在对多个因素求权重的过程中,我们使用随机森林来获取。

随机森林通过每个因素在决策树上做了多少贡献来确定每个因素的重要性

1.而我们使用的是归一化后的数据,随机森林是基于树的bagging算法,归一化对基于树的算法是没有提升效果的,不需要进行归一化处理

2.并且我们在对数据进行随机森林算法后出现了权重全为0的情况,而将原数据带入后得出的结果就正常了

3.若出现error :NaN过多,则为你的数据中存在空数值,直接通过excel删除整行就可以了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值