在对多个因素求权重的过程中,我们使用随机森林来获取。
随机森林通过每个因素在决策树上做了多少贡献来确定每个因素的重要性
1.而我们使用的是归一化后的数据,随机森林是基于树的bagging算法,归一化对基于树的算法是没有提升效果的,不需要进行归一化处理
2.并且我们在对数据进行随机森林算法后出现了权重全为0的情况,而将原数据带入后得出的结果就正常了
3.若出现error :NaN过多,则为你的数据中存在空数值,直接通过excel删除整行就可以了
在对多个因素求权重的过程中,我们使用随机森林来获取。
随机森林通过每个因素在决策树上做了多少贡献来确定每个因素的重要性
1.而我们使用的是归一化后的数据,随机森林是基于树的bagging算法,归一化对基于树的算法是没有提升效果的,不需要进行归一化处理
2.并且我们在对数据进行随机森林算法后出现了权重全为0的情况,而将原数据带入后得出的结果就正常了
3.若出现error :NaN过多,则为你的数据中存在空数值,直接通过excel删除整行就可以了