现诚邀有能力者帮我完成以下操作,本人会考虑对提供帮助这给予补偿
实现方式为Python或R软件
操作一:利用随机森林筛选重要性变量,并建立随机森林模型:
(1)所用到的数据中有57个变量,需要利用随机森林筛选出重要性变量,剔除对预测结果影响较小的冗余变量;
(2)利用步骤(1)中剔除冗余变量的2007-2016年的数据建立随机森林模型,预测2017年第一季度、2017年第二季度、2017年第三季度、2017年第四季度和2018年第一季度的借款人违约率。并分别将真实结果与预测结果比较,计算出预测精度和误差;