缺失数据填补新方法：递归特征消除+随机森林，也许更优！

妙趣横生统计学

于 2024-11-18 07:49:58 发布

阅读量1.2k

点赞数 9

文章标签：随机森林人工智能机器学习算法数据挖掘

本文链接：https://blog.csdn.net/weixin_44693403/article/details/143863780

版权

2024-2025 课程介绍

可预开发票，郑老师团队2024-25年科研统计课程预告，含机器学习、轨迹模型等。11.30-12.1 R语言构建机器模型课程开启

数据集中的缺失值对数据分析带来了重大挑战，特别是在数据准确性对患者诊断和治疗至关重要的医疗领域。尽管MissForest（MF）在填补研究中被证明是有效的，递归特征消除（RFE）在特征选择中被证明是有效的，但通过RFE集成来增强MF的潜力仍未被探索。

11月8日，我们看到在期刊《BMC Medical Research Methodology》（医学三区，IF=3.9）发表了题为“A novel MissForest-based missing values imputation approach with recursive feature elimination in medical applications”的研究论文，这篇文章通过结合随机森林和递归特征消除，性能超过了传统的MICE，即使用默认方法的MICE。

结果表明，新的填补方法——递归特征消除-随机森林（recursive feature elimination-MissForest, RFE-MF）有望成为医疗数据集的有效插补方法，为解决医疗应用中缺失数据的挑战提供了一种新的方法。