![cf5a111f57111d2af0e2ba326a478278.png](https://i-blog.csdnimg.cn/blog_migrate/8b6c4e3b2b306b18ba6b19518ce03ddd.jpeg)
论文题目:RANDOM SURVIVAL FORESTS
论文PDF链接:
https://arxiv.org/pdf/0811.1645.pdfarxiv.org简介:随机生存森林(RSF),是一种用于对右删失生存数据进行分析的随机森林方法。 它引入了用于生长生存树的新生存分裂规则,以及用于估算缺失数据的新缺失数据算法。
RSF引入了生存森林的事件保留原则,并将其用于定义总体死亡率,这是一种简单的可解释的死亡率度量,可以用作预测结果。R软件包randomSurvivalForest提供了使用接口。
一、背景
基于决策树为基础学习器来构建集成模型,可以大大提高预测性能。 Breiman(2001)表明,可以通过将随机化注入基础学习过程中来进一步改善集成学习,这种方法称为随机森林。随机生存森林(RSF)方法扩展了Breiman的随机森林(RF)方法。在RF中,随机化有两种形式。首先,使用数据的随机样本子集样本来生长一棵树。其次,在树的每个节点上,选择随机选择的特征变量子集(协变量)作为分割的候选变量。对所有树进行平均,再结合用于生长树的随机化,可使RF功能更加丰富,同时保持较低的泛化误差。大量的经验证据表明