条件推理树是决策树的非参数类,也称为无偏递归分区。它是条件推理框架中连续和多变量响应变量的递归分区方法。为了在R Programming中执行这种方法,ctree()函数被使用并且需要partykit包。在本文中,让我们借助示例了解条件推理树、语法及其实现。
条件推理树
条件推理树是一种不同类型的决策树,它使用基于相关值的因变量的递归分区。就像机器学习中的其他分类和回归算法一样,它避免了偏差。因此,避免易受错误影响,使其更灵活地处理数据中的问题。条件推理树使用显着性检验,它是一种置换检验,它选择协变量来拆分和递归变量。在此测试中计算 p 值。在算法的每次开始时执行显着性检验。该算法不适用于具有缺失值的数据进行学习。
算法:
1 测试随机输入和响应变量之间的全局零假设,并选择具有最高 p 值的输入变量和响应变量。
2 对选定的输入变量执行二进制拆分。
3 递归执行步骤 1 和 2。
条件推理树是一种基于树的分类算法。它类似于决策树,ctree()也像决策树一样执行数据的递归分区。使条件推理树与决策树不同的唯一过程是条件推理树使用显着性检验来选择输入变量,而不是选择使信息度量最大化的变量。例如,传统决策树中使用基尼系数来选择最大化信息度量的变量。
示例 1
在此示例中,让我们在 R 基础包中存在的空气质量数据集上使用条件推理树的回归方法。执行后,将根据不同的环境条件确定不同的臭氧水平。这有助于了解臭氧值在不同环境条件下的不同行为。
第 1 步:安装所需的软件包。
install.packages