prim 算法python实现

“PRIM” (Patient Rule Induction Method) 是一种用于构建决策树的算法,主要用于处理分类问题。它基于分类准则,包括信息增益、基尼指数等,对数据进行递归分割,从而构建决策树。

以下是PRIM方法的基本步骤:

  1. 选择特征:从可用的特征中选择最佳的特征,作为当前节点的划分标准。选择标准通常基于信息增益、基尼指数或者其他衡量标准来选择对目标变量分类效果最好的特征。

  2. 划分数据集:基于选定的特征,将数据集划分成不同的子集。每个子集对应于特征的一个取值。这一步骤实质上是在创建决策树的分支。

  3. 递归处理:针对每个子集,递归地应用以上步骤,直到达到停止条件。停止条件可以是特定深度、节点中的样本数量小于某个阈值或者其他预定义的条件。

  4. 构建叶节点:当递归到停止条件时,创建叶节点并确定叶节点的分类。

  5. 剪枝:在树构建完成后,可以进行剪枝以防止过拟合,提高决策树的泛化能力。

PRIM方法在构建决策树时采用了一种“耐心”的策略,通过适当选择特征和递归划分数据集,构建出简洁而准确的决策树模型。通过考虑信息增益、基尼指数等指标,PRIM方法能够有效地处理分类问题,并生成具有良好泛化能力的决策树模型。

python调用

import prim
p = prim.Prim(x=x,
              y=encoded_labels,
              threshold=None, threshold_type='>',
              peel_alpha=0.05, paste_alpha=0.05, 
              mass_min=0.05, # 目标命中率
              include=None, exclude=None, coi=None)
box = p.find_box()
box.show_details() # 查看细节

在这里插入图片描述
在这里插入图片描述

查看每个盒子的详细内容

a=p.find_all()
for i in range(len(a)):
    print(a[i])
box.limits

可视化

box.show_ppt()
box.show_tradeoff()

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 9
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值