多变量决策树

本文详细介绍了如何使用PyTorch实现多变量决策树,包括数据集的准备、线性模型定义、损失函数设计、决策树节点构建、模型训练与评估等步骤。通过递归方式生成决策树,并实现预测和评估功能。
摘要由CSDN通过智能技术生成

简单介绍

本文使用PyTorch进行多变量决策树的实现. 多变量决策树的结构为二叉树,实际上是多个线性模型的组合,原理可见下图:
多变量决策树
图4.13表示的是多变量决策树的结构,图4.14表示的是对应的分类边界

代码实现

定义数据集

首先将书中的数据集转换为方便计算机操作的形式,数据集如下图所示:
数据集
首先将各离散属性值进行编号:
颜色{青绿=0, 乌黑=1, 浅白=2}, 根蒂{蜷缩=0, 稍蜷=1, 硬挺=2}, 敲声{浊响=0, 沉闷=1, 清脆=2}, 纹理{清晰=0, 稍糊=1, 模糊=2}, 脐部{凹陷=0, 稍凹=1, 平坦=2}, 触感{硬滑=0, 软粘=1}, 结果{坏瓜=0, 好瓜=1}.
属性的排列顺序为图中的从左到右, 对应的代码如下:

import torch

# create training dataset
train_dataset=[[0, 0, 0, 0, 0, 0, 1],[1, 0, 1, 0, 0, 0, 1],
               [1, 0, 0, 0, 0, 0, 1],[0, 0, 1, 0, 0, 0 ,1],
               [2, 0, 0, 0, 0, 0, 1],[0, 1, 0, 0, 1, 1, 1],
               [1, 1, 0, 1, 1, 1, 1],[1, 1, 0, 0, 1, 0, 1],
               [1, 1, 1, 1, 1, 0, 0],[0, 2, 2, 0, 2, 1, 0],
               [2, 2, 2, 2, 2, 0, 0],[2, 0, 0, 2, 2, 1, 0],
               [0, 1, 0, 1, 0, 0, 0],[2, 1, 1, 1, 0, 0, 0],
               [1, 1, 0, 0, 1, 1, 0],[2, 0, 0, 2, 2, 0, 0],
               [0, 0, 1, 1, 1, 0, 0]
]

由于离散属性值无法直接代入线性模型,因此将离散属性one-hot化,并且为了方便后续计算损失值,标记为好瓜时,对应的标签 y = 1 y=1 y=1, 标记为坏瓜时,对应的标签 y = − 1 y=-1 y=<

  • 17
    点赞
  • 102
    收藏
    觉得还不错? 一键收藏
  • 15
    评论
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值