多变量决策树

最新推荐文章于 2024-07-11 09:58:56 发布

weixin_44132485

最新推荐文章于 2024-07-11 09:58:56 发布

阅读量8.8k

点赞数 17

分类专栏：读书笔记(周志华机器学习) 文章标签：决策树机器学习算法 python

本文链接：https://blog.csdn.net/weixin_44132485/article/details/106502422

版权

本文详细介绍了如何使用PyTorch实现多变量决策树，包括数据集的准备、线性模型定义、损失函数设计、决策树节点构建、模型训练与评估等步骤。通过递归方式生成决策树，并实现预测和评估功能。

摘要由CSDN通过智能技术生成

简单介绍

本文使用PyTorch进行多变量决策树的实现. 多变量决策树的结构为二叉树，实际上是多个线性模型的组合，原理可见下图：

图4.13表示的是多变量决策树的结构，图4.14表示的是对应的分类边界

代码实现

定义数据集

首先将书中的数据集转换为方便计算机操作的形式，数据集如下图所示：

首先将各离散属性值进行编号:
颜色{青绿=0, 乌黑=1, 浅白=2}, 根蒂{蜷缩=0, 稍蜷=1, 硬挺=2}, 敲声{浊响=0, 沉闷=1, 清脆=2}, 纹理{清晰=0, 稍糊=1, 模糊=2}, 脐部{凹陷=0, 稍凹=1, 平坦=2}, 触感{硬滑=0, 软粘=1}, 结果{坏瓜=0, 好瓜=1}.
属性的排列顺序为图中的从左到右, 对应的代码如下:

import torch

# create training dataset
train_dataset=[[0, 0, 0, 0, 0, 0, 1],[1, 0, 1, 0, 0, 0, 1],
               [1, 0, 0, 0, 0, 0, 1],[0, 0, 1, 0, 0, 0 ,1],
               [2, 0, 0, 0, 0, 0, 1],[0, 1, 0, 0, 1, 1, 1],
               [1, 1, 0, 1, 1, 1, 1],[1, 1, 0, 0, 1, 0, 1],
               [1, 1, 1, 1, 1, 0, 0],[0, 2, 2, 0, 2, 1, 0],
               [2, 2, 2, 2, 2, 0, 0],[2, 0, 0, 2, 2, 1, 0],
               [0, 1, 0, 1, 0, 0, 0],[2, 1, 1, 1, 0, 0, 0],
               [1, 1, 0, 0, 1, 1, 0],[2, 0, 0, 2, 2, 0, 0],
               [0, 0, 1, 1, 1, 0, 0]
]

由于离散属性值无法直接代入线性模型，因此将离散属性one-hot化，并且为了方便后续计算损失值，标记为好瓜时，对应的标签 $y = 1$ , 标记为坏瓜时，对应的标签 $y = <$

最低0.47元/天解锁文章

weixin_44132485

关注

17
点赞
踩
102

收藏

觉得还不错? 一键收藏
15
评论
多变量决策树

简单介绍本文使用PyTorch进行多变量决策树的实现. 多变量决策树的结构为二叉树，实际上是多个线性模型的组合，原理可见下图：图4.13表示的是多变量决策树的结构，图4.14表示的是对应的分类边界代码实现定义数据集首先将书中的数据集转换为方便计算机操作的形式，数据集如下图所示：首先将各离散属性值进行编号:颜色{青绿=0, 乌黑=1, 浅白=2}, 根蒂{蜷缩=0, 稍蜷=1, 硬挺=2}, 敲声{浊响=0, 沉闷=1, 清脆=2}, 纹理{清晰=0, 稍糊=1, 模糊=2}, 脐部{凹陷=
复制链接

扫一扫

专栏目录