《统计学习方法》读书笔记-----决策树：模型概述

最新推荐文章于 2021-01-09 18:25:36 发布

fxlou

最新推荐文章于 2021-01-09 18:25:36 发布

阅读量426

点赞数

分类专栏： machine learning

本文链接：https://blog.csdn.net/fxlou/article/details/79589027

版权

machine learning 专栏收录该内容

15 篇文章 1 订阅

订阅专栏

0.简介

决策树是一种基本的分类与回归方法。决策树呈树形结构，分类问题的决策树可以认为是if-then规则地集合，也可以认为是定义在特征空间和类空间上的条件概率分布。其主要优点是模型具有可读性，分类速度快，学习时，利用训练数据，根据损失函数最小化的原则建立决策树模型。预测时，对于新的数据，利用决策树模型进行分类。决策树学习通常分为3个步骤：特征选择、决策树的生成和决策树的修剪。

1.决策树模型与学习

1.1 决策树模型
决策树是一种描述对实例进行分类的树形结构，如图1所示。

图1 决策树模型

决策树由结点和有向边组成，结点有两种类型：内部结点和叶结点。内部结点（椭圆1~4）表示一个特征或属性，叶结点（矩形A~F）表示一个类。
1.2 决策树与if-then规则
决策树可以看做是一个if-then规则地集合。如图2所示，决策树的根节点到叶节点的每一条路径对应着一条规则，内部结点对应着规则的条件，叶节点的类对应着规则地结论。

图2 单个规则的构成

决策树的路径或其对应的if-then规则集合具有一个重要性质：互斥而且完备。即每个实例都被一条路径或一条规则覆盖，而且只能被一条路径或规则覆盖。在图1中，每个矩形向上返回到椭圆1，有且只能有一条路径。

1.3 决策树与条件概率分布
决策树还表示给定特征条件下类的条件概率分布。假设输入空间（特征空间）为 $X$ ，对应的输出空间（类标签）为 $Y$ ，可以将基于 $X$ 判断 $Y$ 的问题看作是求条件概率分布的问题。假设 $X$ 为特征的随机变量， $Y$ 为类的随机变量，那么这个条件概率分布可以表示为 $P(Y|X)$ ，即已知特征空间 $X$ ，看各个叶节点中哪种类别的概率最大，就将实例强行分配概率最大的那一类上去。

图3 决策树对应的条件概率分布

如图3c所示，每一组条件对应一个特征空间的划分，X特征空间为所有划分的集合，假设类空间只有两个取值：正类和负类。图3c中红色条件组合对应着图3a中红色区域的特征空间子集。
如果某个单元c的条件概率满足 $P(Y=+1|X=c)>0.5$ ，则认为该单元属于正类，集落在该单元的实例都认为是正类。红色区域 $P(Y=+1|(x_{(1)}\leq a1,x_{(2)}\leq a2)>0.5$ ，因此落入此输入空间子集的实例均为正例。