机器学习-决策树

最新推荐文章于 2022-04-02 16:58:19 发布

万能的仓鼠

最新推荐文章于 2022-04-02 16:58:19 发布

阅读量317

点赞数

分类专栏：机器学习基础文章标签：机器学习决策树

本文链接：https://blog.csdn.net/OkingjerryO/article/details/78568682

版权

基础同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

机器学习

2 篇文章 0 订阅

订阅专栏

决策树

概述

特点

起源早：起源于机器学习前。
模仿人对事物决策的过程，并完全描述
计算效率高

缺点

轻量级，演算法相对较小
巧妙算法多，但给初学者选择带来不便（参数多）
没有代表性的决策树算法

什么是决策树

让电脑模仿人对事物决策的过程。决策的结构为树形结构，即从根为起点经过一系列判断最终走到叶子节点（终点），这段路径称为决策路径

表达方式

根据路径方式

G (x) = \sum t = 1 T q t (x) \cdot g t (x)

$G(x) = \sum_{t=1}^T{q_t(x)\cdot{g_t(x)}}$
其中

gt $g_t$ 为叶子节点，也就是所有的 决定结果。他们可以组成一个大区，形式可以为常量或者 liner 的。

qt $q_t$ 为条件:即从 head 到叶子节点的决策工程(ps: true false)

递归方式定义

G (x) = \sum c = 1 c [[b (x) = c]] \cdot G c (x)

$G(x) = \sum_{c=1}^c{[[b(x) = c]]\cdot G_c(x)}$

$b(x)$ 为不同决策分支
$G_c(x)$ 在 c 分支下做递归

算法

总体思路

设计如何做分支 $b(x)$
根据1设计出分块方法
设计停止条件或回传的叶子节点
然后各自递归学一颗小树
最后由程序递归的得到结果

与分而治之思想一致

代表算法

Classification and Regression Tree (C&RT)

特性

C = 2决策为一个二叉树
回传参数 gt(x) 为一个常数
- 0/1 Error：只返回一个最符合的
- 最后决策结束选一个出现频次最多的即可
分治方式 decision stump:通过一个特征寻找在哪个分段点分段最佳，寻找后在那里分段
在子树中希望找到purifying的数据组，通过加权纯度函数来决定最后结果
需要一个impurityFunciton来判断左右子树是否纯净
最后将不纯度最小化
树为fully-grown tree

纯度损失函数

regressionError

i m p u r i t y (D) = 1 N \sum n = 1 N (y n - y ̂) 2

$impurity(D) = \frac{1}{N}\sum_{n=1}^N{(y_n - \hat y)}^2$

y ̂ = A v g (y n)

$\hat{y} = Avg(y_n)$

$y_n$ 在第 n 个位置的 y 元素

classificationError（Gini）

i m p u r i t y (D) = 1 N \sum n = 1 N [[y n \neq y ̂]]

$impurity(D) = \frac{1}{N}\sum_{n=1}^{N}{[[y_n \not=\hat{y}]]}$

$\hat{y}$ 为 $y_n$ 的最多情况
使用GiniIndex

$1 - \sum k = 1 K (\sum N n = 1 [ [ y n = k ] ] N) 2$ $1-\sum_{k=1}^K{(\frac{ \sum_{n=1}^{N}{[[y_n = k]]} }{N})^2}$
这种Loss 的好处是不会一刀将看似不属于最纯分类的结果直接去掉，而是同样让他们在其中影响最后的结果

停止时机

impurity = 0:所有情况纯度一致
所有 $x_n$ 一致，没有执行decision stumps的地方

fully-grown tree 缺陷

如果输入类别全部不同则一定能得到 $E_in(G) = 0$ ，这样最后无法控制复杂度
容易 overfitting：越到叶子节点附近，资料量越少。此时会传回一个相对较小的纯度 Error 值导致 overfitting
于是需要对上文的树做 Regularzation,使其变为pruned decision tree

Regular 方法

表达式

a r g m i n A P G E i n (G) + λ Ω (G)

$argmin_{APG}E_{in}(G)+\lambda \Omega(G)$

$\lambda$ 在其中作为参数

可行的寻找 possible G的方法

首先得到fully tree
将每个叶子尝试和隔壁的叶子合并掉，合并后看看哪一个叶子得到的Error最小
再尝试合并两个，三个叶子。。。
最后进入上式的APG就只看这个筛选中固定的序列

ID3 决策树

类的切割函数

与C&RT的切割函数相似，但切割方法需要另外指定穷举
$b (x) = [[x i \leq θ]] + 1$ $b(x) = [[x_i\leq \theta]]+1$
注意这里前面的表述符是逻辑条件，满足即为1 不满足为0

其他补充

如果使用类 C&RT 算法时数据忘记切割。那么可以找替代品代替原切割方式

万能的仓鼠

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习-决策树

决策树目录决策树目录前景小合并大概述特点缺点什么是决策树表达方式根据路径方式递归方式定义算法总体思路代表算法Classification and Regression Tree CRT特性纯度损失函数regressionErrorclassificationErrorGini停止时机fully-grown tree 缺陷Regular 方法表达式可行的寻找
复制链接

扫一扫