决策树

最新推荐文章于 2023-06-25 14:18:05 发布

eye_water

最新推荐文章于 2023-06-25 14:18:05 发布

阅读量408

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/eye_water/article/details/80236319

版权

本文介绍了决策树在贷款问题中的应用，包括决策树的概念、特征选择、信息增益、ID3算法以及决策树的剪枝策略，旨在通过信息熵和信息增益构建有效的决策树模型，防止过拟合。

摘要由CSDN通过智能技术生成

前言

本文关于贷款问题以及公式均来自于李航博士的《统计学习方法》，只是在此基础上增加一点个人理解

正文

决策树

决策树实质上是以特征划分为基础，对于给定的实例 $\displaystyle x$ 来预测其结果 $\displaystyle y$
假设对于一个贷款问题，数据如下
这里写图片描述
问题描述如下：
希望通过所给的训练数据学习一个贷款申请的决策树，用以对未来的贷款申请进行分类，即当新的客户提出贷款申请时，根据申请人的特征利用决策树决定是否批准贷款申请
我们很容易就可以画出一个复杂度比较高的决策树：
这里写图片描述
假设0和1代表不批准贷款以及批准贷款，分别以A1, A2, A3, A4表示年龄、有工作、有自己的房子和信贷情况4个特征，并以1，2，3表示年龄的值为青年、中年、老年，以1，2表示有工作和有自己的房子的值为是和否，以1，2，3表示信贷情况的值为非常好、好、和一般
通过上图的决策树，我们可以得出一下结论

P (Y = 1 | A 2 = 1) = 1

$P(Y=1|A2=1) = 1$

P (Y = 0 | A 1 = 1, A 2 = 2) = 0

$P(Y=0|A1=1, A2=2) = 0$

P (Y = 1 | A 1 = 2, A 2 = 2, A 3 = 1) = 1

$P(Y=1|A1=2, A2=2, A3=1) = 1$

. . .

$...$
这样就验证了开始说的： 决策树实质上是以特征划分为基础，对于给定的实例 $\displaystyle x$ 来预测其结果 $\displaystyle y$
很明显通过上例可以看出所构造的决策树过于复杂，并且过于依赖训练数据，很容易造成过度拟合，首先先解决决策树过于复杂问题，再解决过度拟合问题

特征选择

不同的特征选择方法会生成不同的决策树，很明显我们需要最优的选择方法，为了最优化特征选择引入信息增益概念

熵
熵表示随机变量的不确定性的度量， $\displaystyle X$ 是一个取有限个值的离散随机变量，其概率分布为

P (X = x i) = p i, i = 1, 2, . . . n

$P(X=xi)=pi, \ \ \ i=1,2,...n$
则随机变量的熵定义为

H (X) = - \sum i = 1 n p i log p i

$H(X)=-\sum ^{n}_{i=1}p_{i}\log pi$

条件熵
设有随机变量 $\displaystyle (X,Y)$ ，其联合概率分布为

P (X = x i, Y = y i) = p i j, i = 1, 2, . . . n; j = 1, 2, . . . m

$P(X=xi, Y=yi)=pij, \ \ \ i=1,2,...n; \ \ \ j=1,2,...m$
条件熵

H(Y|X) H ( Y | X ) $\displaystyle H(Y|X)$ 表示再已知变量

X X $\displaystyle X$ 的条件下随机变量

Y

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。