sklearn -分类算法 -决策树

最新推荐文章于 2022-04-14 20:09:40 发布

置顶

来杯柠檬茶

最新推荐文章于 2022-04-14 20:09:40 发布

阅读量200

点赞数

分类专栏： sklearn 机器学习文章标签：决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tom199611/article/details/99308538

版权

`信息熵`（香农提出）

在这里插入图片描述
= 每一种类别的概率 * log 概率，求和，再乘以 -1

信息熵衡量不确定性，信息熵越小，不确定性也越小。信息熵越大，不确定性越大。

`信息增益` ：

表示得知特征A的信息之后，信息熵减少的程度。在这里插入图片描述
= 初始信息熵 – A条件信息熵

在这里插入图片描述

`初始信息熵`：只看目标值。是（9/15）和否（6/15）

`初始信息熵` = -1 （9/15log 9/15+6/15* log 6/15 ）

`年龄信息熵` :青年（5 / 15）中年（5 / 15）老年（5 / 15）

年龄信息熵 = -1 * [ 5/15 * H(青年) + 5/15 * H(中年)+5/15 * H（老年） ]

H(青年) = -1 (2/5log 2/5 + 3/5*log 3/5)

决策树：把信息增益越大的（不确定性下降越大的特征）放在树的越前面。

api :

from sklearn.tree import DecisionTreeClassifier
DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None)

criterion: 默认是’gini’系数，也可以选择信息增益’entropy’

max_depth:树的深度大小，

代码

import pandas as pd
from sklearn.tree import DecisionTreeClassifier

最低0.47元/天解锁文章

来杯柠檬茶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
sklearn -分类算法 -决策树

信息熵（香农提出）= 每一种类别的概率 * log 概率，求和，再乘以 -1信息熵衡量不确定性，信息熵越小，不确定性也越小。信息熵越大，不确定性越大。信息增益：表示得知特征A的信息之后，信息熵减少的程度。= 初始信息熵 – A条件信息熵初始信息熵：只看目标值。是（9/15）和否（6/15）初始信息熵 = -1 （9/15log 9/15+6/15* log...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。