- 博客(6)
- 收藏
- 关注
原创 关于决策树
CART算法是在给定输入变量X条件下输出随机变量Y的条件概率分布的学习方法,该方法假设决策树是二叉树,内部节点特征的取值为“是”和“否”。使用信息增益作为划分训练数据集的特征,存在偏向于选择取值较多的特征的问题,而信息增益比可以对该问题进行矫正。信息增益表示得知特征X的信息而使得类Y的信息不确定性减少的程度,标记为g(Y,X)。假设决策树T TT的叶结点个数为|T|,t是树的叶结点,该结点有Nt个样本,其中k类的样本点有Ntk。条件熵:条件熵H(Y|X)表示在已知随机变量X的条件下随机变量Y 的不确定性。
2023-04-17 12:39:25 94
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人