关于决策树损失函数来源的理解与推导

最新推荐文章于 2025-02-15 15:36:57 发布

需要努力的人

于 2018-08-22 12:45:44 发布

阅读量9.1k

点赞数 16

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wzk1996/article/details/81941572

版权

本文探讨了决策树学习中的损失函数，源于正则化的极大似然函数。通过反向推导，解释了叶节点实例数与经验熵乘积之和的含义，将其与极大似然函数联系起来，帮助读者深入理解决策树模型的损失函数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在阅读《统计学习方法》5.1.4决策树学习一节过程中，有如下一句话引起博主疑惑：决策树的损失函数通常是正则化的极大似然函数。书上并未给出具体推导，直到5.4决策树的剪枝中，直接给出了正则化的决策树损失函数： $C_{\alpha }(T)=\sum_{t=1}^{|T|}N_{t}H_{t}(T)+a|T|$ 。其中|T|代表叶节点个数， $N_{t}$ 表示具体某个叶节点的样例数， $H_{t}(T)表示叶节点经验熵$ 表示叶节点经验熵。

我们知道正则化的损失函数中前一项代表经验误差，而在概率模型中(决策树模型是一种概率模型)，经验误差函数的获得往往通过将极大似然函数取反，即将求极大化为求极小而获得。因此，在概率模型中，极大似然函数与经验误差函数可以认为是相同的概念，那么必然就可以通过经验误差函数来推导出极大似然函数，以此来加深对决策树损失函数的理解。

我相信有相当一部分读者与博主一样，并不理解决策树损失函数的真正意义，表面上来看：将每个叶节点的实例个数与其经验熵的乘积相加，这究竟代表个什么玩意呢？现在，我将利用该损失函数反向推导出极大似然函数，当我们看到极大似然函数时&#

最低0.47元/天解锁文章

需要努力的人

博客等级

码龄8年

1
原创

16
点赞

27
收藏

3
粉丝

关注

私信

热门文章

关于决策树损失函数来源的理解与推导 9164

最新评论

关于决策树损失函数来源的理解与推导
hao138548: 最后的极大似然的推导结论，把log提出去反而不利于理解了，如果是在用决策树做二分类，label符合伯努利分布(二项分布)，稍加变换就能得到交叉熵的结果，这也可以证明分类时决策树的损失函数等价于分类里面的交叉熵损失函数
关于决策树损失函数来源的理解与推导
东大梅西回复 louishao: 我也觉得是说反了，应该是先算每个叶子节点的，然后再在节点内部计算每个K
关于决策树损失函数来源的理解与推导
xcj_ 回复 louishao: 我觉得博主也说反了
关于决策树损失函数来源的理解与推导
张杰_: 博主，你好。根据最后极大似然函数，是否先是对k做累乘，再对t做累乘，这样的话是先对叶节点内部进行极大似然估计，再对外部进行极大似然估计？不知道我的理解有没有错误，请指正。
关于决策树损失函数来源的理解与推导
jsonlovemeat: 极大似然函数是概率的乘积吧？

最新文章

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

举报

选择你想要举报的内容（必选）

内容涉黄
政治相关
内容抄袭
涉嫌广告
内容侵权
侮辱谩骂
样式问题
其他

原文链接（必填）

请选择具体原因（必选）

包含不实信息
涉及个人隐私

请选择具体原因（必选）

侮辱谩骂
诽谤

请选择具体原因（必选）

搬家样式
博文样式