分类回归树与随机森林

最新推荐文章于 2024-04-29 14:11:23 发布

*Major*

最新推荐文章于 2024-04-29 14:11:23 发布

阅读量1.8k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41375318/article/details/108111894

版权

$分类回归树与随机森林$

机器学习：sklearn实现决策树和随机森林

一分类回归树

模型：树（非参数模型）
参数：分裂的特征及阈值
目标函数
– 损失函数：L2损失／GINI指数
– 正则项：树的节点数目（L0）、叶子结点分数平方和（L2）
优化
– 建树
– 剪枝

Classification And Regression Tree （CART）: 机器学习十大算法之一，是一个用于监督学习的非参数模型
二分递归分割：将当前样本集合划分为两个子样本集合，使得生成的每个非叶子结点都有两个分支–>生成的树是二叉树

在这里插入图片描述

回归树

在这里插入图片描述
例：预测t时刻我是否喜欢Romantic Music

在这里插入图片描述

树模型的优点

容易解释
不要求对特征做预处理
– 能处理离散值和连续值混合的输入
– 对特征的单调变换不敏感 (只与数据的排序有关)
– 能自动进行特征选择
– 可处理缺失数据
可扩展到大数据规模

树模型的缺点

正确率不高：建树过程过于贪心

– 可作为Boosting的弱学习器（深度不太深）

模型不稳定（方差大）：输入数据小的变化会带来树结构的变化

– Bagging：随机森林

当特征数目相对样本数目太多时，容易过拟合

二随机森林

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。