python机器学习---监督学习---决策树和随机森林（用于分类和回归）

最新推荐文章于 2024-05-10 15:03:16 发布

anne_wang_swufe

最新推荐文章于 2024-05-10 15:03:16 发布

阅读量3.9k

点赞数 3

分类专栏： python机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42156897/article/details/94025136

版权

目录

1.1决策树的基本原理

1.2 决策树的优势和不足

2、随机森林

2.1随机森林的基本原理

2.2 随机森林的优势和不足

3、实战案例---收入预测案例

备注：本文主要来自于对《深入浅出python机器学习》书籍的学习总结笔记，感兴趣的同学可以购买本书学习,学习的本质就是形成自己的逻辑。

1、决策树

1.1决策树的基本原理

决策树有分类树---对离散变量做的决策树，也有回归树---对连续变量做的决策树。

决策树的数学原理是信息熵，样本的具有一定的集中度（规律）信息熵就小，样本都是随机的，信息熵就大。

决策树算法参数如下：

class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, splitter=’best’, max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None, random_state=None, max_leaf_nodes=None, min_impurity_decrease=0.0, min_impurity_split=None, class_weight=None, presort=False)
具体参数说明见：https://blog.csdn.net/linzhjbtx/article/details/85722187

1.2 决策树的优势和不足

（1）优势---它很容易就能将模型的决策机制可视化出来（使用graphviz工具），让非专业人士也能看明白；另外，它是对每个样本特征进行单独处理，因此不需要太多的数据预处理。

（2）不足---容易出现过拟合的的情况，为了避免这种不足，可以采用集合学习的方法，也就是将要介绍的随机森林算法。

2、随机森林

2.1随机森林的基本原理

随机森林是利用随机的方式将许多决策树组合成一个森林，每棵树的参数都不相同，然后在把每棵树预测的结果取平均值，这样即可以保留决策树们的工作成效，又可以降低过拟合的风险。它是一种结合算法，在机器学习中有很多集合算法。

最低0.47元/天解锁文章

anne_wang_swufe

关注

3
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
python机器学习---监督学习---决策树和随机森林（用于分类和回归）

目录1、决策树1.1决策树的基本原理1.2 决策树的优势和不足2、随机森林2.1随机森林的基本原理2.2 随机森林的优势和不足3、实战案例---收入预测案例备注：本文主要来自于对《深入浅出python机器学习》书籍的学习总结笔记，感兴趣的同学可以购买本书学习,学习的本质就是形成自己的逻辑。1、决策树1.1决策树的基本原理决策树有分类树---对离散...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。