决策树系列4：随机森林 (三个臭皮匠顶个诸葛亮)

最新推荐文章于 2024-12-31 07:49:35 发布

haoyutiangang

最新推荐文章于 2024-12-31 07:49:35 发布

阅读量1.2k

点赞数

分类专栏：决策树机器学习文章标签：决策树机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haoyutiangang/article/details/104803157

版权

随机森林是一种基于bagging思想的机器学习方法，通过构建多棵决策树并行训练，以达到更好的预测效果。在随机森林中，样本集和属性集在构建每棵树时都会进行随机选择，确保每棵树的独立性和多样性。在分类问题中，随机森林采用投票方式决定最终结果；在回归问题中，则取所有树预测结果的平均值。随机森林在训练过程中能有效防止过拟合，提高模型稳定性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

引言

想了解一个人的人品一般询问多个熟悉他的人，而不是只问一个人，毕竟一个人的评价难免有失偏颇。对于决策树也是一样，单一的决策树有时候会过拟合，有时候效果不太理想。而随机森林就是利用多棵决策树共同做决策。毕竟三个臭皮匠顶个诸葛亮嘛。

随机森林

随机森林主要利用了 bagging 的思想，也就是多个学习器并行学习，共同预测结果。

随机森林有多棵决策树，每棵决策树并行独立训练。预测时每个决策树都预测出一个结果，大家共同决策：

对于分类问题：大家投票少数服从多数
- 例如今天是否适合打球
对于回归问题：大家求平均值
- 例如北京房价多少钱一平米

如何建立随机森林

随机森林之所以叫"随机"森林，是因为建立时有两个随机。

每棵树的样本集随机
- 为了保证训练数据的相对独立性
每棵树的属性集随机
- 为了保证训练过程的相对独立性

样本集随机

假设原始样本集有 N 个样本，则每棵树从中有放回的选择 N 个样本作为自己的样本集，这样每个树的样本集仍然是 N 个。

但由于是有放回的，所以对于一棵决策树而言，有些样本被选择了多次，有些样本没有被选到。

既保证了每棵树样本集个数和分布的一致，又保证了每个树的样本集相对独立。

属性随机

最低0.47元/天解锁文章

博客等级

码龄9年

79
原创

165
点赞

659
收藏

189
粉丝

关注

私信

热门文章

分类专栏

决策树 7篇
Hadoop实战 4篇
ZooKeeper
Flume 1篇
Kafka 2篇
Storm 2篇
项目基础 2篇
Hive 3篇
Java 2篇
Spark 1篇
算法 14篇
LeetCode 14篇
机器学习 48篇
深度学习 41篇
吴恩达 34篇

最新评论

深度学习系列6：卷积神经网络的反向传播
提莫队长刘谢文: 兄弟，请问解决了吗？是直接相加吗？
吴恩达Coursera深度学习课程 deeplearning.ai (4-4) 人脸识别和神经风格转换--编程作业
自向阳_: def compute_layer_style_cost(a_S, a_G): """ Arguments: a_S -- tensor of dimension (1, n_H, n_W, n_C), hidden layer activations representing style of the image S a_G -- tensor of dimension (1, n_H, n_W, n_C), hidden layer activations representing style of the image G Returns: J_style_layer -- tensor representing a scalar value, style cost defined above by equation (2) """ ### START CODE HERE ### # Retrieve dimensions from a_G (≈1 line) m, n_H, n_W, n_C = a_G.get_shape().as_list() # Reshape the images to have them of shape (n_C, n_H*n_W) (≈2 lines) a_S = tf.transpose(tf.reshape(a_S, [n_H * n_W, n_C])) a_G = tf.transpose(tf.reshape(a_G, [n_H * n_W, n_C])) # Computing gram_matrices for both images S and G (≈2 lines) GS = gram_matrix(a_S) GG = gram_matrix(a_G) # Computing the loss (≈1 line) J_style_layer = (1 / (2 * n_C * n_W * n_H) ** 2) * (tf.reduce_sum(tf.square(tf.subtract(GS, GG)))) ### END CODE HERE ###
深度学习系列6：卷积神经网络的反向传播
AgileFastx: 请问对于多filter的情况如何求dA
决策树系列3：信息增益、增益率、基尼系数 (史上最详尽)
Artemisia_Cain: 这里信息增益的举例算错了吧，应该是Ent(X|场地=室外)后面不应该是logbase2吗？log()这怎么直接用的lg来算啊，lg(1/2)才是0.3010。
吴恩达Coursera深度学习课程 deeplearning.ai (4-4) 人脸识别和神经风格转换--编程作业
qq_43724777: The Session graph is empty. Add operations to the graph before calling run().

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。