随机森林的基础知识学习

本文介绍了随机森林的基础知识,包括分类与回归模型的工作原理,强调了其在业务中的应用场景和参数调整要点。同时,讨论了随机森林处理缺失值的能力和特征重要性的计算方式。还分享了模型的保存和调用方法,以及如何在Markdown中插入各种元素,如代码片段、列表、表格和图表。
摘要由CSDN通过智能技术生成

@随机森林的预测模型

随机森林的基础知识

随机森林的模型分为分类模型和回归模型,但是无论是针对分类预测还是连续性型的预测,其本质上都是一个一个的分类(划分区间)进行预测的思想,对于分类模型来说,落在不同的树节点的就意味着是不同的输出,最后可以预测出不同的分类类型,而对于回归模型来说,也实质是相当于每个节点都是有固定的数值的,因此当样本量远远大于我们的树节点的时候就会出现预测的结果相同的情况。

业务场景应用的反思

1)在实际的业务应用中,考虑到随机森林的鲁棒性比较高,经常成为做分类回归预测模型的考虑之内,但是值得注意的是随机森林在预测是不能有缺失值的输入的,但是Xgboost是可以的。
2)随机森林在进行参数调节的时候会涉及到的参数主要是,max_depth, n_estimators,bootstrap=True, max_features=‘sqrt’,但是注意的是对于深度或者是最大叶子节点的设置不可过多也不可太少,需要视具体情况而定
3)对于随机森林的重要性特征的输出,其实质是计算的袋外误差率的占比情况,因为随机森林每次都是又放回的随机抽样这就导致了大概会有1/3 的样本是不会被抽到进入到模型的训练中的,这就意味着这部分的数据其实是可以当作我们的测试集的。
4)其次是随机森林还可以输出每棵树上的每个节点的划割情况
5)此外随机森林还是对缺失数据进行填充处理

模型的保存和调用

模型的保存:
from sklearn.externals import joblib
joblib.dump(rf_model_1,‘rf_model_2.m’)
调用模型:
rf_model_2=joblib.load(‘rf_model_2.m’)

Alt

带尺寸的图片: Alt

居中的图片: Alt

居中并且带尺寸的图片: Alt

当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。

如何插入一段漂亮的代码片

博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片.

// An highlighted block
var foo = 'bar';

生成一个适合你的列表

  • 项目
    • 项目
      • 项目
  1. 项目1
  2. 项目2
  3. 项目3
  • 计划任务
  • 完成任务

创建一个表格

一个简单的表格是这么创建的:

项目 Value
电脑 $1600
手机 $12
导管 $1

设定内容居中、居左、居右

使用:---------:居中
使用:----------居左
使用----------:居右

第一列 第二列 第三列
第一列文本居中 第二列文本居右 第三列文本居左

SmartyPants

SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:

TYPE ASCII HTML
Single backticks 'Isn't this fun?' ‘Isn’t this fun?’
Quotes "Isn't this fun?" “Isn’t this fun?”
Dashes -- is en-dash, --- is em-dash – is en-dash, — is em-dash

创建一个自定义列表

Markdown
Text-to- HTML conversion tool
Authors
John
Luke

如何创建一个注脚

一个具有注脚的文本。1

注释也是必不可少的

Markdown将文本转换为 HTML

KaTeX数学公式

您可以使用渲染LaTeX数学表达式 KaTeX:

Gamma公式展示 Γ ( n ) = ( n − 1 ) ! ∀ n ∈ N \Gamma(n) = (n-1)!\quad\forall n\in\mathbb N Γ(n)=(n1)!n

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值