【TensorFlow】决策森林(TF-DF模型)

TensorFlow Decision Forests,是一个基于 Keras 的决策森林 TensorFlow 开源软件库。它旨在于将一些最前沿的决策森林算法(例如,随机森林、GBDT、LambdaMart)以一种易用的方式引入 TensorFlow 中。长时间以来,决策森林一直是建模表格类数据的最前沿机器学习算法。在许多机器学习应用(比如学习排名)中,决策森林都可提供卓越的性能。

分类和决策森林

什么是分类?
  • 一个表格数据集
  • 其中包含样本(行)和属性(列)
  • 一些属性上类别属性,一些属性是数字属性

在这里插入图片描述

分类:利用模型通过其他属性预测类别属性。

在这里插入图片描述

分类为什么很重要?
  • 可以获取不易获取或者成本高昂的数据
什么是模型?

模型:选择(或训练)能够最好的匹配可用观察结果(称为“有标签样本”)的模型。

在这里插入图片描述

决策树
  • 一种常用模型
  • 在树状结构中以分层形式组织而成的一组问题(用绿色标示,也称为决策节点)
  • 叶节点(用黄色标示)包含预测结果
  • 通常情况下,问题针对的都是单个属性(轴对齐),并且答案都是二元化的(二叉树)

在这里插入图片描述

决策树学习

采用贪心策略,一个问题一个问题的生长,以将局部评分函数(例如信息增益、均方误差)最大化。

在这里插入图片描述
不断递归,得到一颗决策树:
在这里插入图片描述

决策森林
  • 对多个决策树的预测结果求和
  • 通常包含数百个或数千个决策树
  • 相比单个决策树,预测结果往往更准确(但速度更慢)
  • 可采用不同算法来一起训练决策树(例如随机森林、梯度提升树、AdaBoost)

在这里插入图片描述

TensorFlow决策森林库

  • TensorFlow提供一系列决策森林算法
  • 易于使用
  • 可用使用TensorFlow工具箱
  • 支持进阶设置,例如决策森林+神经网络的组合

TF-DF的核心代码:
在这里插入图片描述
模型可视化:
在这里插入图片描述
summary显示模型的各种信息:
在这里插入图片描述
和tensorflow其他工具一起使用:
在这里插入图片描述

何时使用决策森林?
  • 处理表格数据
  • 简易性:无需过多调整
  • 可解读性
  • 速度:包括训练速度和推断速度
  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

椰卤工程师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值