C2-3.3.4 One-hot编码

C2-3.3.4 决策树-One-hot编码 + 连续价值数据分类

前面提到的决策树——判断是否是 “猫”,利用的是二叉树原理——即:只有两个判断结果 “是否软耳”、“是否有胡子”…

  • 但是面对有:三个 / 多个 选项(树的分叉)的时候怎么解决???这时就提出了——One-hot编码
  • 二分类 / 多分类可以解决,那对于连续的数字呢??? 8.1 8.2 16.88 17.2 … 这些表示体重,研究发现通过体重的判别,也是一个很有价值的分类指标——连续价值数据分类

在这里插入图片描述

1、One-hot编码

在这里插入图片描述

2、连续价值数据分类

研究发现,Weight这个指标,对分类有着很大的影响,但是它不像Face Shape 。。。这样的指标,就两种 / 三种 结果。而它是连续的。。。

如何解决呢??——通过一个阀值,大于阀值的判别它大概率是 猫/狗…

然后利用 “信息增益”——来选择最合适的阀值的值

在这里插入图片描述

  • 10
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值