独热编码——One-Hot Encoding

  • One-Hot Encoding介绍
    又称为一位有效编码,用N位状态寄存器来对N个状态进行编码,每个状态都由独立的寄存器表示,其中只有一位有效。
    对于1, 2, 3,经过独热编码后为001,010,100

  • 应用
    对于有些特征变量可能是属性变量,
    如color:[‘red’,‘blue’,‘green’]
    我们就要把这个color特征变量编码为数字。我们可编码为[1,2,3]。但是这样的编码并不能直接应用于我们的分类器中,因为分类器往往默认特征变量数据是连续的(可以计算距离的)、有序的(3>2>1)。但是按照我们的常识,如果像这样编码显然是不合理的,因为为‘red’、‘blue’、‘green’并没有什么联系,是相互独立的。
    因此我们就要使用独热编码来避免出现这种情况。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值