什么是 One-Hot 编码?

hello大家好,俺是没事爱瞎捣鼓又分享欲爆棚的叶同学!!!几天来科普一下One-Hot 编码哈!

One-Hot 编码 是一种将分类变量转换为二进制向量的编码方法,常用于机器学习模型处理非数值型数据。每个类别都会被转换成一个独立的二进制列,其中只有一个值为 1,其余都为 0。

为什么需要 One-Hot 编码?

在很多机器学习算法中,模型无法直接处理非数值型的分类数据,比如 'Title' 列就可能包含 'Mr.''Mrs.''Miss' 等类别。为了让模型能够使用这些数据,我们需要将它们转换为数值型特征。

One-Hot 编码的工作原理

假设我们有一个名为 Title 的列,包含以下三个类别:

  • 'Mr.'
  • 'Mrs.'
  • 'Miss'

通过 One-Hot 编码,这个列会被转换为三个独立的列,每个列表示一个类别:

TitleMr.Mrs.Miss
Mr.100
Mrs.010
Miss001
Mr.100
Miss001

在编码后,每个类别都对应一个二进制列,其中只有该类别对应的列为 1,其余列为 0。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值