分类时为什么都选择one hot编码

原创 2018年04月16日 16:40:52
这里可以做一个思考啊,分类时,一般都会选择把类别用one hot进行编码,
比如共有5个类,那么就有5个编码
[1 0 0 0 0]
[0 1 0 0 0]
[0 0 1 1 1]
[0 0 0 1 0]
[0 0 0 0 1]

这是为什么呢?为什么不直接用1,2,3,4,5来表示5个类别呢?

个人觉得,一个很重要的原因在于计算loss时的问题。loss一般用距离来表示,
如果用1~5来表示,那么1和2的距离时1,而1和5的距离时4,但是按道理1和2、1和5的距离应该一样。
如果用one hot编码表示,那么1和2的距离跟1和5的距离时一样的。

当然,这里也可以说,通过判断,1和5是不是相等来决定距离,但是如果在神经网络里面,计算导数的时候,就是问题了。
版权声明: https://blog.csdn.net/b876144622/article/details/79962672

TensorFlow中的onehot有什么作用,为什么要使用onehot向量呢?

摘自:https://www.zhihu.com/question/53021606 考虑多类情况。非onehot,标签是类似0 1 2 3...n这样。 而onehot标签则是顾名思义,一...
  • c20081052
  • c20081052
  • 2017-07-17 20:53:44
  • 528

One-Hot Encoding与类别特征处理

机器学习 数据预处理之独热编码(One-Hot Encoding) 在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。 例如,考虑一下的三个特征: ["male", "female...
  • shenxiaoming77
  • shenxiaoming77
  • 2016-04-08 16:55:59
  • 3468

处理离散型特征和连续型特征共存的情况 归一化 论述了对离散特征进行one-hot编码的意义

处理离散型特征和连续型特征并存的情况,如何做归一化。 参考博客进行了总结: https://www.quora.com/What-are-good-ways-to-handle-discrete-an...
  • lujiandong1
  • lujiandong1
  • 2015-10-27 14:45:09
  • 4067

one-hot使用体会

在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。比如星期类型,有星期一、星期二、……、星期日,比如浏览器类型有["uses Firefox", "uses Chrome", "uses...
  • lanhaier0591
  • lanhaier0591
  • 2017-12-03 20:31:16
  • 521

One-Hot Encoding 及其使用原因

One-Hot Encoding 及其使用原因
  • taotiezhengfeng
  • taotiezhengfeng
  • 2017-06-24 15:40:45
  • 1109

数据处理之one-hot

分类方法,通常需要把数据的各个属性转换为一个向量表示,这样每条数据的特征就是一个向量,向量上的每个维度就表示了一个特征属性。 但是如果要转换的数据包含了3种属性,比如身高,体重,年龄。A是女,168c...
  • u010910436
  • u010910436
  • 2016-12-20 14:33:09
  • 2514

关于one-hot编码引发相关问题的一点感想

one-hot编码为什么可以解决类别型数据的离散值问题 首先,one-hot编码是N位状态寄存器为N个状态进行编码的方式 eg:高、中、低不可分,→ 用0 0 0 三位编码之后变得可分了,并...
  • christ1750
  • christ1750
  • 2016-04-07 21:06:52
  • 2688

数据处理——One-Hot Encoding

一、One-Hot Encoding     One-Hot编码,又称为一位有效编码,主要是采用位状态寄存器来对个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。     ...
  • google19890102
  • google19890102
  • 2015-03-03 16:54:06
  • 64789

one hot 编码及数据归一化

机器学习 数据预处理之独热编码(One-Hot Encoding) 问题由来 在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。 例如,考虑一下的三个特征: ...
  • dulingtingzi
  • dulingtingzi
  • 2016-05-11 14:51:33
  • 35546

one-hot编码

在实际的应用场景中,有非常多的特征不是连续的数值变量,而是某一些离散的类别。比如在广告系统中,用户的性别,用户的地址,用户的兴趣爱好等等一系列特征,都是一些分类值。这些特征一般都无法直接应用在需要进行...
  • Chloezhao
  • Chloezhao
  • 2016-12-06 14:51:24
  • 5483
收藏助手
不良信息举报
您举报文章:分类时为什么都选择one hot编码
举报原因:
原因补充:

(最多只允许输入30个字)