-
One-Hot Encoding介绍
又称为一位有效编码,用N位状态寄存器来对N个状态进行编码,每个状态都由独立的寄存器表示,其中只有一位有效。
对于1, 2, 3,经过独热编码后为001,010,100 -
应用
对于有些特征变量可能是属性变量,
如color:[‘red’,‘blue’,‘green’]
我们就要把这个color特征变量编码为数字。我们可编码为[1,2,3]。但是这样的编码并不能直接应用于我们的分类器中,因为分类器往往默认特征变量数据是连续的(可以计算距离的)、有序的(3>2>1)。但是按照我们的常识,如果像这样编码显然是不合理的,因为为‘red’、‘blue’、‘green’并没有什么联系,是相互独立的。
因此我们就要使用独热编码来避免出现这种情况。
独热编码——One-Hot Encoding
最新推荐文章于 2024-03-03 18:43:05 发布