one-hot编码解析
1、什么是one-hot编码?
One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。
2、如何编码?
例如:要编码 0 - 9 :用十位的0和1进行编码
0:1000000000
1:0100000000
2:0010000000
3:0001000000
4:0000100000
5:0000010000
6:0000001000
7:0000000100
8:0000000010
9:0000000001
3、one-hot编码优点:
<1>能够处理非连续型数值特征。
<2>在一定程度上也扩充了特征。比如性别本身是一个特征,可以用0表示女,1表示男,经过one-hot编码以后,就变成10表示女,01表示男,这样扩充了特征。
<3>one-hot编码后,在损失函数或准确率的计算时,变得非常方便。