目录
1、定义
One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。
2、例子
2.1五个样品,三个特征
特征一 | 特征二 | 特征三 | |
物品一 | 1 | 1 | 1 |
物品二 | 2 | 2 | 2 |
物品三 | 3 | 1 | 3 |
物品四 | 4 | 2 | 2 |
物品五 | 4 | 1 | 1 |
2.2特征可能取值
特征 | 特征一 | 特征二 | 特征三 |
情况 | 四种 | 两种 | 三种 |
2.3编码
以特征三为例,其有三种取值,用3个状态位来表示,以保证每个样本中的每个特征只有1位处于状态1,其他都是0
状态 | 编码 |
1 | 001 |
2 | 010 |
3 | 100 |
2.4最终表示
特征一 | 特征二 | 特征三 | |
物品一 | [0001] | [01] | [001] |
物品二 | [0010] | [10] | [010] |
物品三 | [0100] | [01] | [100] |
物品四 | [1000] | [10] | [010] |
物品五 | [1000] | [01] | [001] |
样本 | 特征向量 |
物品一 | [000101001] |
物品二 | [001010010] |
物品三 | [010001100] |
物品四 | [100010010] |
物品五 | [100001001] |
3、应用
3.1物品特征表
商品 | 颜色 | 尺寸 | 内存 | 价格 |
Iphone 5 | 金色 | 4 | 16G | 1358元 |
Iphone 6 | 银色 | 4.7 | 32G | 2788元 |
Iphone 6 plus | 白色 | 5.5 | 64G | 3656元 |
3.2描述
- 颜色特征值包括:[金色,银色,白色]
- 内存特征值包括:[16G,32G,64G]
商品 | 颜色 | 内存 |
Iphone 5 | [1,0,0] | [1,0,0] |
Iphone 6 | [0,1,0] | [0,1,0] |
Iphone 6 plus | [0,0,1] | [0,0,1] |
商品 | 特征向量 |
Iphone 5 | [1,0,0,1,0,0] |
Iphone 6 | [0,1,0,0,1,0] |
Iphone 6 plus | [0,0,1,0,0,1] |