类别名称转换为一一对应的数字标签
1.软件环境
Windows 10-10.0.17134-SP0
Keras 2.1.6
Python 3.6.3
Tensorflow 1.7.0
2.问题描述
在某些时候,例如使用mask_RCNN进行目标检测时,对每一幅图上有多个标记样本,那么就需要将类别的名字转换为数字标签传入到分类器中,比如,用颜色来举例:
'blue'=1
'yellow'=2
'red'=3
我们在输入类别的时候,不能输入['blue','yellow','red'],因为在里面进行计算LOSS,反向传播等等,都是利用数字在进行计算,而且不仅仅只有['blue','yellow','red']这一种方式,还有['red','yellow','blue']等各种排列方式,那么:如何将['blue','yellow','red']转换位对应关系的[1,2,3]呢?
3.解决方法
我们知道在python的字典中,是存在一一对应的关系的,也就是key-value键对,我们可以利用字典的这个特性将类别名称(字符串)与标签(数字)进行绑定,进而完成该对应转换!
3.1.定义str2num函数
首先,我们需要定义一个函数str2num:
def str2num(s):
digits = {'blue': 1, 'yellow': 2, 'red': 3, 'white': 4, 'black': 5}
return digits[s]
这就完成了标签与数字的绑定。
3.2.使用map函数批量处理
使用python自带的map函数对['blue','yellow','red']进行处理:
id_list = list(map(str2num, ['blue','yellow','red']))
这样就完成了转换:
id_list=[1,2,3]
即:
然后再根据需要对上述标签进行ont-hot编码了!