本文介绍一个简单的编码转换方式。对不连续的标签编码成向量表示。
这个方法,用在神经网络实现分类任务时比较常见,对于神经网络输出层,输出一个向量,可以定义哪个维度是1,就代表是哪个类别。
#导包
from sklearn.preprocessing import LabelEncoder
from keras.utils import np_utils
#例子
a = [1, 2, 3, 4, 2, 1, 1, 2, 4]encoder = LabelEncoder()
encoded_Y = encoder.fit_transform(a)
dummy_y = np_utils.to_categorical(encoded_Y)
print(dummy_y, dummy_y.shape)<