tensorflow中tf.one_hot()函数的作用是将一个值化为一个概率分布的向量,一般用于分类问题。
具体用法以及作用见以下代码:
y_train_dataset = np.concatenate((y_dataset_cate1,y_dataset_cate6,y_dataset_cate7,y_dataset_cate10),axis=0)
encoder = LabelEncoder()
encoder.fit(y_train_dataset)
y_train_dataset = encoder.transform(y_train_dataset)
print y_train_dataset
b = tf.one_hot(y_train_dataset,4,1,0)
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
sess.run(b)
print('after one_hot',sess.run(b))
# y_train_dataset = np_utils.to_categorical(y_train_dataset,num_classes=4)
结果:
利用keras的 from keras.utils import np_utils可以实现相同的功能,代码如下:
y_train_dataset = np.concatenate((y_dataset_cate1,y_dataset_cate6,y_dataset_cate7,y_dataset_cate10),axis=0)
encoder = LabelEncoder()
encoder.fit(y_train_dataset)
y_train_dataset = encoder.transform(y_train_dataset)
y_train_dataset = np_utils.to_categorical(y_train_dataset,num_classes=4)
print y_train_dataset
结果:
其中,共同用到了from sklearn.preprocessing import LabelEncoder
将原来的中文标签转换成数字,然后再分别用tf或者keras完成OneHot变换!