hot编码 字符one_几种实现one-hot编码的方式

####方法1 之前写使用sklearn进行数据挖掘-房价预测(4)—数据预处理一文中处理标签类特征时候已经提到过,使用sklearn中提供的LabelEncoder和OneHotEncoder方法

a = ['A','B','A','C']

from sklearn.preprocessing import OneHotEncoder,LabelEncoder

label_value = label_encoder.fit_transform(a)

>>label_encoder.classes_

array(['A', 'B', 'C'], dtype='

>>label_value

array([0, 1, 0, 2], dtype=int64)

encoder = OneHotEncoder()

>>one_hot.toarray()

[[ 1. 0. 0.]

[ 0. 1. 0.]

[ 1. 0. 0.]

[ 0. 0. 1.]]

####方法2 sklearn提供的简单方法,上面两步可以合并为一步

from sklearn.preprocessing import LabelBinarizer

encoder = LabelBinarizer()

one_hot = encoder.fit_transform(a)

>>one_hot

array([[1, 0, 0],

[0, 1, 0],

[1, 0, 0],

[0, 0, 1]])

###方法3 这次需要隆重介绍的是这个方法,在TensorFlow代码中看到一个转为one-hot的实现,方法比较的独特,里面一些numpy方法自己之前也没有接触过,就摘抄下来,反复背诵并默写 =。=

def dense_to_one_hot(labels_dense, num_classes):

"""Convert class labels from scalars to one-hot vectors."""

num_labels = labels_dense.shape[0]

index_offset = np.arange(num_labels) * num_classes

labels_one_hot = np.zeros((num_labels, num_classes))

labels_one_hot.flat[index_offset + labels_dense.ravel()] = 1

return labels_one_hot

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值