python encoder_python – Tensorflow One Hot Encoder？

阎立夫

于 2021-02-19 11:59:31 发布

阅读量86

点赞数

文章标签： python encoder

本文链接：https://blog.csdn.net/weixin_34445112/article/details/114361174

版权

从TensorFlow 0.8开始,现在有一个native one-hot op, tf.one_hot可以将一组稀疏标签转换为密集的单热表示.这是tf.nn.sparse_softmax_cross_entropy_with_logits的补充,在某些情况下,您可以直接在稀疏标签上计算交叉熵,而不是将它们转换为单热.

以前的答案,如果你想以旧的方式做到这一点：

@ Salvador的答案是正确的 – 那里(以前)没有本地操作.但是,您可以使用稀疏到密集的运算符在tensorflow中本地执行此操作,而不是在numpy中执行此操作：

num_labels = 10

# label_batch is a tensor of numeric labels to process

# 0 <= label < num_labels

sparse_labels = tf.reshape(label_batch, [-1, 1])

derived_size = tf.shape(label_batch)[0]

indices = tf.reshape(tf.range(0, derived_size, 1), [-1, 1])

concated = tf.concat(1, [indices, sparse_labels])

outshape = tf.pack([derived_size, num_labels])

labels = tf.sparse_to_dense(concated, outshape, 1.0, 0.0)

输出标签是batch_size x num_labels的单热矩阵.

另请注意,截至2016-02-12(我假设最终将成为0.7版本的一部分),TensorFlow还具有tf.nn.sparse_softmax_cross_entropy_with_logits操作,在某些情况下可以让您进行培训而无需转换为一热编码.

编辑添加：最后,您可能需要明确设置标签的形状.形状推断无法识别num_labels组件的大小.如果您不需要使用derived_size的动态批量大小,则可以简化此操作.

编辑2016-02-12更改以下评论的outshape分配.

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

阎立夫

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Tensorflow学习： one-hot编码

Eric2016_Lv的博客

08-21

6288

问题源于Udacity深度学习视频13，14课不解之处。 https://classroom.udacity.com/courses/ud730/lessons/6370362152/concepts/63713510510923一、One-Hot Encoding One-Hot编码，又称为一位有效编码，主要是采用位状态寄存器来对个状态进行编码，每个状态都由他独立的寄存器位，并且在任意

OneHot编码 Tensorflow实现和keras实现

Mr_Brooks的博客

05-23

4467

tensorflow中tf.one_hot()函数的作用是将一个值化为一个概率分布的向量，一般用于分类问题。具体用法以及作用见以下代码：y_train_dataset = np.concatenate((y_dataset_cate1,y_dataset_cate6,y_dataset_cate7,y_dataset_cate10),axis=0) encoder = LabelEncoder()...

参与评论您还未登录，请先登录后发表或查看评论

TensorFlow 中one_hot讲解以及多分类标签与one-hot转换

06-19

1万+

TensorFlow的one-hot函数讲解 import tensorflow as tf tf.one_hot(indices, depth, on_value, off_value, axis) indices是一个列表,指定张量中独热向量的独热位置，或者说indeces是非负整数表示的标签列表。len(indices)就是分类的类别数。 tf.one_hot返回的张量的阶数为ind...

【Tensorflow】Cifar-10

Mister5ive的专栏

09-10

1625

tensorflow官方CIFAR-10 教程学习笔记主要包括以下四部分：文件作用 cifar10_input.py 读取本地CIFAR-10的二进制文件格式的内容。 cifar10.py 建立CIFAR-10的模型。 cifar10_train.py 在CPU或GPU上训练CIFAR-10的模型。 cifar10_eval.py 评估C...

TensorFlow学习笔记--onehot编码

qq_41004007的博客

09-01

1754

onehot：顾名思义--独热适用：因为有些数据集并非连续性的，例如常见的多分类，适用于离散型的数据集离散型的数据集：二分类，多分类等等连续型的数据集：语言识别，文本等等对比普通label，和做了onehot编码的label 这里假设为四分类batch_size为4 普通标签 label = [0,1,2,3] onehot编码标签 label = [[1,0，0，0],...

对python 数据处理中的LabelEncoder 和 OneHotEncoder详解

09-20

在这个过程中，LabelEncoder和OneHotEncoder是两种常用的编码工具，它们分别用于处理标签编码和独热编码的需求。 LabelEncoder是sklearn库中preprocessing模块的一个工具类，它的作用是将数据中的标签进行编码，...

Python数据预处理.rar_Python数据处理_python_python 预处理_数据清洗_数据预处理

07-15

`LabelEncoder`和`OneHotEncoder`分别用于分类变量的数字编码和多类别变量的独热编码；特征选择可以通过`SelectKBest`或`RFE`（递归特征消除）等方法实现。 4. **数据类型转换**：数据预处理过程中经常需要将数据...

对python sklearn one-hot编码详解

12-25

one-hot编码的作用使用one-hot编码，将离散特征的取值扩展到了欧式空间，离散特征的某个取值就对应欧式空间的某个点 ...enc = preprocessing.OneHotEncoder() enc.fit([[0, 0, 3], [1, 1, 0], [0, 2

python对离散变量的one-hot编码方法

09-20

接着演示了使用LabelEncoder与OneHotEncoder组合进行编码的过程，包括如何处理出现的ValueError，即当OneHotEncoder尝试直接编码字符型数据时产生的错误。总结来说，本文向读者介绍了在Python中进行离散变量one-...

手动实现One-Hot编码完整实现Python版

10-29

需要注意的是，手动实现One-Hot编码虽然有助于理解和掌握其工作原理，但在实际应用中，我们通常会使用如`pandas.get_dummies()`或`sklearn.preprocessing.OneHotEncoder`这样的库函数，因为它们更高效且能够自动处理...

tensorflow one-hot独热编码

yeler082的博客

05-20

3397

1 基本概念解释下什么叫做独热编码（one-hot encoding），独热编码一般是在有监督学习中对数据集进行标注时候使用的，指的是在分类问题中，将存在数据类别的那一类用X表示，不存在的用Y表示，这里的X常常是1， Y常常是0。，举个例子：比如我们有一个5类分类问题，我们有数据，其中类别有五种取值（因为是五类分类问题），所以如果为第一类那么其独热编码为：[1,0,0,0...

独热码(One-Hot编码)

chbxw

06-02

1207

OneHotEncoder has been deprecated in 2.3.0 and will be removed in 3.0.0. Please use OneHotEncoderEstimator instead. OneHotEncoder 独热编码（OneHotEncoder）将标签指标映射为二值向量，其中最多一个单值。 import org.apache.spark.ml...

【TensorFlow】onehot编码

liudongdong_jlu

08-09

903

def onehot(labels): 　　'''one-hot 编码''' 　　#数据有几行输出　　n_sample = len(labels) 　　#数据分为几类。因为编码从0开始所以要加1 　　n_class = max(labels) + 1 　　#建立一个batch所需要的数组，全部赋0. 　　onehot_labels = np.zeros((n_sample, n_class))...

Tensorflow 的tf.one_hot()功能：dense to one hot

jasonzzj的博客

03-04

2万+

import tensorflow as tf indices = [[3], [5], [0], [7]] indices = tf.concat(0, indices) indices = tf.reshape(indice, (4, 1)) a = tf.one_hot(indices, depth=10, on_value=None, off_value=None, axis=None,

机器学习：数据预处理之独热编码（One-Hot）

weixin_34315665的博客

06-14

1987

在机器学习算法中，我们经常会遇到分类特征，例如：人的性别有男女，祖国有中国，美国，法国等。这些特征值并不是连续的，而是离散的，无序的。通常我们需要对其进行特征数字化。那什么是特征数字化呢？例子如下：性别特征：["男"，"女"] 祖国特征：["中国"，"美国，"法国"] 运动特征：["足球"，"篮球"，"羽毛球"，"乒乓球"] 假如某个样...

tensorflow--tf.one_hot()函数示例

wenqiwenqi123的博客

09-21

2万+

tensorflow中tf.one_hot()函数的作用是将一个值化为一个概率分布的向量，一般用于分类问题。具体用法以及作用见以下代码： import numpy as np import tensorflow as tf SIZE=6 CLASS=8 label1=tf.constant([0,1,2,3,4,5,6,7]) sess1=tf.Session() print('label

tensorflow将label数据转换为onhot编码（tf.one_hot的使用）

蒋程扬的部落格

07-17

1800

我们在进行验证码识别的时候，对于一组验证码的标签数据： [nzpp， fjzq ....] 对于每个字符转换为对应的数字(0-25)： [[13,25,15,15],[19,23,20,16]] 在全连接层进行softmax损失计算时需要根据标签的one_hot编码进，这时候我们就去需要转换 tf.one_hot(ary,depth,axis,on_value) ary为要转换的数组 dep...

TensorFlow学习笔记（二）把数字标签转化成onehot标签

羊和咩咩的博客

09-09

2万+

在MNIST手写字数据集中，我们导入的数据和标签都是预先处理好的，但是在实际的训练中，数据和标签往往需要自己进行处理。以手写数字识别为例，我们需要将0-9共十个数字标签转化成onehot标签。例如：数字标签“6”转化为onehot标签就是[0，0，0，0，0，0，1，0，0，0].首先获取需要处理的标签的个数：batch_size = tf.size(labels)假设输入了6张手写字图片，那么对应

TensorFlow学习笔记（九）：CIFAR-10训练例子报错解决