利用tf.ragged.boolean_mask完成选择mask压缩tensor

最新推荐文章于 2024-05-30 20:21:19 发布

LauJames

最新推荐文章于 2024-05-30 20:21:19 发布

阅读量387

点赞数

分类专栏：深度学习 Tensorflow 文章标签：神经网络深度学习 tensorflow 自然语言处理

本文链接：https://blog.csdn.net/uestc_v/article/details/116307163

版权

深度学习同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

Tensorflow

5 篇文章 0 订阅

订阅专栏

现有如下输入：

1. [Batch_size, Seq_len, N_classes]的tensor T

2. [Batch_size, Seq_len]的mask矩阵 M

需求：根据M中的值来mask T，并去掉被mask掉的值

实际场景：主要是现在有一个对话的每个时刻的状态，和角色(0/1)，需要取出角色为1的所有utterances的状态，在此基础上选取最后一个角色为1的utterance的状态

问题点：

若使用tf.boolean_mask，则会得到[?, N_classes], ？代表这个方法将每个样本筛选出来的样本压缩成一维，是一个不规则的维度，？数值小于Batch_size * Seq_len

正确操作：

使用tf.ragged.boolean_mask，保留原始的维度，利用不规则tensor特性，得到S=[Batch_size, ?, N_classes]，再使用tf.squeeze(S[:, :-1,:], 1)，得到期望结果

注：Ragged Tensor不支持直接index，所以这里使用slice操作，再压缩中间维度。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LauJames

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python中tensor与variable_NLP实战篇之tf2中tensor、variable、gradient、ops

weixin_39600291的博客

12-16

278

本文是基于tensorflow2.2.0版本，介绍了tf中变量、张量的概念，tf中梯度的计算方式和tensor相关的操作。实战系列篇章中主要会分享，解决实际问题时的过程、遇到的问题或者使用的工具等等。如问题分解、bug排查、模型部署等等。相关代码实现开源在：https://github.com/wellinxu/nlp_store ，更多内容关注知乎专栏(或微信公众号)：NLP杂货铺。变量张量张量...

机器学习实战（10）——Tensorflow

WHJ226的博客

09-23

853

有关 tensorflow 参考文档可以在上述网站下载。一个Tensorflow程序通常可以分成两个部分：第一部分用来构建一个计算图（称为构建阶段），第二部分来执行这个图（称为执行阶段）。构建阶段通常会构建一个计算图，这个图用来展现ML模型和训练所需的计算。执行阶段则重复地执行每一步训练动作，并逐步提升模型的参数。

1 条评论您还未登录，请先登录后发表或查看评论

压缩感知—尺度函数的生成采用cascade(mask)算法

11-07

压缩感知—尺度函数的生成采用cascade(mask)算法 An interesting demo for generating scale function using mask (cascade) algorithm.

tf.ragged.map_flat_values

luoganttcc的博客

05-18

501

tf.ragged.map_flat_values 可以理解不规则矩阵的map import tensorflow as tf rt = tf.ragged.constant([[1, 2, 3], [], [4, 5], [6]]) tf.ragged.map_flat_values(tf.ones_like, rt).to_list() tf.ragged.map_flat_values(tf.multiply, rt, rt).to_list() tf.ragged.map_flat_val

tf.boolean_mask

weixin_36670529的博客

09-08

346

tf.boolean_mask( tensor, mask, axis=None, name='boolean_mask' ) Numpy等价是张量[掩模]。 # 1-D example tensor = [0, 1, 2, 3] mask = np.array([True, False, True, False]) boolean_mask(tensor...

tf.RaggedTensor

qq_42037273的博客

12-07

1200

吐槽：看了半天看懂一点官网链接：https://tensorflow.google.cn/api_docs/python/tf/RaggedTensor 参考博文：https://blog.csdn.net/jackhh1/article/details/102690290 ragged是不规则的意思 raggedtensor是不规则的张量没有学习整个文档，对学习到的陈述。举例原来的tensor是[3, 1, 4, 1, 5, 9, 2, 6] row_splits是切分下标。从row_split

Tensorflow：不规则张量tf.RaggedTensor学习和测试

2401_85327249的博客

05-30

1110

最近有个需求使用KPRN算法预测一组输入序列的得分，问题在于不同端点之间的这一组序列数量不一致，而每一个最小颗粒度序列都需要过一个LSTM层，在LSTM之后归属于同一对端点的序列需要合并为一组，例如输入100个序列在经过LSTM+２层全连接之后得到100个值\[V1,V2,V3....,V100\]，然后归属于同一组的至需要聚合，比如\[\[V1, V2\], \[V3, V4, V5\] ,\[V100\]\]，此时已经不能使用tensorflow的reshape算子，引出不规则矩阵**tf.Ragged

tf.data 加载 Unicode 字符串

我的LOG

11-23

225

Unicode 字符串代码运行结果代码 # -*- coding: utf-8 -*- """ Created on 2020/11/23 10:27 @Author: CY @email: 5844104706@qq.com """ ''' Unicode 是一种标准的编码系统，用于表示几乎所有语言的字符。每个字符使用 0 和 0x10FFFF 之间的唯一整数码位进行编码。 Unicode 字符串是由零个或更多码位组成的序列。 TensorFlow 中表示 Unicode 字符串，以及如何使用标准字

解决关于《【莫烦Python】强化学习 Reinforcement Learning 5.Policy Gradients》因为版本产生的bug

Scarlett_W1128的博客

10-12

332

原始版本： Tensorflow: 1.0 gym: 0.8.0原因：下载不到Tensorflow: 1.0版本我的版本： tensorflow-cpu: 1.15.0 gym: 0.26.2 修改RL_brain.py ValueError: too many values to unpack (expected 4) 修改run_CartPole.py ValueError: could not broadcast input array from shape (8,) into shape (10,

tf.keras.Layers中常见层的API接口

qq_38124658的博客

02-05

1090

TensorFlow的官网API：https://tensorflow.google.cn/api_docs/python/tf keras的中文网站API:https://keras-zh.readthedocs.io/ 这里只是记录一下常用的一些API tf.keras.Layers Input层 tf.keras.Input( shape=None, batch_size=None, name=None, dtype=None, sparse=False, tensor=None, r

tf.boolean_mask使用方法

weixin_39287090的博客

05-24

549

tensorflow里的一个函数，boolean_mask(a,b) 将使a (m维)矩阵仅保留与b中“True”元素同下标的部分。在做目标检测（YOLO）时常常用到。 “”"Apply boolean mask to tensor. Numpy equivalent is tensor[mask]. # 1-D example tensor = [0, 1, 2, 3] mask = np.a...

Tensorflow中的masking和padding

hustqb的博客

02-23

3755

声明：需要读者对tensorflow和深度学习有一定了解 tf.boolean_mask实现类似numpy数组的mask操作 Python的numpy array可以使用boolean类型的数组作为索引，获得numpy array中对应boolean值为True的项。示例如下： # numpy array中的boolean mask import numpy as np target_ar...

tf.boolean_mask()

热门推荐

coder

08-15

1万+

在写深度学习吴恩达老师的编程题遇到了这个函数，记录一下：下面是翻译的官网的教程，函数原型：tf.boolean_mask(tensor,mask,name='boolean_mask',axis=None) 跟numpy里面的tensor[mask]具有相同的功能。参数：tensor是N维度的tensor，mask是K维度的，注意K小于等于N，name可选项也就是这个操作的名字，axis...

tf.boolean_mask()的详细用法

笼中鸟

05-17

7987

tf.boolean_mask 的作用是通过布尔值过滤元素 def boolean_mask(tensor, mask, name="boolean_mask", axis=None): """Apply boolean mask to tensor.""" 参数解释： tensor：被过滤的元素列表或数组 mask：一堆 bool 值，它的维度不一定等于 tensor return： mask 为 true 对应的 tensor 的元素当 tensor 与 mask 维度一致时，r

Tensorflow Ragged Tensors

weixin_43378751的博客

03-08

1271

(根据官文，要安装tf-nightly) Ragged Tensors即tf提供的不规则形状，或者说可变元素长度的tensor。比如： digits = tf.ragged.constant([ [3, 1, 4, 1], [], [5, 9, 2], [6], []]) 或者 words...

tensorflow 中 boolean_mask的具体含义和例程解析

addresser的博客

07-30

1万+

tensorflow里的一个函数，boolean_mask(a,b) 将使a (m维)矩阵仅保留与b中“True”元素同下标的部分。在做目标检测（YOLO）时常常用到。 """Apply boolean mask to tensor. Numpy equivalent is `tensor[mask]`. ```python # 1-D example tensor = [0, 1, 2, 3...

TensorFlow支持Unicode，中文NLP终于省心了

AI科技大本营

12-20

5624

整理 | 非主流出品 | AI科技大本营终于，TensorFlow 增加了对 Unicode 的支持。什么是 Unicode？Unicode 是计算机科学领域里的一项业界...

tensorflow2中使用ragged.constant()将非矩形列表转为tensor类型

qq_42680999的博客

06-23

1111

在进行数据标签的处理时，标签数据是一个非矩形列表，使用tf.constant()无法处理，使用tf.ragged.constant()可将其转换为tensorflow可以直接处理的tensor类型数据。 train_labels = [[1, 3], [1,5,4], [2,5,6,3], [2,3,4,8,2], [9]] train_labels = tf.ragged

TensorFlow2.0 Guide 官方教程学习笔记13- Ragged Tensors

jackhh1的博客

10-24

3857

本笔记参照TensorFlow官方教程，主要是对‘Ragged Tensors’教程内容翻译和内容结构编排，原文链接：Ragged Tensors 目录创建环境（Setup）一、概率（Overview） 1.1 我们能用不规则张量（ragged tensor）做什么 1.2 创建一个不规则张量 1.3 我们能在不规则张量里存储什么 1.4 用例二、不规则张量：定义 2.1 不规则和统一维度 ...

tf.keras.Input( shape=None, batch_size=None, name=None, dtype=None, sparse=False, tensor=None, ragged=False, **kwargs )