Assertion `target_val ＞= zero && target_val ＜= one` failed

纸冷怎拦醉泪

已于 2023-11-27 15:00:28 修改

阅读量478

点赞数 9

文章标签： pytorch

于 2023-11-27 12:34:01 首次发布

本文链接：https://blog.csdn.net/By_Z0la/article/details/134642425

版权

文章描述了在使用PyTorch训练模型时遇到的错误，源于不同版本对`F.binary_cross_entropy`函数的target张量值限制不同。1.0.0版本接受任意值，而1.1.0及后续版本要求target在[0,1]范围内，导致labelf中的2值触发了断言失败。

摘要由CSDN通过智能技术生成

跑一个down下来的模型，根据提示训练代码时报错：

../aten/src/ATen/native/cuda/Loss.cu:95: operator(): block: [6,0,0], thread: [29,0,0] Assertion `target_val >= zero && target_val <= one` failed.

具体的函数定位到了这里：

  File "main.py", line 285, in train
    loss += cross_entropy_loss_RCF(o, label, args.lmbda)

在loss计算时出现了问题，debug到了该函数的这一行：

    cost = F.binary_cross_entropy(
            prediction, labelf, weight=mask, reduction='sum')

结论：函数 F.binary_cross_entropy() 由于pytorch版本不兼容造成了上述问题。

根据GPT的说法：

在 PyTorch 1.0.0 版本中，F.binary_cross_entropy 函数的参数 labelf 张量代表真实的二进制标签。对于该版本，target 张量的元素值可以是任意的，不受特定取值要求的限制。

但是在1.1.0版本中，对于输入的张量元素值限制到了区间 [0,1] 之间。我跑的这份代码 labelf 中存在元素值为2，故此处多了断言的报错。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

纸冷怎拦醉泪

关注关注

9
点赞
踩
12

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

错误：Assertion `input_val ＞= zero && input_val ＜= one` failed.

weixin_43435855的博客

07-31

5099

医学图像分割之错误：Assertion `input_val >= zero && input_val

Pytorch报错：CUDA error: device-side assert triggered

weixin_37176244的博客

05-17

4524

总是遇到如下的报错，之前一直也没有记录解决的过程，今天记录一下，避免以后再踩坑 pytorch/aten/src/ATen/native/cuda/Loss.cu:106: operator(): block: [0,0,0], thread: [0,0,0] Assertion `input_val >= zero && input_val <= one` failed. /pytorch/aten/src/ATen/native/cuda/Loss.cu:106: opera

2 条评论您还未登录，请先登录后发表或查看评论

input_val ＞= zero && input_val ＜= one` failed问题发现与解决

m0_68094848的博客

11-23

873

那就要找loss怎么计算的，一般是根号下的数有度数或者极小值，我这边没有根号，只有一个e的x方，加了绝对值后还是报错。我就猜测是bce的问题，最后发现把bce改成binary_cross_entropy_with_logits就好了。这是因为那么这个binary_cross_entropy_with_logits可以防止数值计算溢出。其实应该关注第一张图片的报错，上面已经说了是loss出现的问题，那到底是什么问题。一开始我关注的报错在第二张图片上的问题，然后查了很多帖子，发现没有效果。

pytorch训练过程中出现错误：Assertion input_val ＞= zero && input_val ＜= one failed.

qq_42181431的博客

07-23

4566

pytorch训练过程中loss报错，../aten/src/ATen/native/cuda/Loss.cu:118: operator(): block: [307,0,0], thread: [31,0,0] Assertion `input_val >= zero && input_val

错误Assertion `input_val ＞= zero && input_val ＜= one` failed

xdqiangdd的博客

07-26

1416

出现这个错误： Assertion `input_val ＞= zero && input_val ＜= one` failed 在模型最后加上sigmoid() 或者softmax()

pytorch数值溢出的几种原因

3D的博客

11-11

8243

错误信息一般的错误表述如下: xxx.py:xxx: RuntimeWarning: overflow encountered in reduce xxx.py:xxx: RuntimeWarning: invalid value encountered in true_divide ... xxx.cu:xxx: block: [xxx,0,0], thread: [0,0,0] Assertion `input_val >= zero && input_val <= xxx

Assertion `input_val ＞= zero && input_val ＜= one` failed.

qq_34425255的博客

06-24

732

main()

Loss.cu:97，RuntimeError: copy_if failed to synchronize: cudaErrorAssert: device-side assert triggere

Jiiny_Li的博客

07-28

1243

服务器：Ubuntu18，环境：python3.6，pytorch 报错信息 /opt/conda/conda-bld/pytorch_1591914838379/work/aten/src/ATen/native/cuda/Loss.cu:97: operator(): block: [0,0,0], thread: [31,0,0] Assertion input_val >= zero && input_val <= one failed. Traceback (most

lwip2.0.1 pbuf.c文件分析

优先级4.0

05-21

573

我分析pbuf文件分析了很长时间，现在我拿出来与大家共享。该文件的所有函数，我还画了对应的流程图，由于流程图太大太多我就不放出来了，有需要的私聊。 /** * @file * Packet buffer management */ /** * @defgroup pbuf Packet buffers (PBUF) * @ingroup infrastructure * * Packets are built from the pbuf data structure. It supports

Redis设计与实现笔记第十四章服务器

不积跬步无以至千里

02-22

330

服务器上一张了解了客户端以一个对象的方式来表明自己的身份以及当前所处的阶段,这章对应的会进行一个服务器的介绍. Redis 服务器负责与多个客户端建立网络链接,处理客户端发送的命令请求,在数据库中保存客户端执行命令所产生的数据,并通过资源管理来位置服务器自身的运转 14.1 命令请求的执行过程以客户端向服务器发送命令为例,来进行客户端与服务器交互的过程说明. 当客户端发出 SET KEY VA...

RNN股票预测(Pytorch版)

qq_52237775的博客

09-16

365

记录RNN实战

分布式训练：（Pytorch）

最新发布

qq_55794606的博客

09-16

674

数据加载：使用多个进程来并行加载和预处理数据，通过流水线处理减少数据加载的延迟。数据传输：利用 CUDA 流优化从固定内存到 GPU 的数据传输。数据并行性：使用数据并行和 NCCL 等通信库实现高效的梯度同步和模型参数更新，优化训练过程。这种方法结合了数据加载、数据传输和数据并行处理的优化，能够显著提升深度学习模型的训练效率和速度。dataset,num_workers=4, # 使用 4 个子进程加载数据pin_memory=True # 将数据转移到固定内存# 模型训练代码# ...

解决Linux服务器上下载pytorch速度过慢的问题

weixin_53697800的博客

09-13

526

torch-1.13.1+cu116-cp311-cp311-linux_x86_64.whl 注意cp311中的311指的是python版本，也需要与自己的python匹配，比如我的是3.8，我在Linux服务器中使用如下指令, 直接从指定的 URL 下载。需要下载的是GPU版本的pytorch，版本torch=1.13.1+cu116。ps:也可以使用其他下载器（如迅雷）通过镜像网站手动下载.whl文件到本地，然后。使用这种方式会从两个网址中查找安装包，清华源不存在安装包，仍然从官方下载。

探索pytorch数据集中Mnist数据集的数据格式

算法与编程之美

09-13

395

1 问题1.1安装pytorch时，由于使用的vscode编译器，所以采用pip进行安装，但是遇到pytorch版本与python版本不对应的问题。1.2探索pytorch数据集中Mnist数据集的数据格式。2 方法2.1 首先查看自己电脑能够适应的pytorch版本2.2 打开pytorch的官网，选择对应的版本2．3 最后在vscode的终端运行复制的pip代码。（下载pytorch命令：pi...

pytorch使用技巧

m0_73776435的博客

09-13

947

我们将模型划分为两部分，存放到一个列表里，每部分就对应上面的一个字典，在字典里设置不同的学习率。：去除dim指定的且size为1的维度，维度大于1时，squeeze()不起作用，不指定dim时，去除所有size为1的维度。也可以在列表外设置一个全局学习率，当各部分字典里设置了局部学习率时，就使用该学习率，否则就使用列表外的全局学习率。的作用就是释放缓存分配器当前持有的且未占用的缓存显存，以便这些显存可以被其他GPU应用程序中使用，并且通过。设置当前使用的GPU设备仅为0号设备，设备名称为。

【深度学习|PyTorch】基于 PyTorch 搭建 U-Net 深度学习语义分割模型——附代码及其解释！

985小水博的摸鱼日常

09-14

567

【深度学习|PyTorch】UNet学习笔记！

《深度学习》PyTorch 手写数字识别案例解析及实现＜上＞

wx_AHao1004Y的博客

09-13

1401

MINIST是一种基于神经网络的手写数字识别算法。它是LeCun等人在1998年提出的，是深度学习领域的里程碑之一。MINIST数据集包含了大量的手写数字图片，MINIST算法通过训练神经网络，可以有效地识别这些手写数字。MINIST算法在计算机视觉和模式识别中有广泛的应用，被认为是机器学习领域的经典问题之一。MNIST包含70,000张手写数字图像，其中60,000张用于训练，10,000张用于测试。所有的图像都是灰度的，大小为28x28像素的，并且居中的，以减少预处理和加快运行。

Swintransformer cuowu cv2.error: OpenCV(4.6.0) /io/opencv/modules/core/src/copy.cpp:1026: error: (-215:Assertion failed) top >= 0 && bottom >= 0 && left >= 0 && right >= 0 && _src.dims() <= 2 in function 'copyMakeBorder'

06-07

根据错误提示，这个问题看起来是和 OpenCV 的 `copyMakeBorder` 函数有关。这个函数的作用是为图像添加边框。错误提示中的 `Assertion failed` 表示某个断言失败了，即函数的某个输入参数不满足函数的前置条件。具体来说，错误提示中的 `top >= 0 && bottom >= 0 && left >= 0 && right >= 0` 表示函数的四个边框参数（上、下、左、右）必须都大于等于 0。另外，`_src.dims() <= 2` 表示输入图像必须是 1 或 2 维的。你可以检查一下你的代码，看看是否有地方违反了这些前置条件。如果有，就需要修改代码，使其符合要求。如果不确定具体原因，可以提供更多的代码和上下文信息，帮助分析问题所在。