“No inf checks were recorded for this optimizer.“ AssertionError:错误解决

唐僧爱吃唐僧肉

已于 2022-03-20 16:10:51 修改

阅读量5.6k

点赞数 1

分类专栏：报错问题解决深度学习函数学习文章标签： python

于 2022-03-19 18:32:36 首次发布

本文链接：https://blog.csdn.net/znevegiveup1/article/details/123599939

版权

深度学习函数学习同时被 2 个专栏收录

52 篇文章 1 订阅

订阅专栏

报错问题解决

23 篇文章 1 订阅

订阅专栏

问题1

主要是深拷贝会破坏一些模型的特性，模型被

self.best_model = copy.deepcopy(model).cpu()

保存之后，保存就只能保存模型的参数了，而不能保存全部的模型

torch.save(self.best_model.state_dict(),'...')

再调用的时候定义完模型直接调用参数

model.load_state_dict(torch.load('model.pth'))

问题2

change the

optimizer = torch.optim.AdamW(model.parameters(),lr=1e-5)
deberta = DebertaV2Model.from_pretrained("/home/xiaoguzai/模型/deberta-v3-large")
model = ClassificationModel(deberta)

deberta = DebertaV2Model.from_pretrained("/home/xiaoguzai/模型/deberta-v3-large")
model = ClassificationModel(deberta)
optimizer = torch.optim.AdamW(model.parameters(),lr=1e-5)

Because at the first one,

original AdamW(model.parameters(),lr=1e-5)

refer to the model below,
but at the second one,

AdamW(model.parameters(),lr=1e-5)

refer to the real model

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

唐僧爱吃唐僧肉

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

no active checks on server [192.168.1.107:10051]: host [ ] not found

qq_40907977的博客

01-13

7272

系统：Ubuntu zabbix ：3.0 报错信息： #tail /var/log/zabbix/zabbix_agentd.log 1265:20200113:102510.049 no active checks on server [192.1.101.101:10051]: host [shell] not found 原因： 1、zabbix 代理、server主机、agen...

解决AssertionError: No inf checks were recorded for this optimizer

weixin_44904435的博客

10-17

1767

我把代码里的embedding数据类型都输出一遍，全都改了，发现还是报错，才发现如果设置了trainer的这个yaml文件，也得改。在torch.cuda.amp.grad_scaler.py里面有这段注释。大概意思即float16会溢出，全部换成float32即可。将float16转换为float32，可通过to()函数。

参与评论您还未登录，请先登录后发表或查看评论

Pytorch——报错解决：No inf checks were recorded for this optimizer.

Irving.Gao的博客

11-18

5363

报错解决：No inf checks were recorded for this optimizer.

AssertionError：断言错误的完美解决方法 ️

热门推荐

Every Effort Counts

10-27

9万+

背景：这个问题是我在尝试部署openyurt的时候遇到的，同一个问题因人而异，具体排查请看自己的log，此篇仅供参考！问题最近在尝试部署openyurt，需要先准备一个搭好的k8s集群来yurtctl convert，但是在node节点join集群的时候总是遇到问题： [root@node ~]# kubeadm join xxxxxxxx [preflight] Running pre-flight checks [preflight] Reading configuration from the.

zabbix疯狂报错：cannot send list of active checks to “xxx.xxx.xxx.xxx“: host [zabbix-test] not found

Jecky的博客

09-22

2986

好好的一个大数据工程师干成了运维，这次又要换zabbix进行监控，没办法，为了生活只好不挑活。但是搭建好后我发现，这玩意日志总是报这个错，报的我心态爆炸，网上查了很多很多资料，统一说：让Web中的haostname和agent.conf中的hostname一致就行了我淦，小白那里知道web的hostname在哪！！！何况我装的还是zabbix5.0 经过我不断的尝试，终于找到解决办法点击【配置】，再点【主机】点击名称，注意：是你的server节点【尖叫注意！！！】这一块和你的agn.

【报错】/lib/x86_64-linux-gnu/libm.so.6: version `GLIBC_2.29‘ not found

静谧、淡雅

10-12

1万+

一报错如下😱😱😱： /lib/x86_64-linux-gnu/libm.so.6: version `GLIBC_2.29' not found 二解决方法💉💉💉： 1 cd /usr/local 2 下载 wget http://ftp.gnu.org/gnu/glibc/glibc-2.29.tar.gz 3 超级管理员模式 sudo su 4 解压 tar -zxvf glibc-2.29.tar.gz 5 配置 cd glibc-2.29 mkdir build cd build/

QLORA:量化LLMA的有效微调

AI浩

06-28

2938

我们提出了QLORA，这是一种有效的微调方法，它减少了内存使用，足以在单个48GB GPU上微调65B参数模型，同时保留完整的16位微调任务性能。QLORA通过冻结的4位量化预训练语言模型将梯度反向传播到Low RankAdapters (LoRA)中。我们最好的模型家族，我们命名为Guanaco，在Vicuna基准上优于之前所有公开发布的模型，达到ChatGPT性能水平的99.3%，而只需要在单个GPU上进行24小时的微调。

optimizer注意点

菜鸟起飞

12-02

2680

转载：https://blog.csdn.net/gdymind/article/details/82708920 重点是这句：注意，如果想要使用.cuda()方法来将model移到GPU中，一定要确保这一步在构造Optimizer之前。因为调用.cuda()之后，model里面的参数已经不是之前的参数了。以下是原文与优化函数相关的部分在torch.optim模块中，其中包含了大部分现在已有的流行的优化方法。如何使用Optimizer 要想使用optimizer，需要创建一个opt.

java.lang.AssertionError: No ModelAndView found （ssm报错）

牛哞哞杂记

06-25

1929

错误翻译：找不到ModelAndView 错误原因：在进行controller测试时，controller方法未写注解，如下通过此网页，找到问题解决方法： https://stackoverflow.com/questions/37055687/spring-mvc-test-java-lang-assertionerror-no-modelandview-found 错误展示如下： java...

python assertionerror怎么解决,python 错误处理 assert详解

weixin_39658966的博客

03-25

6万+

assert是断言的意思，解释为：我断定这个程序执行之后或者之前会有这样的结果，如果不是，那就扔出一个错误。语法：assert expression [, arguments]assert 表达式 [, 参数]举例：def foo(s):n = int(s)assert n != 0, 'n is zero!'return 10 / ndef main():foo('0')>Tracebac...

kaggle中的minist训练模型时遇到的“AssertionError: AbstractConv2d Theano optimization failed: ”

qq_42781616的博客

12-27

2529

如果你不想看话废，解决办法展示的相当简单粗暴，一眼尽现，自己看吧！在minist比赛中有一个非常好的内核 https://www.kaggle.com/yassineghouzam/introduction-to-cnn-keras-0-997-top-6 还有中文译版： https://blog.csdn.net/liutianheng654/article/details/81123...

HiveSQL报错AssertionError

gaofeng的博客

05-31

3207

sql执行报错 Error running query: java.lang.AssertionError: Internal error: While invoking method 'public org.apache.calcite.sql2rel.RelFieldTrimmer$TrimResult org.apache.hadoop.hive.ql.optimizer.calcite.rules.HiveRelFieldTrimmer.trimFields(org.apache.calcite.r

07-14

这个错误日志表明在创建名为 'SYSTEM.CATALOG' 的表时，HBase无法加载配置的区域拆分策略 'org.apache.phoenix.schema.MetaDataSplitPolicy'，并建议将 'hbase.table.sanity.checks' 设置为false来绕过健康检查。这个错误通常发生在使用Apache Phoenix来创建HBase表时，因为Phoenix需要特定的配置和设置来正确地运行。在这种情况下，你可以尝试以下解决方法： 1. 检查配置：确保HBase和Phoenix的相关配置正确设置。特别是，确保'HBase-site.xml'和'Phoenix-core.jar'文件在HBase的类路径下。 2. 检查Phoenix版本：确保使用的Phoenix版本与HBase版本兼容。不同版本之间可能存在不兼容性，导致无法正确加载区域拆分策略。 3. 禁用健康检查：按照错误提示的建议，在HBase的配置文件中将 'hbase.table.sanity.checks' 设置为false。这将绕过表描述符的健康检查，但需要谨慎使用。 4. 更新Phoenix配置：如果你使用的是较新的Phoenix版本，可能需要更新配置以适应最新的HBase版本。查阅Phoenix和HBase的官方文档，了解他们之间的兼容性和配置要求。如果问题仍然存在，我建议你查看更详细的错误日志以了解更多上下文信息，并在HBase和Phoenix的社区或论坛中咨询其他开发者，以获取更专业的帮助和支持。