在正常训练时,训练没有报错,但一直无法执行

1、在正常训练时,训练没有报错,但一直无法执行,卡在一个步骤,查看显存情况,显存应该是够的

2、在加入pdb调试时,出现许多内存不足的错误

【截图信息】

正常训练时显卡的情况

在pdb调试中报错信息

目前推断出,BUG的大致方向。 可以先进行以下尝试: 1. 升级mindspore,排除高版本影响 2. 设置batch_size = 1,排除机器性能影响

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
回答: 当使用guided-diffusion预训练模型进行采样,可能会遇到报错的情况。根据提供的引用内容,我没有找到直接与guided-diffusion预训练模型采样报错相关的信息。然而,根据引用\[1\]中提到的模型更换方法和引用\[2\]中提到的训练hypernets的方式,您可以尝试以下几个步骤来解决报错问题: 1. 确保您已正确设置模型的路径和文件位置。根据引用\[1\]中的说明,您可以将需要的模型移入指定的文件夹,或使用ChangeModel函数更换模型的路径。 2. 检查模型的训练方式和参数设置是否正确。根据引用\[2\]中提到的训练hypernets的方式,确保您在训练模型使用了正确的学习率和训练方式。 3. 确保您使用的embedding模型与训练该embedding的模型保持一致。根据引用\[3\]中的说明,使用embedding生成新的图片,最好和训练这个embedding的模型保持一致,以确保生成效果良好。 如果您仍然遇到报错问题,建议您查看相关的文档、教程或寻求更专业的技术支持来解决该问题。 #### 引用[.reference_title] - *1* *2* *3* [Stable Diffusion攻略集(Stable Diffusion官方文档、kaggle notebook、webui资源帖)](https://blog.csdn.net/qq_56591814/article/details/128385416)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值