RuntimeError: mixed dtype (CPU): expect input to have scalar type of BFloat16

文章首发及后续更新:https://mwhls.top/4011.html,无图/无目录/格式错误/更多相关请至首发页查看。
新的更新内容请到mwhls.top查看。
欢迎提出任何疑问及批评,非常感谢!

错误代码
  • RuntimeError: mixed dtype (CPU): expect input to have scalar type of BFloat16
产生原因
  • 将 tensor 与 numpy array 做运算,并将 Layernorm 应用到其计算结果。
解决方法
  • 将 numpy array 换为 tensor。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
根据引用\[1\]中的错误提示,出现了RuntimeError: expected scalar type Half but found Float的错误。这个错误通常是由于在使用GPU V100(32GB)对ChatGLM模型进行lora微调时,数据类型不匹配导致的。为了解决这个问题,可以参考引用\[2\]中的解决方案,即将load_in_8bit=True修改为torch_dtype=torch.float16。这样可以将数据类型转换为半精度浮点数,与GPU V100(32GB)的数据类型匹配。另外,还可以检查微调命令中的参数设置,确保使用了正确的数据类型和设备。如果问题仍然存在,可以尝试调整其他参数,如batch size和learning rate等,以优化模型的训练和预测过程。 #### 引用[.reference_title] - *1* *3* [RuntimeError: expected scalar type Half but found Float解决方案](https://blog.csdn.net/weixin_43178406/article/details/130383527)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [MOSS LORA 方式微调报错,RuntimeError: expected scalar type Half but found Float解决方案](https://blog.csdn.net/uloveqian/article/details/130759174)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值