预训练权重参数和模型不匹配size mismatch for module.head.head.fc.weight和size mismatch for module.head.head.fc.bias

W起名有点难

于 2024-05-24 20:01:18 发布

阅读量268

点赞数 4

分类专栏：研文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44807946/article/details/139183198

版权

研专栏收录该内容

6 篇文章 0 订阅

订阅专栏

这值得用一篇博客来记录！就在刚刚终于解决了一个bug，难受了一下午
下午为训练好的模型写一下测试的demo文件，在加载模型的地方卡住了，一开始设置了strict=False，但是识别的效果极差，而且离谱的是用验证集里面的图片识别也是很多乱码，开始恐慌，难道是训练了这么久的模型有问题吗，后来开始调试，尝试各种修改方案，CSDN太厉害了，我刚刚看到一篇博客就灵光一闪，是某个参数错了，修改了之后成功加载了！

RuntimeError: Error(s) in loading state_dict for DataParallel:
        size mismatch for module.head.head.fc.weight: copying a param with shape torch.Size([6644, 192]) from checkpoint, the shape in current model is torch.Size([1000, 192]).    
        size mismatch for module.head.head.fc.bias: copying a param with shape torch.Size([6644]) from checkpoint, the shape in current model is torch.Size([1000]).

这个错误代表的是分类数不匹配，我去看了一下配置文件，果然字符分类数设置成了1000，模型的分类数是6644
在这里插入图片描述
训练的时候有修改，但是测试的代码中没有修改，于是出现错误了
成功解决~
参考链接: http://t.csdnimg.cn/Vztem
https://blog.csdn.net/qq_40755094/article/details/128145384

W起名有点难

关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

W起名有点难 CSDN认证博客专家 CSDN认证企业博客

码龄6年

31: 原创

54万+: 周排名

9万+: 总排名

2万+: 访问

: 等级

489: 积分

90: 粉丝

127: 获赞

10: 评论

177: 收藏

私信

关注

热门文章

分类专栏

最新评论

【ICCV2023】MRN: Multiplexed Routing Network for Incremental Multilingual Text Recognition
scoland: FileNotFoundError: [Errno 2] No such file or directory: './saved_models/CRNN_MRN/Chinese_0_0_best_score.pth' 我出现了这个错误，是不是就需要训练模型了啊
【ICCV2023】MRN: Multiplexed Routing Network for Incremental Multilingual Text Recognition
scoland: 你好，我最近也在运行这个论文的代码，请问demo.py文件在哪里
Linux删除root文件
CSDN-Ada助手: 不知道 CS入门技能树是否可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
力扣题（哈希表）
CSDN-Ada助手: 恭喜您第19篇博客的发布！非常高兴看到您在力扣题目上的研究和思考。标题中的“更新中ing”让我期待了您的继续努力，希望能看到更多有关哈希表的内容。在下一步的创作中，我建议您可以尝试结合实际应用场景，探讨哈希表的更多用法和优化技巧。同时，如果可能的话，您可以尝试提供一些实际案例或代码示例，这样读者能更好地理解和应用您的知识。再次祝贺您的努力和持续创作！期待您的下一篇博客。
【论文阅读：VisionLAN（ICCV2021）】From Two to One: A New Scene Text Recognizer with Visual Language Modeling
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题《【论文阅读：VisionLAN（ICCV2021）】From Two to One: A New Scene Text Recognizer with Visual Language Modeling》吸引了我的注意。您的坚持和创作热情确实令人敬佩。阅读这篇博文，我对VisionLAN的概念有了更深入的了解。您对于场景文本识别和视觉语言建模的结合给予了独到的见解。在下一步的创作中，我希望您可以进一步探索这个领域的挑战和潜在的解决方案。也许您可以分享一些关于VisionLAN的实际应用案例，或者深入分析其在现实场景中的优势和局限性。通过这些内容，您可以帮助更多读者更好地理解和应用VisionLAN的价值。希望您能继续保持谦逊和创作的热情，期待您未来更多出色的博文！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。