修改模型后加载预训练权重，提示缺少参数

最新推荐文章于 2024-10-17 11:22:54 发布

没头脑和不高兴。

最新推荐文章于 2024-10-17 11:22:54 发布

阅读量207

点赞数

文章标签： python bert nlp tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45654691/article/details/133895482

版权

代码版本： brightmart/albert_zh

修改modeling.py的BertModel类，在pooler层后添加卷积层。
运行run_pretraining.py文件，读取albert_tiny_zh的预训练权重继续训练，运行失败，提示下面这段话，意思是缺少某些预训练权重，也就是需要我所添加的层在ckpt文件中存在。

tensorflow.python.framework.errors_impl.NotFoundError: Restoring from checkpoint failed. This is most likely due to a Variable name or other graph key that is missing from the checkpoint. Please ensure that you have not altered the graph expected based on the checkpoint.

尝试为原始ckpt文件添加新权重，未找到现成可运行代码或操作提示，GPT提供的代码也是各种报错，未成功。

此时，运行run_classifier.py文件，调用修改过的modeling.py，获得新的ckpt权重文件，再去运行run_pretraining.py文件就可以了。

run_classifier.py文件用来对下游任务进行微调，run_pretraining.py文件用来进行预训练，只需要先微调得到完整的权重就可以来预训练啦，不太明白微调怎么不用ckpt文件包含全部参数，但是预训练需要所有参数，不合理但可行！

没头脑和不高兴。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

没头脑和不高兴。 CSDN认证博客专家 CSDN认证企业博客

码龄5年

12: 原创

35万+: 周排名

13万+: 总排名

1万+: 访问

: 等级

209: 积分

9: 粉丝

16: 获赞

10: 评论

63: 收藏

私信

关注

热门文章

分类专栏

服务器连接 3篇

最新评论

使用Huggingface的evaluate模块
吃草莓的鹿: 大佬，请教下下载GPT2是有什么作用呀
使用Huggingface的evaluate模块
weixin_47054381: 搞笑教程
高斯消元法python实现
lhsk_hzy: 对角元存在值为零怎么考虑
使用Huggingface的evaluate模块
CSDN-Ada助手: 恭喜你写了第12篇博客！使用Huggingface的evaluate模块的文章内容很有深度，对NLP领域的同学们应该会有很大的帮助。不过我觉得下一步你可以尝试结合实际案例，分享一些使用evaluate模块解决实际问题的经验和心得，这样对读者来说会更具有参考价值。希望你能继续保持创作的热情，期待你更多精彩的分享！
本地打开jupyter，连接远程服务器
CSDN-Ada助手: 恭喜你写了第10篇博客！你的文章一直都很有启发性，我很期待你接下来的创作。或许你可以考虑分享一些关于如何在jupyter中进行数据可视化或者如何优化远程服务器连接的内容。希望你能继续保持创作的热情，期待你更多的精彩文章！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。