关于如何将tensorflow模型转换为pytorch模型,https://www.cnblogs.com/cxq1126/p/14277134.html这个帖子讲的方法可以参考,不过会报错:AttributeError: ‘BertForPreTraining’ object has no attribute ‘shape’
解决方法可以参考:https://stackoverflow.com/questions/30077534/importerror-cannot-import-name-unwrap
lrizzello commented on 24 Jul 2020的方法说的是如何实现convert_tf_checkpoint_to_pytorch,里面有不少代码值得借鉴,在transformer 4.9.1中,需要重点修改的函数是load_tf_weights_in_bert,这两个函数有很多地方的逻辑是一样的。
yzhang123 commented on 8 Apr 2020的方法是忽略掉assert pointer.shape == array.shape,将except中的raise修改为pass。不过直接这样修改解决不了问题,会逃避掉很多必须要处理的问题。我的做法是将相关代码段修改为:
if 'shape'<
这篇博客介绍了如何将TensorFlow模型转换为PyTorch模型,提到了在转换过程中遇到的AttributeError问题,并提供了两种解决方案:一种是参考lrizzello在Stack Overflow上的回答,另一种是yzhang123的建议,但直接修改assert可能会遗漏重要处理。文章还强调了转换成功后需要更新config.json文件,添加model_type字段。
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



