解决Bert预训练模型过大的问题

最新推荐文章于 2024-05-11 19:23:38 发布

福将～白鹿

最新推荐文章于 2024-05-11 19:23:38 发布

阅读量942

点赞数 1

分类专栏：预训练文章标签： bert 自然语言处理深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41475067/article/details/122968134

版权

预训练专栏收录该内容

6 篇文章 0 订阅

订阅专栏

预训练模型

问题：关于BERT预训练模型过大，达到1.3G。

相关问题出现原因：

其实Bert在保留预训练模型的时候不仅保留了结果参数，同时还保存了大量的中间参数，所以才会达到1G以上。

解决方案：过滤中间参数

sess = tf.Session()
imported_meta = tf.train.import_meta_graph('./model.ckpt-322.meta')
imported_meta.restore(sess, './model.ckpt-322')
my_vars = []
for var in tf.all_variables():
    if 'adam_v' not in var.name and 'adam_m' not in var.name:
        my_vars.append(var)
saver = tf.train.Saver(my_vars)
saver.save(sess, './model.ckpt')

效果说明：

执行完以上代码之后，新保存的模型降到了400M左右，即：问题解决。
亲测有效！！！

相关参考外网链接：

https://github.com/google-research/bert/issues/99

福将～白鹿

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
解决Bert预训练模型过大的问题

预训练模型问题：关于BERT预训练模型过大，达到1.3G。相关问题出现原因：其实Bert在保留预训练模型的时候不仅保留了结果参数，同时还保存了大量的中间参数，所以才会达到1G以上。解决方案：过滤中间参数sess = tf.Session()imported_meta = tf.train.import_meta_graph('./model.ckpt-322.meta')imported_meta.restore(sess, './model.ckpt-322')my_vars = []
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。