使用pytorch_pretrained_bert将tensorflow模型转化为pytorch模型

最新推荐文章于 2024-01-31 09:37:33 发布

乐清sss

最新推荐文章于 2024-01-31 09:37:33 发布

阅读量5.9k

点赞数 9

分类专栏： Pytorch BERT

本文链接：https://blog.csdn.net/sunyueqinghit/article/details/103458365

版权

Pytorch 同时被 2 个专栏收录

9 篇文章 1 订阅

订阅专栏

BERT

3 篇文章 0 订阅

订阅专栏

BERT仓库里的模型是TensorFlow版本的，需要进行相应的转换才能在pytorch中使用
在Google BERT仓库里下载需要的模型，这里使用的是中文预训练模型(chinese_L-12_H-768_A_12)
在这里插入图片描述下载chinese_L-12_H-768_A-12.zip后解压，里面有5个文件

bert_config.json
bert_model.ckpt.data-00000-of-00001
bert_model.ckpt.index
bert_model.ckpt.meta
vocab.txt

使用bert仓库里的convert_bert_original_tf_checkpoint_to_pytorch.py将此模型转化为pytorch版本的，这里我的文件夹位置为：D:\Work\BISHE\BERT-Dureader\data\chinese_L-12_H-768_A-12，替换为自己的即可

python convert_tf_checkpoint_to_pytorch.py --tf_checkpoint_path D:\Work\BISHE\BERT-Dureader\data\chinese_L-12_H-768_A-12\bert_model.ckpt --bert_config_file D:\Work\BISHE\BERT-Dureader\data\chinese_L-12_H-768_A-12\bert_config.json --pytorch_dump_path D:\Work\BISHE\BERT-Dureader\data\chinese_L-12_H-768_A-12\pytorch_model.bin

注：这里让我疑惑的是模型有5个文件，为什么转化的时候使用的是bert_model.ckpt，而且这个文件也不存在呀，是我对TensorFlow的模型不太熟悉，查阅资料之后将5个文件的作用说明如下：

$ tree chinese_L-12_H-768_A-12/
chinese_L-12_H-768_A-12/
├── bert_config.json                     <- 模型配置文件
├── bert_model.ckpt.data-00000-of-00001  <- 保存断点文件列表，可以用来迅速查找最近一次的断点文件
├── bert_model.ckpt.index                <- 为数据文件提供索引，存储的核心内容是以tensor name为键以BundleEntry为值的表格entries，BundleEntry主要内容是权值的类型、形状、偏移、校验和等信息。
├── bert_model.ckpt.meta                 <- 是MetaGraphDef序列化的二进制文件，保存了网络结构相关的数据，包括graph_def和saver_def等
└── vocab.txt                            <- 模型词汇表文件

0 directories, 5 files

在调用模型时使用chinese_L-12_H-768_A-12\bert_model.ckpt即可。

乐清sss

关注

9
点赞
踩
22

收藏

觉得还不错? 一键收藏
7
评论
使用pytorch_pretrained_bert将tensorflow模型转化为pytorch模型

BERT仓库里的模型是TensorFlow版本的，需要进行相应的转换才能在pytorch中使用在Google BERT仓库里下载需要的模型，这里使用的是中文预训练模型(chinese_L-12_H-768_A_12)下载chinese_L-12_H-768_A-12.zip后解压，里面有5个文件bert_config.jsonbert_model.ckpt.data-00000-of-0...
复制链接

扫一扫