深入理解深度学习各种模型格式转换

最新推荐文章于 2024-08-05 16:32:23 发布

酌沧

最新推荐文章于 2024-08-05 16:32:23 发布

阅读量990

点赞数 18

分类专栏： AI 文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/jiaxin576/article/details/137900401

版权

AI 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

1. 概述

本文档旨在详细介绍ONNX（Open Neural Network Exchange）格式及其在深度学习模型转换中的应用。我们将探讨不同深度学习模型格式，包括Checkpoint、H5、Frozen Graph、Caffe、PyTorch、MXNet，并解释如何将这些格式转换为ONNX格式以提高模型的可移植性和互操作性。

2. ONNX简介

ONNX是一种开放的生态系统，为深度学习模型提供了一个标准化的表示格式。它允许开发者在不同的深度学习框架之间轻松地转换模型，促进了工具和库之间的互操作性。ONNX作为一种中间表示（IR）格式，能够捕获模型的架构及其参数。

支持的模型格式

Checkpoint：TensorFlow的模型保存格式，包含模型的权重和训练状态。
H5：HDF5格式，常用于Keras，包含模型的结构和权重。
Frozen Graph：TensorFlow特有的格式，用于将模型的定义和权重固化。
Caffe Model：由.prototxt（结构）和.caffemodel（权重）文件组成。
PyTorch Model：通常通过.pt或.pth文件保存。
MXNet Model：包含.json（结构）和.params（参数）文件。

3. 模型转换过程

模型转换通常涉及以下步骤：一旦模型被转换为ONNX格式，它就可以被导入到支持ONNX的任何框架中，如ONNX Runtime，或者被进一步转换为其他框架的模型。这极大地增强了模型的可移植性和灵活性。

从源框架到ONNX：将一个框架的模型转换为ONNX模型通常需要使用专门的转换工具或库。例如，对于PyTorch，可以直接使用torch.onnx.export()函数来导出模型。对于TensorFlow，可能需要使用一个如tf2onnx的转换工具。
保持操作和层的一致性：转换过程中的一个关键挑战是确保模型的操作（Ops）和层在ONNX格式中有对应的表示，以保持模型的功能和性能。
验证转换后的模型：转换完成后，重要的一步是验证转换后的模型在功能上与原始模型一致，确保其推理结果相同。

4. 模型保存示例

4.1 TensorFlow Checkpoint

import tensorflow as tf

model = tf.keras.models.Sequential([...])
model.compile(optimizer='adam', loss='mean_squared_error')
model.fit(x_train, y_train, epochs=5)
model.save_weights('model_checkpoint')

当在Keras中使用model.save_weights()方法保存模型权重时，特别是在使用TensorFlow后端时，可能会看到生成了以下三个文件：

model_checkpoint.weights.data-00000-of-00001：这个文件实际上存储了模型的权重值。文件名中的“data-00000-of-00001”表明这是权重数据的第一个（也是唯一一个）分片。如果您有一个非常大的模型，TensorFlow有能力将权重分割成多个文件，但通常对于大多数模型来说，所有权重都存储在这一个文件中。
model_checkpoint.weights.index：这个文件保存了权重文件中每个权重的索引，使得TensorFlow可以快速定位并读取权重值。您可以将其视为一种元数据文件，它告诉TensorFlow如何从数据文件中检索权重。
checkpoint：这个文件是一个文本文件，它记录了最新保存的模型文件的信息。当您有多个检查点时，这个文件将指向最新的一个。它包含了有关当前目录下所有检查点的信息，但不包含权重或模型结构的具体数据。

当想要加载权重时，只需使用model.load_weights(filepath)方法。尽管在调用load_weights时只指定了文件的基本名称（在这个例子中是model_checkpoint.weights），TensorFlow会自动寻找具有相应名称模式的.data和.index文件来恢复模型的权重。

4.2 Keras H5

import tensorflow as tf

model = tf.keras.models.Sequential([...])
model.compile(optimizer='adam', loss='mean_squared_error')
model.fit(x_train, y_train, epochs=5)
model.save('model.h5')

如果显式地使用.h5或.hdf5扩展名，Keras将使用HDF5格式保存权重，这是一个用于存储大量数值数据的文件格式。HDF5文件是自包含的，权重信息被保存在单个文件中，这与TensorFlow检查点的多文件方式不同。

4.3 PyTorch Model

import torch
import torch.nn as nn

class SimpleModel(nn.Module):
    ...

model = SimpleModel()
optimizer = optim.Adam(model.parameters())
for epoch in range(num_epochs):
    ...
torch.save(model.state_dict(), 'model.pth')

5. 预训练BERT模型示例

以下文件通常与预训练的BERT模型相关联：

config_path (bert_config.json): 这个JSON文件包含了模型的配置信息，例如模型大小、层数（L）、隐藏层大小（H）、自注意力头的数量（A），以及其他重要的配置选项，如vocab大小、激活函数类型等。这些信息对于正确构建模型架构至关重要，确保加载的权重能够正确地放置在适当的模型结构中。
checkpoint_path (bert_model.ckpt): 这是一个TensorFlow检查点文件，其中存储了预训练BERT模型的权重。在TensorFlow中，检查点可能由多个文件组成，通常包括.index文件和一个或多个.data-00000-of-0000X文件，这里X表示分片数量。这些文件共同定义了模型的参数。在您的代码中，您提供了.ckpt文件的前缀，TensorFlow会自动寻找相应的.index和.data文件来加载权重。
dict_path (vocab.txt): 这个文件包含了模型使用的词汇表。每一行包含词汇表中的一个词或标记。BERT和其他Transformer模型通常使用WordPiece或BPE（字节对编码）等方法进行分词，这种方法在处理未知词（OOV词）时比传统分词方法更灵活。在预处理输入数据和解析模型输出时，这个词汇文件是必不可少的。

6. 结论

ONNX提供了一种有效的途径，使得不同深度学习框架之间的模型转换和共享变得可能。通过理解和利用ONNX，开发者可以更灵活地选择工具和框架，推动深度学习领域的创新和发展。

酌沧

关注

18
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
深入理解深度学习各种模型格式转换

ONNX是一种开放的生态系统，为深度学习模型提供了一个标准化的表示格式。它允许开发者在不同的深度学习框架之间轻松地转换模型，促进了工具和库之间的互操作性。ONNX作为一种中间表示（IR）格式，能够捕获模型的架构及其参数。支持的模型格式Checkpoint：TensorFlow的模型保存格式，包含模型的权重和训练状态。H5：HDF5格式，常用于Keras，包含模型的结构和权重。：TensorFlow特有的格式，用于将模型的定义和权重固化。
复制链接

扫一扫

专栏目录