手动实现计算模型的参数量和计算量

最新推荐文章于 2024-05-20 10:25:10 发布

那里，春暖花开

最新推荐文章于 2024-05-20 10:25:10 发布

阅读量623

点赞数

分类专栏： net.apply() hook Module 文章标签： pytorch

本文链接：https://blog.csdn.net/qq_37025073/article/details/106794315

版权

Module 同时被 3 个专栏收录

5 篇文章 0 订阅

订阅专栏

net.apply()

2 篇文章 1 订阅

订阅专栏

hook

2 篇文章 0 订阅

订阅专栏

此代码来源于Higher HRNet

import os
import torch
import torch.nn as nn
import torchvision.models as models
def get_model_summary(model, *input_tensors, item_length=26, verbose=True):
    """
    :param model:
    :param input_tensors:
    :param item_length:
    :return:
    """

    summary = []
    # 定义一个namedtuple类型Layer，并包含"name", "input_size", "output_size", "num_parameters", "multiply_adds"属性。
    ModuleDetails = namedtuple(
        "Layer", ["name", "input_size", "output_size", "num_parameters", "multiply_adds"])
    hooks = []# 用于remove
    layer_instances = {}

    def add_hooks(module):

        def hook(module, input, output):
            class_name = str(module.__class__.__name__)
            # 统计classname出现的次数，并将classname命名为layer_name
            instance_index = 1
            if class_name not in layer_instances:
                layer_instances[class_name] = instance_index
            else:
                instance_index = layer_instances[class_name] + 1
                layer_instances[class_name] = instance_index

            layer_name = class_name + "_" + str(instance_index)

            params = 0
            # 统计Conv,BatchNorm,Linear这3类module的参数量
            if class_name.find("Conv") != -1 or class_name.find("BatchNorm") != -1 or \
               class_name.find("Linear") != -1:
                for param_ in module.parameters():
                    params += param_.view(-1).size(0)

            # 计算每个module的flops
            flops = "Not Available"
            if class_name.find("Conv") != -1 and hasattr(module, "weight"):
                flops = (
                    torch.prod(
                        torch.LongTensor(list(module.weight.data.size()))) *
                    torch.prod(
                        torch.LongTensor(list(output.size())[2:]))).item() #flops为卷积核的参数量乘以输出特征图的分辨率 inchannel*outchannel*kernel_width*kernel_height*output_width*output_height
            elif isinstance(module, nn.Linear):
                flops = (torch.prod(torch.LongTensor(list(output.size()))) \
                         * input[0].size(1)).item()

            if isinstance(input[0], list):
                input = input[0]
            if isinstance(output, list):
                output = output[0]

            summary.append(
                ModuleDetails(
                    name=layer_name,
                    input_size=list(input[0].size()),
                    output_size=list(output.size()),
                    num_parameters=params,
                    multiply_adds=flops)
            )
        #
        if not isinstance(module, nn.ModuleList) \
           and not isinstance(module, nn.Sequential) \
           and module != model:
            hooks.append(module.register_forward_hook(hook))

    model.eval()
    model.apply(add_hooks)

    space_len = item_length

    model(*input_tensors)
    for hook in hooks:
        hook.remove()

    details = ''
    if verbose:
        details = "Model Summary" + \
            os.linesep + \
            "Name{}Input Size{}Output Size{}Parameters{}Multiply Adds (Flops){}".format(
                ' ' * (space_len - len("Name")),
                ' ' * (space_len - len("Input Size")),
                ' ' * (space_len - len("Output Size")),
                ' ' * (space_len - len("Parameters")),
                ' ' * (space_len - len("Multiply Adds (Flops)"))) \
                + os.linesep + '-' * space_len * 5 + os.linesep
    params_sum = 0
    flops_sum = 0
    for layer in summary:
        params_sum += layer.num_parameters
        if layer.multiply_adds != "Not Available":
            flops_sum += layer.multiply_adds
        if verbose:
            details += "{}{}{}{}{}{}{}{}{}{}".format(
                layer.name,
                ' ' * (space_len - len(layer.name)),
                layer.input_size,
                ' ' * (space_len - len(str(layer.input_size))),
                layer.output_size,
                ' ' * (space_len - len(str(layer.output_size))),
                layer.num_parameters,
                ' ' * (space_len - len(str(layer.num_parameters))),
                layer.multiply_adds,
                ' ' * (space_len - len(str(layer.multiply_adds)))) \
                + os.linesep + '-' * space_len * 5 + os.linesep

    details += os.linesep \
        + "Total Parameters: {:,}".format(params_sum) \
        + os.linesep + '-' * space_len * 5 + os.linesep
    details += "Total Multiply Adds (For Convolution and Linear Layers only): {:,}".format(flops_sum) \
        + os.linesep + '-' * space_len * 5 + os.linesep
    details += "Number of Layers" + os.linesep
    for layer in layer_instances:
        details += "{} : {} layers   ".format(layer, layer_instances[layer])

    return details

dump_input = torch.rand((1, 3, 224, 224))
resnet18 = models.resnet18()
print(get_model_summary(resnet18,dump_input))

该方法利用pytorch的register_forward_hook(hook)以及model.apply()机制，对模型的每个叶子节点的模块进行参数量和计算量的统计，将统计结果保存到字符串details中。其中，参数量的总计保存在params_sum变量中，计算量的总计保存在flops_sum变量中。模型的模块名，输入大小，输出大小，参数量，计算量保存在summary变量中。并根据设定好的格式在details字符串中打印出来。

那里，春暖花开

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
手动实现计算模型的参数量和计算量

此代码来源于Higher HRNetimport osimport torchimport torch.nn as nnimport torchvision.models as modelsdef get_model_summary(model, *input_tensors, item_length=26, verbose=True): """ :param model: :param input_tensors: :param item_length:
复制链接

扫一扫