[summary]相关问题，不定期更新

最新推荐文章于 2024-09-08 22:28:13 发布

翔迅AI

最新推荐文章于 2024-09-08 22:28:13 发布

阅读量234

点赞数 11

文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/qq_16759959/article/details/139504615

版权

#模型研发参数查看#

在进行模型研发或者模型设计时需要对模型结构和模型模型参数进行统计，pytorch提供了相应的统计工具summary，如下为使用代码：

import torch
import torch.nn as nn
from torchsummary import summary

class VisionTransformer(nn.Module):
    ...

model = VisionTransformer(
        **kwargs,
    )
summary(model,input_size=(MODEL_INPUT_SIZE))

此时通过屏幕即可打印相关模型信息，包含有每一层的信息、可训练参数、总参数等：

但是会有一些报错信息用于记录：

错误一

RuntimeError: Input type (torch.cuda.FloatTensor) and weight type (torch.FloatTensor) should be the same

原因分析：模型和输入的tensor不在同一个device上，一个在CPU一个在GPU上。

def summary(model, input_size, batch_size=-1, device="cuda"):
    ...
    if device == "cuda" and torch.cuda.is_available():
        dtype = torch.cuda.FloatTensor
    else:
        dtype = torch.FloatTensor
    ...
    x = [torch.rand(2, *in_size).type(dtype) for in_size in input_size]

进入 summary函数后可以看到有一个参数'device' ，这个参数会将data传入到相应的设备上，而此时model却是在CPU上。所以，weights在cpu上，data在GPU上。有两种解决方案，即将model放在GPU或者data放在CPU。（推荐都放在GPU上）

#方法一，将data放在cpu
summary(model.cuda(),input_size=( 3, 384, 384),device="cpu")

#方法二，将模型放在GPU
# vit某些算子CPU不支持的，所以推荐方法二
summary(model.cuda(),input_size=( 3, 384, 384))