关于对pytorch中的view的理解

最新推荐文章于 2024-05-10 10:17:30 发布

sunyuxiu

最新推荐文章于 2024-05-10 10:17:30 发布

阅读量1.1k

点赞数 1

分类专栏：图像处理文章标签： python

本文链接：https://blog.csdn.net/sunyuxiu/article/details/106735682

版权

图像处理专栏收录该内容

3 篇文章 0 订阅

订阅专栏

关于对pytorch中的view的理解

今天写了一个pytorch的识别的代码，网络结构如下：

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        # Conv2d中的第一个参数是输入的channel数量， 第二个是输出的channel的数量，第三个是kernel size的大小
        self.conv1 = nn.Conv2d(3, 6, 5)
        
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        # 由于上一层中有16个channel的输出， 每个feature map大小为5*5， 所以全连接层的输入为16*（5*5）
        self.fc1 = nn.Linear(16*13*13, 120)
        self.fc2 = nn.Linear(120, 84)
        # 我的最终分类为10类，所以fc3输出为10
        self.fc3 = nn.Linear(84, 10)



    def forward(self, x):
    # forward 这个 函数为定义前向传播的运算，所以只需要写一个普通的python代码就可以了
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        # 下面把二维特征变为一维特征，这样全连接层才可以处理， 一种方法是写成：x = x.view(-1, 16*13*13)，或者是像下面这样：
        # x = x.view(x.size(0), 16*13*13)，至于13是怎么来的，后面会具体分析。
        x = x.view(x.size(0), 16*13*13)

        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

经常运行代码时会发生如下错误：
RuntimeError: shape '[-1, 400]' is invalid for input of size 10816
`等等，具体问题要具体分析，每一个人的图像shape不一样，我的时64x64的rgb图像，batch size=4
所以我设置的x = x.view(4, 16*13*13)
网上也有说的64 x 64的灰度图像，也可以这么设置，这里有一个公式：
x = x.view(-1, channels*height*width)
channels 来自前一个卷积的滤波器的通道的数量，如果你遇到了这样的问题：
RuntimeError:shape'[-1,400]' is invalid for input of size E
可以直接用公式:
height = width =sqrt(E/batch_size/N_channels)
N_channels = 16，个人理解为的是卷积层的输出channels，不是image的channels。
对于上面的错误中的10816：sqrt(10816/4/16)=13，所以我的x = x.view(4, 16*13*13)
希望对你有所帮助
如果还有别的error的，可以参考这篇博客：https://blog.csdn.net/weixin_41770169/article/details/90750965

sunyuxiu

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
关于对pytorch中的view的理解

关于对pytorch中的view的理解今天写了一个pytorch的识别的代码，网络结构如下：class Net(nn.Module): def __init__(self): super(Net, self).__init__() # Conv2d中的第一个参数是输入的channel数量，第二个是输出的channel的数量，第三个是kernel size的大小 self.conv1 = nn.Conv2d(3, 6, 5)
复制链接

扫一扫

专栏目录