对单张图片进行卷积池化遇到的小问题

天天写点代码

已于 2022-05-29 16:47:14 修改

阅读量1.7k

点赞数 3

分类专栏： pytorch学习小问题文章标签： python

于 2022-05-29 16:46:17 首次发布

本文链接：https://blog.csdn.net/m0_52987303/article/details/125032640

版权

pytorch学习小问题专栏收录该内容

3 篇文章 1 订阅

订阅专栏

在写一个评价指标时需要对图片进行卷积操作，遇到了很多问题，在此做个记录
问题一：RuntimeError: Given input size: (400x600x3). Calculated output size: (400x150x0). Output size is too small。
问题原因：
先采用opencv读取了图片数据，但cv读取的图片数据是【n,h,w,c】格式，即通道数是最后一维。但是torch处理时图片一般是【n,c,h,w】个人感觉后者更符合直觉。因此当采用的卷积核尺度大于c通道数以后就会报错，输出为0维度（尺度太小，放不下一个卷积核）
问题解决：
在利用opencv读取图片数据后进行利用transpose函数维度修改，这里由于是单张图片因此没有n，只有【c,h,w】。transpose的作用就是可以改变数组的维度位置，如下代码（2，0，1）就是说，新的imgtem第0维度是原来的第2维度，第1维度是原来的第0维度，第2维度是原来的第1维度，这样就满足了torch处理格式。

imgtem=cv2.imread(path + filename)
###########注意cv读取的图片格式是【n,h,w,c】,而pytorch则是【n,c,h,w】后者也更符合直觉
imgtem = imgtem.transpose(2, 0, 1)

问题二：“max_pool2d” not implemented for ‘Byte’
问题原因：由于利用opencv读取图片因此需要将numpy格式转化为tensor格式，利用了from_array函数，该函数是浅拷贝，新数据与原数据格式相同，而orch.from_numpy默认为torch.uint8，
问题解决：转换为FloatTensor类型(或者其他)就好。

 img1=torch.from_numpy(img)//报错代码
 img1=torch.from_numpy(img).float()//正确代码

天天写点代码

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
对单张图片进行卷积池化遇到的小问题

对单张图片进行卷积时遇到的小问题"max_pool2d" not implemented for 'Byte'和RuntimeError: Given input size: (400x600x3). Calculated output size: (400x150x0). Output size is too small
复制链接

扫一扫