Pytorch(1) pytorch和tensorflow里面的maxpool

最新推荐文章于 2024-08-12 10:41:02 发布

GZHermit

最新推荐文章于 2024-08-12 10:41:02 发布

阅读量8.3k

点赞数 1

分类专栏： Pytorch

本文链接：https://blog.csdn.net/GZHermit/article/details/79236056

版权

本文探讨了PyTorch和TensorFlow在最大池化操作（MaxPool）上的不同，主要区别在于PyTorch的padding填充方式是四周补0，支持dilation模式，而TensorFlow的'SAME'模式只在图像右侧和下方补0，不支持dilation。通过实例展示了当设置相同参数时，两者输出的不同，并介绍了PyTorch中实现单边加0 padding的方法。

摘要由CSDN通过智能技术生成

pytorch和tensorflow所含的maxpool，虽然名字相同，但是功能是不一样。之前在用pytorch复现darknet里面的yolo-v2时才发现这个问题。在yolov2的第六个maxpool的时候，kernel为2，stride为1，所以
按道理来说呢，输出的边size应该比输入的边size少1，但是yolo的设计是输入和输出的shape要相同。所以才发现了这个问题。

不同之处在于padding的补全方式

pytorch里的maxpool，padding的方式是四周都补0，如果padding等于x，那么输入的feature map就会比原来大上x圈。并且还支持dilation模式Σ( ° △ °|||)︴

而tensorflow里的maxpool，padding方式是分为SAME和VALID，在SAME模式下，padding有时候只会在图像右侧和下方补0，而左侧和上方并不会。不支持dilation。

举个例子
如果输入一个3X3的图片，
1,2,3
4,5,6
7,8,9
对其做kernel_size=2,stride=1的maxpool，那么本应该得到
5,6
8,9

# pytorch版本
import torch
import torch.nn.functional as F
from torch.autograd import Variable

data = torch.FloatTensor([[[[1, 2, 3],

最低0.47元/天解锁文章

GZHermit

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录