tf.nn.max_pool 和tf.nn.conv2d 函数的参数问题

最新推荐文章于 2024-09-24 14:49:05 发布

Pierce_KK

最新推荐文章于 2024-09-24 14:49:05 发布

阅读量351

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Pierce_KK/article/details/83065757

版权

我们看一下 tf.nn.max_pool 这个函数

（还有tf.nn.conv2d 函数）

这两个函数是CNN中两个比较常用的函数，一个是池化层的计算，另一个则是卷积层的计算.。

我们从他们的参数开始，

`tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None,name=None)`

除去name参数用以指定该操作的name，与方法有关的一共五个参数：

第一个参数input：指需要做卷积的输入图像，它要求是一个Tensor，

具有[batch, in_height, in_width, in_channels]这样的shape，

具体含义是[训练时一个batch的图片数量, 图片高度, 图片宽度, 图像通道数]，注意这是一个4维的Tensor，要求类型为float32和float64其中之一。

第二个参数filter：相当于CNN中的卷积核，它要求是一个Tensor，

具有[filter_height, filter_width, in_channels, out_channels]这样的shape，

具体含义是[卷积核的高度，卷积核的宽度，图像通道数，卷积核个数]，要求类型与参数input相同，有一个地方需要注意，第三维in_channels，就是参数input的第四维。

第三个参数strides：卷积时在图像每一维的步长，这是一个一维的向量，长度为4。

[ 1, strides, strides, 1]，我们姑且认为第一位和最后一位固定必须是1

第四个参数padding：string类型的量，只能是"SAME","VALID"其中之一，这个值决定了不同的卷积方式（也就是我们本次的主题）。

第五个参数：use_cudnn_on_gpu:bool类型，是否使用cudnn加速，默认为true；结果返回一个Tensor，这个输出，就是我们常说的feature map，shape仍然是[batch, height, width, channels]这种形式。

我们来看一个实例



valid_pad = tf.nn.max_pool(x,[1,2,2,1],[1,2,2,1],padding='VALID')

.

对于这样的一个实例，我们可以读出以下的内容：输出为x , 卷积核（这里并不是卷积核，只是意义上的类似）的大小为【2x2】, 移动的步长的横向为2，纵向也为2

`tf.nn.max_pool(value, ksize, strides, padding, name=None)`

参数是四个，和卷积很类似：

第一个参数value：需要池化的输入，一般池化层接在卷积层后面，所以输入通常是feature map，依然是[batch, height, width, channels]这样的shape

第二个参数ksize：池化窗口的大小，取一个四维向量，一般是[1, height, width, 1]，因为我们不想在batch和channels上做池化，所以这两个维度设为了1

第三个参数strides：和卷积类似，窗口在每一个维度上滑动的步长，一般也是[1, stride,stride, 1]

第四个参数padding：和卷积类似，可以取'VALID' 或者'SAME'

返回一个Tensor，类型不变，shape仍然是[batch, height, width, channels]这种形式

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Pierce_KK CSDN认证博客专家 CSDN认证企业博客

码龄7年

69: 原创

5万+: 周排名

109万+: 总排名

24万+: 访问

: 等级

2602: 积分

78: 粉丝

270: 获赞

66: 评论

1057: 收藏

私信

关注

热门文章

分类专栏

最新评论

HOG特征
翊歌s: 角度应该是arctan(b/a)
HOG特征
Canis_latrans: 同问，这个没搞懂
HOG特征
dh2046: 对于64*128的图像而言，若将Block的滑动步长取为8，那么水平方向将有7个扫描窗口，垂直方向将有15个扫描窗口，。为什么不是水平方向8个，垂直方向16个呢
关于图像分割的评价指标dice
Kyrie_151: 应该是预测对的正例占实际对的所有样本（包含正确预测正例和错误预测反例）
HOG特征
keep learning1: 特征串联是什么意思？假设cell1得到的特征9维特征向量为v1，cell2得到9维特征向量为v2.他们串联起来是不是就是[v1,v2]？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。