需要学习的知识点
- 如何使用卷积,激励,池化
- 如何使用全连接
最近看了一位大佬写的对卷积的理解写得非常详细,可以参考这篇博客
https://blog.csdn.net/v_JULY_v/article/details/51812459 - 如何用代码实现卷积
1. 卷积(tf.nn.conv2d)
# conv2d(input, filter, strides, padding, use_cudnn_on_gpu=True, data_format="NHWC", name=None)
每一个参数代表一个形态shape,比如第一个参数【batch, h, w, channels】,里面的元素有4个,说明它是一个4维的张量,也就是4位的数组
如果形态不懂的话可以看看之前写的博客
https://editor.csdn.net/md/?articleId=107565145
如果通过形态得到一个4维的张量
第一个参数是输入,它是一个4维度的张量
【batch, h, w, channels】
batch 就是说一次输入多少张图片, 可以是1, 或者其他数
h 输入的高度
w 输入的宽度
channels 就是一张图片输入的通道数, 彩色是3, 黑白是1
第二个参数是一个卷积核,也是一个4维的张量
【k_h, k_w, in, out】
k_h 卷积核的高度
k_w 卷积核的宽度
in 卷积需要作用输入图片的通道数,可以是第一个参数的 channels 的值
out 卷积核的个数,也可以是输出的通道数
第三个参数是卷积核的移动步长,也是一个4维的张量
【1, s_h, s_w, 1】
s_h 就是高度方向移动的步长
s_w 就是宽度方向移动的步长
第四个参数是补0的方法,可以选择二个之中的其中一个
【“SAME"或者"VALID”】
SAME TensorFlow会自动补0,这样会保证输出大小和输入大小相同
VALID 不会自动补0
输入一张 3 * 3 的图片对他进行卷积操作
import tensorflow as tf
# 这是一张 3 *3 的彩色图片
input = tf.constant(
[ # 一张图片
[ # 图片的宽
[ # 图片的高
[100., 100., 100.], # 里面那一层就是图片的通道
[100., 100., 100.],
[100., 100., 100.]
],
[
[100., 100., 100.], # 里面那一层就是图片的通道
[100., 100., 100.],
[100., 100., 100.]
],
[
[100., 100., 100.], # 里面那一层就是图片的通道
[100., 100., 100.],
[100., 100., 100.]
]
]
]
)
# 做一个过滤器(卷积核)
filter = tf.constant(
[ # 卷积核的宽度为2
[ # 卷积核的高度为 2
[ # 通道数 为 3 (这里的通道就是输入图片的通道)彩色图片为3
[0.5, 0.1], # 卷积核的个数
[0.5, 0.1],
[0.5, 0.1]
],
[
[0.5, 0.1],
[0.5, 0.1],
[0.5, 0.1]
]
],
[
[
[0.5, 0.1],
[0.5, 0.1],
[0.5, 0.1