tf中的卷积神经网络

最新推荐文章于 2023-06-20 11:38:01 发布

哈工程第一亚索

最新推荐文章于 2023-06-20 11:38:01 发布

阅读量665

点赞数

分类专栏： tensorflow 文章标签：神经网络深度学习 tensorflow

本文链接：https://blog.csdn.net/qq_46588746/article/details/120343226

版权

tensorflow 专栏收录该内容

37 篇文章 2 订阅

订阅专栏

tf中的卷积神经网络

1. 卷积

对于全连层，有参数过多，加重硬件负担的风险。采用部分连接的方法，如下图所示（其中绿线的权值相同。蓝线的权值相同）可以有效降低参数。对于局部连接可以理解为一组权值（在读完一组图片前权值不变）滑过整张图片，得出新的信息。
卷积的概念：卷积的概念如下，两个矩形门函数的卷积是三角函数（详见信号与系统） $y(t)=x(t)\ast y(t)=\int_{-\infty}^{+\infty}x(\tau)y(t-\tau)\rm d\tau$
2D-卷积（离散）：可以将kernel（即参数w）看为连续卷积中的 $h(\tau)$ ，将与kernel同维度的部分input看为连续卷积中的 $x(\tau)$ ，将输出的一个点看为连续卷积中的输出结果。
2D-卷积计算方法：将kernel中的值与窗口对应部分input中的值按位置对应相乘，再累加，再统一加bias。

2. 卷积神经网络

对于多个通道的数据，要加入与通道数相同的kernel（这多个kernel仍称为一个卷积核），这多个kernel与对应通道input（对应窗口）相乘累加后的值再累加得到输出值
padding：有时候当窗口快滑倒边界时，会出现再滑动的话出现边界溢出的问题，这导致最后的输出可能在某个维度上略小于输入。因此采用padding操作在图片的（矩阵数值的边界）边界上添加一些数值，使窗口可以继续滑动，保证了输入输出的维度一致
stride：默认窗口每次间隔一个单位滑动，stride可以设置滑动的步长，这样也可以下降输出的维度大小
多个卷积核：无论数据是几维的，在经过一个卷积核输出都是一个二维值，这对于深度学习的后续进行是不利的，因此采用多个卷积核来扩充输出的维度。如一个[1,32,32,3]的图片数据经过[4,3,5,5]的卷积操作（4个3通道5X5的卷积核）得到输出为[1,32,32,4]的数据
tf中的2D卷积操作：layers.Conv2D（自动管理维护w和b参数）

import tensorflow as tf
from tensorflow.keras import layers
# 其中第一个数字指卷积核个数，vaild指不做padding，same指做padding
layer = layers.Conv2D(4, kernel_size=5, strides=1, padding='vaild')
out = layer(x)
print(out)
layer = layers.Conv2D(4, kernel_size=5, strides=1, padding='same')
out = layer(x)
print(out)
layer = layers.Conv2D(4, kernel_size=5, strides=2, padding='same')
out = layer(x)
print(out)

tf中的2D卷积操作：nn.Conv2D（需要自己管理维护w和b参数，更灵活）

w = tf.random.normal([5,5,3,4])
b = tf.zeros([4])
out = tf.nn.conv2d(x, w, strides=1, padding='VALID')
out = out + b
print(out)
out = tf.nn.conv2d(x, w, strides=2, padding='VALID')
out = out + b
print(out)

tf中卷积的梯度下降：以输入为3X3矩阵，卷积核为2X2，输出为2X2为例 $O_{00}=x_{00}*w_{00}+x_{01}*w_{01}+x_{10}*w_{10}+x_{11}*w_{11}+b$ $O_{01}=x_{01}*w_{00}+x_{02}*w_{01}+x_{11}*w_{10}+x_{12}*w_{11}+b$ $O_{10}=x_{10}*w_{00}+x_{11}*w_{01}+x_{20}*w_{10}+x_{21}*w_{11}+b$ $O_{11}=x_{11}*w_{00}+x_{12}*w_{01}+x_{21}*w_{10}+x_{22}*w_{11}+b$ $\frac{\partial Loss}{\partial w_{00}} =\sum_{i\in 00,01,10,11}\frac{\partial Loss}{\partial O_i}\frac{\partial O_i}{\partial w_i}$ 其中 $\frac{\partial O_{00}}{\partial w_{00}}=x_{00}$

3. 池化和采样

池化（下采样）：降低维度，池化主要分为两种，即最大值池化和平均池化。其中最大值池化是取窗内最大值最为一个窗内数据的代表，平均池化取窗内平均值最为一个窗内数据的代表

# 第一种方法
pool = layers.MaxPool2D(2, strides=2) #其中2代表池化的kernel大小
out = pool(x)
print(out)
pool = layers.MaxPool2D(3, strides=1)
out = pool(x)
print(out)
# 第二种方法
out = tf.nn.maxPool2d(x, strides=2, padding='VALID')

上采样：增加维度，如复制等

layer = layers.UpSampling2D(size = 3) #size代表增大的倍数
out = layer(x)
print(out)

ReLU：用于去除负的单元（如像素或特征）值

x=tf.random.normal([2, 3])
# 第一种方法
tf.nn.relu(x)
print(x)
# 第二种方法
layers.ReLU()(x)
print(x)

哈工程第一亚索

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
tf中的卷积神经网络

tf中的卷积神经网络目录tf中的卷积神经网络1. 卷积2. 卷积神经网络3. 池化和采样1. 卷积对于全连层，有参数过多，加重硬件负担的风险。采用部分连接的方法，如下图所示（其中绿线的权值相同。蓝线的权值相同）可以有效降低参数。对于局部连接可以理解为一组权值（在读完一组图片前权值不变）滑过整张图片，得出新的信息。卷积的概念：卷积的概念如下，两个矩形门函数的卷积是三角函数（详见信号与系统）y(t)=x(t)∗y(t)=∫−∞+∞x(τ)y(t−τ)dτ y(t)=x(t)\ast y(t)=\in
复制链接

扫一扫

专栏目录