深入浅出pytorch -批归一化？如何卷积？如何转置卷积？

最新推荐文章于 2024-03-21 22:04:57 发布

万物琴弦光锥之外

最新推荐文章于 2024-03-21 22:04:57 发布

阅读量728

点赞数 1

分类专栏：机器学习神经网络 python 文章标签：机器学习计算机视觉卷积神经网络深度学习

本文链接：https://blog.csdn.net/weixin_43702920/article/details/107233388

版权

python 同时被 3 个专栏收录

84 篇文章 1 订阅

订阅专栏

机器学习

60 篇文章 3 订阅

订阅专栏

神经网络

26 篇文章 0 订阅

订阅专栏

卷积和转置卷积

基础图像变换操作
归一化层（Normalization Layer）
附录
未完待续。。。。

基础图像变换操作

1 空间域

Gamma Correction 伽马校正
$\alpha v^{\gamma}$ 第一：图像像素值（v）代表着亮度（Brightness）
第二： $\gamma>1$ 的时候，高亮度区域的变化大即细节增加，低亮度细节减少。
sober算子
边缘检测
具体可以搜索百度百科

2 频域
傅里叶变化
高频为细节，为轮廓。
低通滤波可以过滤细节。

图像特征提取

SIFT:scale-invariant feature Transform
1. 首先计算金字塔表示（Pyramid Representation）
  高斯滤波 + 下采样
2. 找到图像金字塔中的特征点：
  拉普拉斯滤波器
  通过之前的高斯滤波和拉普拉斯整合可以成为， LoG高斯拉普拉斯滤波器。
  LoG 计算代价高，用DoG近似。

卷积层

卷积
转置卷积，反卷积
【如果想了解怎么卷积？怎么反卷积？如何形成卷积矩阵和数据列向量的乘积？？？请看Im2Col GEMM】
我就搬运图，过程如下：

在这里插入图片描述

转置卷积

在这里插入图片描述
二维卷积下，默认的pytorch输入张量为 N,C,H,W

dilation 扩张卷积，增加感受野
transposed 控制是否进行转置卷积，也就是反卷积
摘自：https://www.zhihu.com/question/54149221

归一化层（Normalization Layer）

归一化都采取以下公式：
$\bold y = \gamma \frac{\bold x - E(\bold x)}{\sqrt{\bold{Var(x)+\epsilon}}} + \beta$

批次归一化：Batch Normalization Layer

对于全连接层:
进入神经元前的输入，进行批归一化。
因此你针对的是每个神经元！，每个神经元的输入进行多数据平均。
图中 $Z$ 表示的就是输入到第一个神经元的输出， $x^1$ 就是批次里第一个数据。
在这里插入图片描述

$\times 1$
在这里插入图片描述

BatchNorm1d | BatchNorm2d | BatchNorm3d |

class troch.nn.BactchNorm2d(num_features, eps=1e-5, momentum=0.1, affine =True, track_running_states = True)

nums_features：输入通道数目C
eps: 防止分母为0
momentum 控制指数移动平均计算 $E(\bold x) 和 Var(\bold x)$ , 如果不用，则track_running_stats=False，就用如下更新：
$\hat x_{new} = (1-\alpha)x_{t-1} + \alpha \hat{x_t}$
$E(\bold{x_c} )= \frac{1}{N \times H \times W}\sum_{N,H,W}\bold{x_c}$
$\frac{1}{N \times H \times W}\sum_{N,H,W}\bold{(\bold{x_c} - E(x_c))^2}$

$\hat{x_{}}$ 是基于当前 $E(\bold x)$ 和 $Var(\bold x)$ 计算所得，相对于批次维度的！！
affine: 是否应用 $\gamma$ 和 $\beta$ 形成仿射变换
缓存值：track_running_stats
1. running_mean 缓存均值张量
2. running_var 缓存方差张量
3. num_batches_tracked 当前迷你批次的数目
迷你批次不能太小，不然均值和方差波动大，减少稳定性
批归一化层一般在激活函数前，因此卷积中的bias可以设置为false,因为会在减平均中被消去

组归一化：group normalization

组归一化，减少了对批次大小的统计依赖。
如果num_of_goups=1那就是层归一化layer norm.
BN和GN

class torch.nn.GroupNorm(num_groups, num_channels, eps=1e-05, affine= True)

输入张量通道数分成 num_groups组， $C_g = C/num$
每组分别归一化
注意由于代码没有指数移动平均，因此就没有缓存张量
$E(\bold{x_{c_g}} )= \frac{1}{C_g\times H \times W}\sum_{C_g,H,W}\bold{x_{c_g}}$
$Var(x_{c_g}) = \frac{1}{C_g \times H \times W}\sum_{C_g,H,W}\bold{(\bold{x_c} - E(x_{c_g}))^2}$

实例归一化： instance normalization

$N, C, H, W = = > N, C, 1$
简易记忆：实例实例，就是具体某个例子，聚焦在图片,甚至关注到某个图片某个通道。
在这里插入图片描述

由于之前批次归一化都是参考了其他图片的信息，也就是一个批次中很多图片进行去均值除标准拆，而对于风格迁移或者对抗网络来说，不需要参考同一批次中的图像，所以可以用实例归一化。

class torch.nn.InstanceNorm2d(num_features, eps=1e-05, momentum = 0.1. affine =False, track_running_state = False)

$E(\bold{x} )= \frac{1}{ H \times W}\sum_{H,W}\bold{x}$
$\frac{1}{ H \times W}\sum_{H,W}\bold{(\bold{x_c} - E(x))^2}$

层归一化： layer normalization

$==>N\times1$
在这里插入图片描述

适用于循环神经网络RNN
求==除了迷你批次维度（N）==以外的所有维度的平均值和方差

class torch.nn.LayerNorm(normalized_shape, eps=1e-05, elementwise_affine=False)

$x_{t} = (1-\alpha)x_{t-1} + \alpha \hat{x_t}$
$E(\bold{x} )= \frac{1}{C \times H \times W}\sum_{C,H,W}\bold{x}$
$\frac{1}{C \times H \times W}\sum_{C,H,W}\bold{(\bold{x} - E(x))^2}$

局部响应归一化: Local Response Normalization

引用深入浅出Pytorch-从模型到源码

附录

在这里插入图片描述
$Batch=>C\times1$
$Layer->N\times1$
$C\times N$

未完待续。。。。

万物琴弦光锥之外

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
深入浅出pytorch -批归一化？如何卷积？如何转置卷积？

基础图像变换操作1 空间域Gamma Correction 伽马校正v′=αvγv' = \alpha v^{\gamma}v′=αvγ第一：图像像素值代表着亮度（Brightness）第二：γ>1\gamma>1γ>1的时候，高亮度区域的变化即细节增加，低亮度细节减少。sober算子边缘检测具体可以搜索百度百科2 频域傅里叶变化高频为细节，为轮廓。低通滤波可以过滤细节。图像特征提取SIFT:scale-invariant feature Trans
复制链接

扫一扫