深度学习入门

杂七杂八的

已于 2024-03-25 22:28:05 修改

阅读量103

点赞数

文章标签：深度学习人工智能

于 2023-11-07 17:50:44 首次发布

本文链接：https://blog.csdn.net/weixin_43662239/article/details/134272744

版权

全连接批量归一化

目的: 一般的激活函数在0附近的分布是梯度良好区域，把数据的范围压缩在梯度良好区域，在反向传播中更有利于收敛
方式: 每个节点上增加 $\gamma$ , $\beta$
关键: 在全连接层中,可以认为每个 $x_i$ 独立分布，所以归一化是作用在 $x_i$ 上的

正确理解
例子：
sigmoid函数 $y=\frac{1}{1 + e^x}$
在这里插入图片描述

卷积批量归一化

卷积实际上是一种共用权值的批量归一化层，输入一个特征图通道上的所有值和输出的一块区域事实上形成了全连接
输入： $\times 1 \times C_{in}$
输出： $h_k \times w_k \times C_{out}$
参数总量： $C_{in} \times h_k \times w_k \times C_{out}$
关键: 一个channel上的 $KaTeX parse error: Double subscript at position 7: C_{in}_̲i$ 说实话不是独立分布的,如rgb值，看任合一个通道的image都能看出那是一只猫，独立分布的最小的个体是 $C_in$ ，所以求归一化是在 $C_in$ 上做的

torch张量维度重构

参考：
一文读懂torch的view机制
 torch的view和reshape底层机制

import torch
arr = torch.rand(2, 3, 4, 5)
arr_1d = arr.flatten()
for d1 in range(2):
    for d2 in range(3):
        for d3 in range(4):
            for d4 in range(5):
                index = d1 * 3 * 4 * 5 + d2 * 4 * 5 + d3 * 5 + d4 * 1
                print(arr_1d[index])

import torch
arr = torch.rand(2, 3, 4, 5)
arr_1d = arr.flatten()
s4 = 1
s3 = 5 * 1
s2 = 4 * 5 * 1
s1 = 3 * 4 * 5 * 1

for d1 in range(2):
    for d2 in range(3):
        for d3 in range(4):
            for d4 in range(5):
                index = d1 * s1 + d2 * s2 + d3 * s3 + d4 * s4
                print(arr_1d[index])