深度学习（20）神经网络与全连接层三: 全连接层

最新推荐文章于 2024-09-03 18:10:16 发布

炎武丶航

最新推荐文章于 2024-09-03 18:10:16 发布

阅读量1.9k

点赞数 1

分类专栏：深度学习 TensorFlow2 文章标签：深度学习 tensorflow

本文链接：https://blog.csdn.net/weixin_43360025/article/details/119822500

版权

深度学习同时被 2 个专栏收录

125 篇文章 57 订阅

订阅专栏

TensorFlow2

69 篇文章 12 订阅

订阅专栏

深度学习（20）神经网络与全连接层三: 全连接层

1. 单层
2. 三层
3. 多层
4. Here comes Deep Learning!
5. Why Deep Learning?
6. Heroes
7. Fully connected layer（全连接层）
8. net.build()
9. 网络中的维度设置出错会导致报错
10. Multi-Layers——keras.Sequential()
11. 全连接层实战
12. Next

Outline

Matmul
Neural Network
Deep Learning
Multi-Layer

Recap

$o u t = f (X @ W + b)$
$\to$
$o u t = r e l u (X @ W + b)$

1. 单层

$X @ W + b$
- $h = r e l u (X @ W + b)$
- $\begin{bmatrix}h_0^0&h_1^0\\h_0^1&h_1^1\end{bmatrix}=relu(\begin{bmatrix}x_0^0&x_1^0&x_2^0\\x_1^0&x_1^1&x_1^2\end{bmatrix}@\begin{bmatrix}w_{00}&w_{01}\\w_{10}&w_{11}\\w_{20}&w_{21}\end{bmatrix}+\begin{bmatrix}b_0&b_1\end{bmatrix})$

2. 三层

$h_0=relu(X@W_1+b_1)$
$h_1=relu(h_0@W_2+b_2)$
$out=relu(h_1@W_3+b_3)$

3. 多层

Input
Hidden
Output

4. Here comes Deep Learning!

(1) Neural Network in the 1980s

$3\sim5\ layers$

(2) Deep Learning now

$n≈1200\ layers$

5. Why Deep Learning?

- 486 PC with DSP32C
  - 20Mflops, 4MB RAM
- Telsa V100
  - 32GB HBM2, 100Tflops

6. Heroes

BigDATA
ReLU
Dropout
BatchNorm
ResNet
Xavier Initialization
Caffe/TensorFlow/PyTorch
…

7. Fully connected layer（全连接层）

在这里插入图片描述

(1) x = tf.random.normal([4, 784]): 创建一个维度为[4, 784]的Tensor;
(2) net = tf.keras.layers.Dense(512): 创建一层神经网络，其输出维度为512;
(3) tf.keras.layers.Dense()在运行时会自动根据输入的shape来生成权值，即w和b;
(4) out.shape: 输出out的维度为[4, 512];
(5) net.kernal.shape: 为自动生成的权值w，其shape为[784, 512];
(6) net.bias.shape: 为自动生成的权值（偏置项）b，其shape为[512];

8. net.build()

在这里插入图片描述
(1) net.build(input_shape=(None, 4)): 可以通过调用net.build()函数创建权重 $w$ 和 $b$ ，其中4为下一层的维度;
(2) net.build(input_shape=(None, 20)): 这里可以看出可以通过多次调用net.build()函数来计算权重 $w$ 和 $b$ 的值;
注: 在第一次创建神经网络的时候，没有 $w$ 和 $b$ ，这时系统就会自动调用net.build()函数来创建权重 $w$ 和 $b$ ;

9. 网络中的维度设置出错会导致报错

在这里插入图片描述

(1) 如上图所示，net.build(input_shape=(None, 20))表示建立的网络的维度为20; out=net(tf.random.randn((4, 12)))表示输入到这层神经网络中的数据的维度是12; 那么计算时就会报错;
(2) out=net(tf.random.randn((4, 20))): 将输入到这层神经网络中的数据的维度改为20，最终out.shape=[4, 10];

10. Multi-Layers——keras.Sequential()

多层神经网络，只需要调用容器——keras.Sequential()即可。

- keras.Sequential([layer1, layer2, layer3])
- Sequential

(1) x = random.normal([2, 3]): 创建一个维度为[2, 3]的Tensor;
(2) model = keras.Sequential([keras.layers.Dense(2, activation=‘relu’), keras.layers.Dense(2, activation=‘relu’), keras.layers.Dense(2)]): 共设置3层全连接层:
$[3] \to [2] \to [2] \to [2]$
(3) model.build(input_shape=[None, 3]): 给定一个维度为3的输入;
(4) model.summary(): 相当于print(model)，方便查看网络结构的函数;
(5) for p in model.trainable_variables: 所有权重参数都被称为“可训练的变量”，即trainable_variables，在这个网络结构中，就是 $w_1,b_1,w_2,b_2,w_3,b_3]$ ;
(6) print(p.name, p.shape): 打印这些参数的名字和其维度;

11. 全连接层实战

import tensorflow as tf
from tensorflow import keras

x = tf.random.normal([2, 3])

model = keras.Sequential([
    keras.layers.Dense(2, activation='relu'),
    keras.layers.Dense(2, activation='relu'),
    keras.layers.Dense(2)
])
model.build(input_shape=[None, 4])
model.summary()

for p in model.trainable_variables:
    print(p.name, p.shape)

运行结果如下:
在这里插入图片描述

(1) Param为参数量，第一层有 $2 \times 3 + 2 = 8$ 个; 第二层有 $2 \times 2 + 2 = 6$ 个; 第三层有 $2 \times 2 + 2 = 6$ 个;
(2) dense_n/kernel: 第n层的 $w$ 的值;
dense_n/bias: 第n层的 $b$ 的值;

12. Next

神经网络层与训练方法
图片识别
文本理解
艺术创作
自动决策
…

参考文献:
[1] 龙良曲:《深度学习与TensorFlow2入门实战》
[2] https://www.youtube.com/watch?v=FwFduRA_L6Q
[3] https://capacitybc.com/mini-series-part-3-the-hero1
[4] https://www.facebook.com/deepdreamgenerator/photos/a.892441237472223/1449674838415524/?type=1&theater
[5] https://study.163.com/provider/480000001847407/index.htm?share=2&shareld=480000001847407