7. LeNet

最新推荐文章于 2023-09-15 19:00:03 发布

X1996_

最新推荐文章于 2023-09-15 19:00:03 发布

阅读量88

点赞数

分类专栏：《动手学习深度学习文章标签：《动手学习深度学习》

本文链接：https://blog.csdn.net/X1996_/article/details/124237527

版权

《动手学习深度学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

LeNet网络有两层卷积层，两层池化层，三层全连接层构成，搭建模型直接堆叠就好了

搭建网络

import tensorflow as tf
from d2l import tensorflow as d2l


def net():
    return tf.keras.models.Sequential([
        tf.keras.layers.Conv2D(filters=6, kernel_size=5, activation='sigmoid',
                               padding='same'),
        tf.keras.layers.AvgPool2D(pool_size=2, strides=2),
        tf.keras.layers.Conv2D(filters=16, kernel_size=5,
                               activation='sigmoid'),
        tf.keras.layers.AvgPool2D(pool_size=2, strides=2),
        tf.keras.layers.Flatten(),
        tf.keras.layers.Dense(120, activation='sigmoid'),
        tf.keras.layers.Dense(84, activation='sigmoid'),
        tf.keras.layers.Dense(10)])

可以查看每一层的尺寸：

X = tf.random.uniform((1, 28, 28, 1))
for layer in net().layers:
    X = layer(X)
    print(layer.__class__.__name__, 'output shape: \t', X.shape)

输出：
在这里插入图片描述
2. 设置损失函数、优化器等

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size=batch_size)

# 有SGD优化函数了，就不用复制那个updataer了
num_epochs, lr, batch_size = 10, 0.5, 256
# 损失函数
loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
# 载入数据
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
# 优化器
trainer = tf.keras.optimizers.SGD(learning_rate=lr)

定义acc函数和训练函数

# acc和训练函数
# 分类精度 统计正确的数量 精度：accuracy(y_hat, y) / len(y)
def accuracy(y_hat, y):
  if len(y_hat.shape) > 1 and y_hat.shape[1] > 1:
    y_hat = tf.argmax(y_hat, axis=1)
  cmp = tf.cast(y_hat, y.dtype) == y
  return float(tf.reduce_sum(tf.cast(cmp, y.dtype)))

def evaluate_accuracy(net, data_iter): 
  metric = Accumulator(2)  # 正确预测数、预测总数
  for X, y in data_iter:
    metric.add(accuracy(net(X), y), d2l.size(y))
  return metric[0] / metric[1]

class Accumulator:
  def __init__(self, n):
    self.data = [0.0] * n

  def add(self, *args):
    self.data = [a + float(b) for a, b in zip(self.data, args)]

  def reset(self):
    self.data = [0.0] * len(self.data)

  def __getitem__(self, idx):
    return self.data[idx]

# 训练
# updater是更新模型参数的常用函数
def train_epoch_ch3(net, train_iter, loss, updater):
  # 训练损失总和、训练准确度总和、样本数, 累积求和
  metric = Accumulator(3)
  for X,y in train_iter:
    # 计算梯度并更新参数
    with tf.GradientTape() as tape:
      y_hat = net(X)
      # Keras内置的损失接受的是（标签，预测），这不同于用户在本书中的实现。
      # 本书的实现接受（预测，标签），例如我们上面实现的“交叉熵”
      if isinstance(loss, tf.keras.losses.Loss):
        l = loss(y, y_hat)
      else:
        l = loss(y_hat, y)
    if isinstance(updater, tf.keras.optimizers.Optimizer):
      params = net.trainable_variables
      grads = tape.gradient(l, params)
      updater.apply_gradients(zip(grads, params))
    else:
      updater(X.shape[0], tape.gradient(l, updater.params))
    # Keras的loss默认返回一个批量的平均损失
    l_sum = l * float(tf.size(y)) if isinstance(
      loss, tf.keras.losses.Loss) else tf.reduce_sum(l)
    metric.add(l_sum, accuracy(y_hat, y), tf.size(y))
    # 返回训练损失和训练精度
  return metric[0] / metric[2], metric[1] / metric[2]


def train_ch3(net, train_iter, test_iter, loss, num_epochs, updater):
  # """训练模型（定义见第3章）"""
  for epoch in range(num_epochs):
    train_metrics = train_epoch_ch3(net, train_iter, loss, updater)
    test_acc = evaluate_accuracy(net, test_iter)
    train_loss, train_acc = train_metrics
    print("Epoch %s/%s："%(epoch,num_epochs)+" train_loss: "+str(train_loss) + " train_acc: "+str(train_acc) + " test_acc: "+str(test_acc))

训练

# 训练
net = net()
train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

训练的时候比之前耗时久，如果不用GPU训练的话。因为网络浅，也可以用cpu训练，不费时
在这里插入图片描述 5. 测试：

def predict_ch3(net, test_iter):
    # """预测标签（定义见第3章）"""
    # batch_size=256, 所以X和y的大小是256
    for X, y in test_iter:
        break
    # 得到真实标签
    trues = d2l.get_fashion_mnist_labels(y)
    # 得到预测标签
    preds = d2l.get_fashion_mnist_labels(tf.argmax(net(X), axis=1))
    # 输出前15个的预测结果
    print(trues[0:15])
    print(preds[0:15])
   

predict_ch3(net, test_iter)

在这里插入图片描述效果好像还没有之前的单层模型好呢，可能是训练的次数太少了

X1996_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
7. LeNet

LeNet网络有两层卷积层，两层池化层，三层全连接层构成，搭建模型直接堆叠就好了搭建网络import tensorflow as tffrom d2l import tensorflow as d2ldef net(): return tf.keras.models.Sequential([ tf.keras.layers.Conv2D(filters=6, kernel_size=5, activation='sigmoid',
复制链接

扫一扫