李沐《动手学习深度学习》train_epoch_ch3问题

FibonacciCode

已于 2023-01-17 16:52:14 修改

阅读量1k

点赞数

分类专栏：深度学习算法文章标签：深度学习学习人工智能

于 2023-01-17 16:48:54 首次发布

本文链接：https://blog.csdn.net/yuebowhu/article/details/128713215

版权

深度学习算法专栏收录该内容

18 篇文章 2 订阅

订阅专栏

存疑的一段代码：（../lib/python3.9/site-packages/d2l/torch.py）

    for X, y in train_iter:
        # Compute gradients and update parameters
        y_hat = net(X)
        l = loss(y_hat, y)
        if isinstance(updater, torch.optim.Optimizer):
            # Using PyTorch in-built optimizer & loss criterion
            updater.zero_grad()
            l.mean().backward()
            updater.step()
        else:
            # Using custom built optimizer & loss criterion
            l.sum().backward()
            updater(X.shape[0])
        metric.add(float(l.sum()), accuracy(y_hat, y), y.numel())

在上面的代码中，metric存储每一个batch的loss、accuracy，在一轮（epoch）循环结束后计算平均值，在这个过程中，model参数是在不断变化的，每一批次数据也是不一样的，最后计算平均值作为整个一轮（epoch）的loss、accuracy，这个计算方面没有什么依据。并且从训练的表现上也存在差异。

在“4.1多层感知机的从零开始实现”一节中，训练图如下：