【动手学深度学习】深度学习计算

01加加龙

于 2023-06-06 12:58:27 发布

阅读量60

点赞数

分类专栏：【动手学深度学习】文章标签：深度学习 python 人工智能

本文链接：https://blog.csdn.net/Yogurtboyyy/article/details/130866817

版权

6 篇文章 0 订阅

订阅专栏

文章介绍了自定义块应具备的基本功能，如前向传播和反向传播，以及如何通过Sequential块顺序连接层。块可以包含子块，负责参数初始化和内部处理。同时强调了GPU计算的重要性，数据应保持在同一设备上以避免性能下降。

摘要由CSDN通过智能技术生成

层和块

自定义块必须提供的基本功能包括

将输入数据作为其前向传播函数的参数。
通过前向传播函数来生成输出。请注意，输出的形状可能与输入的形状不同。例如，我们上面模型中的第一个全连接的层接收一个20维的输入，但是返回一个维度为256的输出。
计算其输出关于输入的梯度，可通过其反向传播函数进行访问。通常这是自动发生的。
存储和访问前向传播计算所需的参数。
根据需要初始化模型参数

顺序块

为了构建我们自己的简化的MySequential，我们只需要定义两个关键函数：

总结

GPU

我们可以指定用于存储和计算的设备，例如CPU或GPU。默认情况下，数据在主内存中创建，然后使用CPU进行计算。
深度学习框架要求计算的所有输入数据都在同一设备上，无论是CPU还是GPU。
不经意地移动数据可能会显著降低性能。一个典型的错误如下：计算GPU上每个小批量的损失，并在命令行中将其报告给用户（或将其记录在NumPy ndarray中）时，将触发全局解释器锁，从而使所有GPU阻塞。最好是为GPU内部的日志分配内存，并且只移动较大的日志。

关注

专栏目录