深度学习中python代码的学习

最新推荐文章于 2024-04-21 12:29:27 发布

吴骄骄骄骄骄骄骄骄～～

最新推荐文章于 2024-04-21 12:29:27 发布

阅读量276

点赞数

文章标签： python 深度学习学习

本文链接：https://blog.csdn.net/m0_67036766/article/details/129930670

版权

zip及列表

Q：解释下面python代码

self.linear_layer = nn.ModuleList([
            nn.Linear(in_features=in_dim, out_features=out_dim)
            for in_dim, out_dim in zip(HP.layer_list[:-1], HP.layer_list[1:])
        ])

A: 这段 Python 代码定义了一个 nn.ModuleList 对象 linear_layer，其中包含多个全连接层 (nn.Linear 对象)。具体来说，这个 nn.ModuleList 对象中的每个元素都是一个 nn.Linear 对象，其输入维度为 in_features，输出维度为 out_features。

这个 nn.ModuleList 对象是通过列表解析式生成的。其中，zip(HP.layer_list[:-1], HP.layer_list[1:]) 表示将 HP.layer_list 中相邻的两个元素打包成一个元组，然后返回一个迭代器。这个迭代器中的每个元素都是一个包含两个元素的元组，分别表示当前层的输入维度和输出维度。

在 nn.Linear(in_features=in_dim, out_features=out_dim) 中，in_dim 和 out_dim 分别取自上面的迭代器中每个元组的两个元素，用来指定当前层的输入维度和输出维度。因此，这个列表解析式的结果就是一个由多个全连接层组成的列表，每个全连接层的输入和输出维度都是由 HP.layer_list 中相邻的元素决定的。

最终，这个 nn.ModuleList 对象将被添加到 PyTorch 模型中，用于对输入数据进行前向传递。在前向传递过程中，模型会将输入数据传递给每个全连接层，经过一系列的线性变换和非线性激活函数的处理，得到最终的输出。

Q: HP.layer_list[:-1], HP.layer_list[1:]表示什么?
A: HP.layer_list[:-1] 表示取 HP.layer_list 列表的第一个元素到倒数第二个元素（不包含最后一个元素） ，而** HP.layer_list[1:] 表示取 HP.layer_list 列表的第二个元素到最后一个元素** 。这两个表达式结合在一起就是将 HP.layer_list 列表中相邻的元素配对（例如 (HP.layer_list[0], HP.layer_list[1])，(HP.layer_list[1], HP.layer_list[2]) 等），以便在后续的列表解析式中使用。由于这两个表达式的结果都是列表切片，因此可以用来遍历列表中相邻的元素。

Q: 上面的zip函数是什么?
A: zip() 是 Python 内置的一个函数，可以将多个可迭代对象中对应的元素打包成一个个元组，然后返回一个迭代器。例如，如果有两个列表 a = [1, 2, 3] 和 b = [4, 5, 6]，那么调用 zip(a, b) 将返回一个迭代器，其中的每个元素都是一个元组，表示 a 和 b 中对应位置的元素。

在上面的代码中，zip(HP.layer_list[:-1], HP.layer_list[1:]) 将 HP.layer_list 列表中相邻的元素配对，每个配对都是一个元组，其中第一个元素表示当前层的输入维度，第二个元素表示输出维度。这些元组的顺序与它们在 HP.layer_list 列表中的顺序相同。for in_dim, out_dim in zip(HP.layer_list[:-1], HP.layer_list[1:]) 表示从这个配对的迭代器中取出每个元组，并将其拆分成输入和输出维度两个变量，分别命名为 in_dim 和 out_dim。

取余操作

Q：解释以下代码：

            if not step % HP.verbose_step:  # evaluate log print
                eval_loss = evaluate(model, dev_loader, criterion)
                logger.add_scalar('Loss/Dev', eval_loss, step)

            if not step % HP.save_step: # model save
                model_path = 'model_%d_%d.pth' % (epoch, step)
                save_checkpoint(model, epoch, opt, os.path.join('model_save', model_path))

A: 这段代码包含了两个部分：

第一个部分使用了一个判断语句，用于判断当前训练的step是否为verbose_step的倍数。如果是，就使用evaluate函数对模型在验证集上的表现进行评估，得到模型在验证集上的损失值，并使用logger记录下来。logger可以将数据记录到Tensorboard或其他可视化工具中，用于模型性能的监控和分析。

第二个部分也是一个判断语句，用于判断当前训练的step是否为save_step的倍数。如果是，就将当前模型的参数保存到文件中，文件名中包含了当前的epoch和step信息，便于后续的模型恢复和使用。保存的位置是’model_save’文件夹下，使用os.path.join函数将文件名和文件夹路径拼接成完整的文件路径。保存的方式可以使用PyTorch提供的torch.save函数，也可以使用其他保存方式。

Q： step % HP.save_step是什么意思

A: step % HP.save_step 是计算当前 step 与 HP.save_step 的余数。其中，step 表示当前的训练步数，HP.save_step 是一个超参数，表示每经过多少个训练步骤需要保存一次模型。

因此，step % HP.save_step 用于判断当前是否需要保存模型。当当前的训练步数能够被 HP.save_step 整除时，即 step % HP.save_step == 0 时，就需要保存一次模型。

总结： 取余的余数为0表示为取余这个数的整数倍，结果为0，使用if not 语句正好可以执行条件判断中的内容。

tensor的等号操作与准确率计算

Q: 两个tensor用==连接表示什么？
A: 当两个 Tensor 对应位置的元素相等时，它们相应位置上的元素返回 True，否则返回 False，连接符号 == 用于比较两个 Tensor 的对应元素是否相等。返回的结果是一个由 True 和 False 组成的 Tensor。

Q: true等于1 false等于0，是这意思嘛？
A: 是的，True会被解释为1，False会被解释为0。在使用sum()方法时，所有的True值会被解释为1，所有的False值会被解释为0，最后将它们相加得到总和。这个特性在计算元素为布尔值的张量中的True的数量非常有用。

Q: 解释下列代码

with torch.no_grad():
    for batch in test_loader:
        x, y = batch
        pred = model(x)
        # print(pred)
        total_cnt += pred.size(0)
        correct_cnt += (torch.argmax(pred, 1) == y).sum()

A: 这段代码使用 PyTorch 进行模型预测并计算预测准确率。其中，torch.no_grad() 是一个上下文管理器，它告诉 PyTorch 不需要计算和记录梯度信息，这可以提高代码运行效率。代码中，test_loader 是测试数据集的 PyTorch 数据加载器，for 循环遍历所有测试数据。x 和 y 是当前测试数据的输入和标签，model(x) 返回模型对输入的预测结果。pred 的形状是 [batch_size, num_classes]，total_cnt 是预测总样本数，correct_cnt 是预测正确的样本数。torch.argmax(pred, 1) 是对 pred 在第二个维度进行取最大值的操作，结果是一个大小为 batch_size 的张量。然后，(torch.argmax(pred, 1) == y).sum() 统计了预测正确的样本数，sum() 是张量求和函数。最终，correct_cnt 就是预测正确的总样本数，通过除以 total_cnt 可以计算出预测准确率。

吴骄骄骄骄骄骄骄骄～～

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习中python代码的学习

而** HP.layer_list[1:] 表示取 HP.layer_list 列表的第二个元素到最后一个元素**。这两个表达式结合在一起就是将 HP.layer_list 列表中相邻的元素配对（例如 (HP.layer_list[0], HP.layer_list[1])，(HP.layer_list[1], HP.layer_list[2]) 等），以便在后续的列表解析式中使用。由于这两个表达式的结果都是列表切片，因此可以用来遍历列表中相邻的元素。
复制链接

扫一扫