深度学习 | Pytorch官方文档学习记录

从官方文档开始入手

更新:2022 / 1 / 13



提示:以下是本篇文章正文内容,下面案例可供参考


PYTORCH RECIPES

LOADING DATA IN PYTORCH

Introduction

PyTorch 数据加载实用程序的核心是torch.utils.data.DataLoader类。它表示在数据集上的可迭代的 Python
PyTorch 中的库提供内置的高质量数据集供您在torch.utils.data.Dataset中使用。这些数据集目前可用于:

  • torchvision
  • torchaudio
  • torchtext

还有更多。

通过使用来自 torchaudio.datasets.YESNOYesno 数据集,我们将演示如何有效且高效地将数据从 PyTorch Dataset 加载到 PyTorch DataLoader


Setup

在开始之前,我们需要安装 torchaudio 才能访问数据集。
pip install torchaudio

要在 Google Colab 中运行,请取消注释以下行:
!pip install torchaudio

Steps

  1. 导入所有必要的库以加载我们的数据

对于这个recipe,我们将使用torchtorchaudio。根据您使用的内置数据集,您还可以安装和导入torchvisiontorchtext

  1. 访问数据集中的数据

torchaudio中的Yesno数据集包含 60 条关于一个人用希伯来语说是或否的录音;每个录音有八个字长。
torchaudio.datasets.YESNO为 YesNo 创建一个数据集。

torchaudio.datasets.YESNO(
     root,
     url='http://www.openslr.org/resources/1/waves_yesno.tar.gz',
     folder_in_archive='waves_yesno',
     download=False,
     transform=None,
     target_transform=None)

数据集中的每一项都是以下形式的元组:(waveform, sample_rate, labels),其中labels是一个整数列表,1表示是,0表示否。

您必须为 Yesno数据集设置root,这是训练和测试数据集所在的位置。

download: 如果为 true,则从 Internet 下载数据集并将其放在根目录中。如果数据集已经下载,则不会再次下载。

transform:对数据使用转换可以让你从源状态中获取数据,并将其转换为连接在一起、去规范化并准备好进行训练的数据。PyTorch 中的每个库都支持不断增长的转换列表。

target_transform:一个函数/变换,它接受目标并对其进行变换。

在实践中使用这些数据时,最好将数据配置为“training”数据集和“testing”数据集。这可确保您拥有样本外数据(out-of-sample data)来测试模型的性能。

  1. 加载数据

现在我们可以访问数据集,我们必须通过torch.utils.data.DataLoader传递它。 DataLoader将数据集和采样器组合在一起,返回数据集的可迭代对象。

  1. 遍历数据
  2. [可选] 可视化数据

参考链接

写本文时参考以下链接:

攻略

新手如何入门pytorch? - 灰灰的回答 - 知乎

#todo: 带你少走弯路:强烈推荐的Pytorch快速入门资料和翻译(可下载)
#todo: 深度学习入门之 PyTorch

官方文档

WELCOME TO PYTORCH TUTORIALS
PyTorch中文文档

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值