PyTorch数据划分

需要在训练集里划出一部分作为验证集,可以使用SubsetRandomSampler(或者其他的sampler),例如:

from torch.utils.data.sampler import SubsetRandomSampler

#训练集样本数
num_training_samples = 48000 
train_sampler = SubsetRandomSampler(torch.arange(0, num_training_samples))

#验证集样本数
num_val_samples = 12000
val_sampler = SubsetRandomSampler(torch.arange(num_training_samples, num_training_samples+num_val_samples))

然后在DataLoader接口中如下设置即可,注意shuffle此处必须为False

train_dataloader = torch.utils.data.DataLoader(
    ...
    sampler=train_sampler,
    ...
)

val_dataloader = torch.utils.data.DataLoader(
    ...
    sampler=val_sampler,
    ...
)

或者,也可以这也划分:

train_db, val_db = torch.utils.data.random_split(data, [48000, 12000])

train_dataloader = t.utils.data.DataLoader(
     train_db,
     ...
     )

# val_dataloader = t.utils.data.DataLoader(
     val_db
     ...
      )
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值