Pytorch中使用SubsetRandomSampler做数据集划分

最新推荐文章于 2024-02-22 12:25:21 发布

RAGERAGE_

最新推荐文章于 2024-02-22 12:25:21 发布

阅读量196

点赞数

文章标签： pytorch

原文链接：https://www.jianshu.com/p/aa5ea235ee87

版权

import torch
from torch.utils.data import TensorDataset, DataLoader
from torch.utils.data.sampler import SubsetRandomSampler


dataset = TensorDataset(torch.tensor(list(range(20))))  # 构造一个数据集（0到19）
idx = list(range(len(dataset)))  # 创建索引，SubsetRandomSampler会自动乱序
# idx = torch.zeros(len(dataset)).long()  # 传入相同的索引，SubsetRandomSampler只会采样相同结果
n = len(dataset)
split = n//5
train_sampler = SubsetRandomSampler(idx[split::])  # 随机取80%的数据做训练集
test_sampler = SubsetRandomSampler(idx[::split])  # 随机取20%的数据做测试集
train_loader = DataLoader(dataset, sampler=train_sampler)
test_loader = DataLoader(dataset, sampler=test_sampler)

print('data for training:')
for i in train_loader:
    print(i)
print('data for testing:')
for i in test_loader:
    print(i)

PS: sampler 和 shuffle 是互斥的，因为sampler会自动乱序，所以在使用sampler的时候，请将shuffle设置为False

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

RAGERAGE_

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Pytorch中使用SubsetRandomSampler做数据集划分

PS: sampler 和 shuffle 是互斥的，因为sampler会自动乱序，所以在使用sampler的时候，请将shuffle设置为False。
复制链接

扫一扫