Sampler类与4种采样方式

Wanderer001

已于 2023-11-02 20:05:02 修改

阅读量4.5k

点赞数 10

分类专栏： Pytorch 文章标签：计算机视觉深度学习机器学习

于 2022-03-15 08:23:14 首次发布

本文链接：https://blog.csdn.net/weixin_36670529/article/details/115249892

版权

本文详细介绍了PyTorch中的Sampler类及其四种采样方式：顺序采样、随机采样、子集随机采样和加权随机采样。针对每种采样器，解释了其工作原理和实现细节，并通过示例展示了不同采样方法的输出结果。采样方式的选择对深度学习模型的训练过程有显著影响。

摘要由CSDN通过智能技术生成

参考 Pytorch的Sampler详解 - 云+社区 - 腾讯云

参考Sampler类与4种采样方式 - 云+社区 - 腾讯云

由于我们不能将大量数据一次性放入网络中进行训练，所以需要分批进行数据读取。这一过程涉及到如何从数据集中读取数据的问题，pytorch提供了Sampler基类【1】与多个子类实现不同方式的数据采样。子类包含：

Sequential Sampler（顺序采样）
Random Sampler（随机采样）
Subset Random Sampler（子集随机采样）
Weighted Random Sampler（加权随机采样）等等。

1、基类Sampler

class Sampler(object):
    r"""Base class for all Samplers.
    """
    def __init__(self, data_source):
        pass
    def __iter__(self):
        raise NotImplementedError

对于所有的采样器来说，都需要继承Sampler类，必须实现的方法为__iter__()，也就是定义迭代器行为，返回可迭代对象。除此之外，Sampler类并没有定义任何其它的方法。

2、顺序采样Sequential Sampler

class SequentialSampler(Sampler):
    r"""Samples elements sequentially, always in the same order.
    Arguments:
        data_source (Dataset): dataset to sample from
    """
    def __init__(self, data_source):
        self.data_source = data_source
    def __iter__(self):
        return iter(range(len(self.data_source)))
    def __len__(self):
        return len(self.data_source)

顺序采样类并没有定义过多的方法，其中初始化方法仅仅需要一个Dataset类对象作为参数。对于__len__()只负责返回数据源包含的数据个数；__iter__(

最低0.47元/天解锁文章

Wanderer001

关注

10
点赞
踩
39

收藏

觉得还不错? 一键收藏
打赏
0
评论
Sampler类与4种采样方式

由于我们不能将大量数据一次性放入网络中进行训练，所以需要分批进行数据读取。这一过程涉及到如何从数据集中读取数据的问题，pytorch提供了Sampler基类【1】与多个子类实现不同方式的数据采样。子类包含：Sequential Sampler（顺序采样） Random Sampler（随机采样） Subset Random Sampler（子集随机采样） Weighted Random Sampler（加权随机采样）等等。1、基类Samplerclass Sampler(object):
复制链接

扫一扫