Pytorch的数据采样器

Wanderer001

已于 2023-11-02 20:10:08 修改

阅读量4.5k

点赞数

分类专栏： Pytorch 文章标签：计算机视觉深度学习机器学习

于 2022-05-02 09:45:53 首次发布

本文链接：https://blog.csdn.net/weixin_36670529/article/details/106619944

版权

采样器的返回值是一个索引列表，用于在训练集中查找训练样本，一般总的元素数是数据集的长度。

所有采样器的基类。

每个采样器的子类必须提供一个__iter__()方法，提供一个数据集元素指数上进行迭代的方法，并且__len__()方法返回迭代器的长度。

注意：

在Dataloader中__len__()方法不是严格需要的，但是在任何包含Datalaoder长度的计算中都需要。

顺序的采样元素，通常以相同的顺序。

参数：

data_source (Dataset) – 数据集的来源

随机采样元素。如果不能重复采样，样本来自打乱后的数据集。如果可以重复采样，使用者可以指定需要的样本数num_samples。

参数：

从给定的指数列表中随机采样，不可以重复采样。

参数：

从[0,..,len(weights)-1]中以给定的概率(权重)进行采样元素。

参数：

weights (sequence) – 一个权重序列，不必要不需要加起来是1。
num_samples (int) – 需要采样的样本数。
replacement (bool) – 如果为真的话，样本可以进行重复采样。如果为假，不可以进行重复采样，这意味着当一个样本指数来自某行时，对那行不能再一次进行采样。

Example

>>> list(WeightedRandomSampler([0.1, 0.9, 0.4, 0.7, 3.0, 0.6], 5, replacement=True))
[4, 4, 1, 4, 5]
>>> list(WeightedRandomSam

关注