图解Pytorch DataLoader源码分析

最新推荐文章于 2023-01-30 14:31:34 发布

Jiyang@UESTC

最新推荐文章于 2023-01-30 14:31:34 发布

阅读量319

点赞数

分类专栏： Pytorch 文章标签： pytorch

本文链接：https://blog.csdn.net/qq_36429555/article/details/118596911

版权

Pytorch 专栏收录该内容

5 篇文章 5 订阅

订阅专栏

动机

在实验时，碰到了需要自定义Sampler的情况。因此，出于使自己放心的动机，对DataLoader的源码进行了分析，了解了DataLoader的内部运行机制，明白了其是如何通过Sampler来操作DataSet中的数据的，这下可以放心的写Sampler了！

源码分析

源码流程图

在这里插入图片描述

源码解析 Sampler

所有的采样器都继承自Sampler这个类

需重写三种方法

class MySampler(Sampler):
    r"""Base class for all Samplers.
    Every Sampler subclass has to provide an __iter__ method, providing a way
    to iterate over indices of dataset elements, and a __len__ method that
    returns the length of the returned iterators.
    """
    def __init__(self, data_source):
        pass
	
    // 通过该方法获取迭代器对象，可return返回一个迭代器，可yield得到一个生成器
    def __iter__(self):  
        raise NotImplementedError

    def __len__(self): // 返回数据的个数
        raise NotImplementedError

参考Blog

https://www.cnblogs.com/marsggbo/p/11541054.html
https://www.cnblogs.com/marsggbo/p/11308889.html

Jiyang@UESTC

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
图解Pytorch DataLoader源码分析

动机在实验时，碰到了需要自定义Sampler的情况。因此，出于使自己放心的动机，对DataLoader的源码进行了分析，了解了DataLoader的内部运行机制，明白了其是如何通过Sampler来操作DataSet中的数据的，这下可以放心的写Sampler了！相关概念可迭代对象可迭代对象是使用内置函数 iter() 可以获取迭代器的对象，即要么对象实现了能返回迭代器的 __init__() 方法要么对象实现了 __getitem__()方法，而且其参数是从零开始的索引内置的 it
复制链接

扫一扫