MXNet源码解读：数据读取高级类（2）— mxnet.image.ImageIter

最新推荐文章于 2021-01-08 11:40:40 发布

AI之路

最新推荐文章于 2021-01-08 11:40:40 发布

阅读量3.3k

点赞数 2

分类专栏：深度学习 MXNet

本文链接：https://blog.csdn.net/u014380165/article/details/79735471

版权

本文深入解析MXNet的ImageIter接口，它是基于Python实现的图像数据迭代器，支持.rec和图像+lst文件格式。相较于C++实现的ImageRecordIter，其速度较慢，但具有更好的可读性。我们将探讨源码，重点关注初始化和next方法，帮助理解如何在模型训练中使用此接口。

摘要由CSDN通过智能技术生成

mxnet.image.ImageIter接口同样继承自MXNet框架下的基础数据迭代器构造类mxnet.io.DataIter，该接口是python代码实现的图像数据迭代器，且既可读取.rec文件，也可以以图像+.lst方式来读取数据，这是和mxnet.io.ImageRecordIter接口不同的地方。由于mxnet.image.ImageIter接口在以原图像+.lst文件形式读取数据时是基于python代码实现的，因此在速度上会比基于C++代码实现的mxnet.io.ImageRecordIter接口效率低，尤其是当数据是存储在机械硬盘上时。当然python实现版本可读性还是比较强的，接下来就介绍下该接口的源码，基本上代码都在github的~mxnet/python/mxnet/image/image.py脚本中。因此该博客是介绍该接口的源码，而关于如何使用该接口读取数据并应用在实际模型训练中可以参考另一篇博客：MXNet如何用mxnet.image.ImageIter直接导入图像

mxnet.image.ImageIter类源码地址

源码如下。由另一篇博客MXNet源码解读：数据读取基础类—mxnet.io.DataIter中关于mxnet.io.DataIter基础类的介绍可以看出主要关注的方法是初始化init和next方法。其他方法一般是这两个方法的辅助方法。

class ImageIter(io.DataIter):
    """Image data iterator with a large number of augmentation choices.
    This iterator supports reading from both .rec files and raw image files.

    To load input images from .rec files, use `path_imgrec` parameter and to load from raw image
    files, use `path_imglist` and `path_root` parameters.

    To use data partition (for distributed training) or shuffling, specify `path_imgidx` parameter.

    Parameters
    ----------
    batch_size : int
        Number of examples per batch.
    data_shape : tuple
        Data shape in (channels, height, width) format.
        For now, only RGB image with 3 channels is supported.
    label_width : int, optional
        Number of labels per example. The default label width is 1.
    path_imgrec : str
        Path to image record file (.rec).
        Created with tools/im2rec.py or bin/im2rec.
    path_imglist : str
        Path to image list (.lst).
        Created with tools/im2rec.py or with custom script.
        Format: Tab separated record of index, one or more labels and relative_path_from_root.
    imglist: list
        A list of images with the label(s).
        Each item is a list [imagelabel: float or list of float, imgpath].
    path_root : str
        Root folder of image files.
    path_imgidx : str
        Path to image index file. Needed for partition and shuffling when using .rec source.
    shuffle : bool
        Whether to shuffle all images at the start of each iteration or not.
        Can be slow for HDD.
    part_index : int
        Partition index.
    num_parts : int
        Total number of partitions.
    data_name : str
        Data name for provided symbols.
    label_name : str
        Label name for provided symbols.
    kwargs : ...
        More arguments for creating augmenter. See mx.image.CreateAugmenter.
    """

# 数据读取操作是在初始化方法init上进行的。这里主要分两种情况：1、读取的是record文
# 件（后缀是.rec），那么读取数据就通过recordio.MXIndexedRecordIO接口或
# recordio.MXRecordIO接口来读取，取决于你是否提供了.idx文件，而.idx文件是在生
# 成.rec文件时附带生成的。不管是recordio.MXIndexedRecordIO接口还是
# recordio.MXRecordIO接口，都是调用底层的C++代码来读取数据，具体可以参看
# ~mxnet/python/mxnet/recordio.py脚本，因此效率跟和mxnet.io.ImageRecordIter
# 接口没有太大差别。2、读取的是原图像+.lst文件，那么读取数据就通过python的open语
# 句来读取，维护了一个imglist字典来存放读取到的.lst文件内容，其中键是index，值是
# 标签和图像路径组成的tuple。在初始化中还有一步比较重要：            
# if aug_list is None:
#    self.auglist = CreateAugmenter(data_shape, **kwargs)
# else:
#    self.auglist = aug_list
# 这个if语句是关于数据预处理的设置，可以看出如果你要添加一些数据预处理操作，可以在
# mxnet.image.ImageIter接口的aug_list参数处设置，如果不设置的话就采用默认的
# CreateAugmenter(data_shape, **kwargs)函数，而这个默认的函数基本上没进行什么
# 预处理操作。那么aug_list参数要怎么给呢？参考CreateAugmenter函数的返回值可以看
# 出（CreateAugmenter函数的介绍可以参考博客：），aug_list是一个列表，列表中的每
# 个值存放一种数据处理类&#