可以通过数据集(Dataset)的 map
方法,对 Dataset 中的指定列执行变换(Transforms )操作。
图像 Transform
可以在图像数据集上执行 Rescale
缩放变换、Normalize
归一变换、HWC2CHW
变换等。下图是一个图像缩放的效果。
文本 Transform
在 mindspore.dataset.text
模块中,包含对文本的一系列变换操作,如 PythonTokenizer
分词变换、Lookup
词表映射变换。
自定义(Lambda)Transform
自定义一个操作列的函数,以 lambda 的形式传递给 map
的 transform 参数,迭代数据集时将执行自定义函数对列的操作。
Transform 的组合
transforms.Compose
方法接受一个 Transforms 列表参数,返回一个组合成好的 Transforms,方便对复杂操作进行封装。