在进入神经网络训练之前,一般都需要对数据进行处理、清洗,以保证训练效果的高效。mindspore.dataset提供了一些内置加载接口,如使用create_tuple_iterator或create_dict_iterator接口创建数据迭代器。为防止数据分布不均,可使用shuffle,将数据打乱;使用map变换每个数据元素;batch可以分批处理数据;同时还可以自定义数据集。
昇思25天学习打卡营第3天|04数据集 Dataset
最新推荐文章于 2024-07-19 15:16:23 发布