【MindData】如何将自有数据高效的生成MindRecord格式数据集，并且防止爆内存。

昇思MindSpore

已于 2022-10-10 09:41:35 修改

阅读量725

点赞数

分类专栏：技术博客文章标签：深度学习算法

于 2022-10-10 09:41:28 首次发布

本文链接：https://blog.csdn.net/Kenji_Shinji/article/details/127238688

版权

413 篇文章

订阅专栏

用户可以将自有数据转换成MindRecord数据集，然后使用MindDataset类进行加载并进一步进行预处理操作。

参考代码见附件

数据集太大，FileWriter.commit()的时候爆内存该怎么解决
答：可以组织一批数据之后，就调用 .write_raw_data(data_list)接口写入，再组织一批数据，再调用.write_raw_data(data_list2)，...，最后再调用.commit()完成。即：组织数据 -> write_raw_data(...) -> 组织数据 -> write_raw_data(...) -> ... -> commit()，具体参照 Step1 中示例。参考链接：华为云论坛_云计算论坛_开发者论坛_技术论坛-华为云