转载地址:https://bbs.huaweicloud.com/forum/thread-113020-1-1.html
作者:Mr.Yu
在ModelArts上 训练模型时,需要将数据从OBS上上传到cache中使用,数据集过大时耗时很长。
可以将数据打包,传输,然后在cache路径下os命令解压,并用于后续访问。
针对modelzoo中的train.py可以在之前添加如下几行:
1 2 3 4 5 6 7 8 9 10 |
|
data_url 设置你自己OBS桶中的数据压缩包的位置。
local_data_url 设置训练时运行环境中的数据存储cache路径。
os.system("unzip image_data.zip") 利用系统unzip命令解压你的训练数据压缩包。
imread读取使用你的训练图片。
训练集过大时,可以减少数据传输耗费的时间。