ModelArts上传训练图片数据集过慢的问题

转载地址:https://bbs.huaweicloud.com/forum/thread-113020-1-1.html

作者:Mr.Yu

在ModelArts上 训练模型时,需要将数据从OBS上上传到cache中使用,数据集过大时耗时很长。
可以将数据打包,传输,然后在cache路径下os命令解压,并用于后续访问。

针对modelzoo中的train.py可以在之前添加如下几行:

1

2

3

4

5

6

7

8

9

10

import os

import moxing as mox

data_url = 'obs://hit-yw/datazip/'

local_data_url = './cache/'

data_name = 'data.zip'

mox.file.copy_parallel(data_url, local_data_url)

zip_command = "unzip -o %s -d %s" % (local_data_url+data_name ,local_data_url)

os.system(zip_command)

img=cv.imread(local_data_url+'train.jpg')

data_url 设置你自己OBS桶中的数据压缩包的位置。
local_data_url 设置训练时运行环境中的数据存储cache路径。
os.system("unzip image_data.zip") 利用系统unzip命令解压你的训练数据压缩包。
imread读取使用你的训练图片。

训练集过大时,可以减少数据传输耗费的时间。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值