开篇废话!
这是我从大学以来,现在都大三了,写的第一篇文章,为什么大三开始写呢,因为自己才开始慢慢的上手,也积累了一点点经验,废话不多说,看硬货。
因为自己参加华为的ICT比赛,然后用的华为的ModelArts云开发平台(类似百度的AI studio)中间遇见了许多的曲折,所以写这篇文章帮大家避坑
在ModelArts 从0开始部署自己的模型(一)—用自己的数据集训练数据
1、上传自己的数据集
1、1 创建华为云的桶
(1)在华为云打开OBS对象存储服务,点击创建桶(类似创建个云储存空间)
(2)选择区域(这个很重要!!!)
因为后续创建数据集,是需要桶和数据集在一个区域中,不然数据传不上去用不了,我人在成都,然后选西南地区,创好之后发现数据集那边没有西南地区的选项,哭了
(3)桶的名称和数据冗余存储策略
这里看下面的提示选择合适自己的就好
1、2上传自己的数据集
打开桶,点对象里的上传对象,就可以上传自己的数据集了(一般最好压缩文件)
在记住旁边这个路径后续有用哦
2、创建Notebook
(1)在ModelArts的开发环境选择创建Notebook
(2)然后选择自己的开发环境
3、在Notebook里面下载自己桶里的数据集
(1)检查桶是否创建成功或数据是否上传成功
import moxing as mox
mox.file.exists('obs://liekai/data_input/data.zip')
‘’‘
这个是查询是否数据集创建成功的,里面参数就是 obs:// 然后就是桶里面的路径地址
成功返回Ture
’‘’
(2)从桶里面下载数据到work目录下
from modelarts.session import Session
session = Session()
session.obs.download_file(src_obs_file="obs://liekai/data_input/data.zip",
dst_local_dir="/home/ma-user/work/")
’‘’
第一个参数就是数据集的具体位置,第二个就是你解压的目录,解压在work才会持久化的保存,不然你下次还得下载解压一遍
‘’‘
(3)解压数据集到当前目录
!unzip data.zip