【数据集】OpenxLab 数据集下载

1. 环境配置

  • 创建 conda 环境:要求 python >= 3.8
    conda create -n openxlab python=3.9
    
  • openxlab 安装
    pip install openxlab -i  https://pypi.mirrors.ustc.edu.cn/simple/
    

2. AK 和 SK 配置

  • 用户中心的【密钥管理】中【添加密钥】
    在这里插入图片描述

2.1 通过 CLI 命令配置

>> openxlab login

OpenXLab Access Key ID : xxxxxxxxxxxxxxxxxxxx
OpenXLab Secret Access Key : xxxxxxxxxxxxxxxxxxx
  • 通过openxlab login命令按照提示输入对应的 Access keySecret key。完成后会在 ~/.openxlab 目录下生成 config.json 文件,格式如下:
    {
        "ak": "xxxxxxxxxxxxxxxxxxxx",
        "sk": "xxxxxxxxxxxxxxxxxxxx"
    }
    

2.2 通过创建 config.json 文件方式配置

  • 直接在 ~/.openxlab 目录下创建对应的 config.json 文件,填入对应的 Access keySecret key,格式如下:
    {
        "ak": "xxxxxxxxxxxxxxxxxxxx",
        "sk": "xxxxxxxxxxxxxxxxxxxx"
    }
    

2.3 AK 和 SK 鉴权

  • 通过 openxlab.login() 函数进行配置 AK / SK 进行鉴权。
    import openxlab
    openxlab.login(ak=<Access Key>, sk=<Secrete Key>)
    

3. 数据集下载

3.1 使用 CIL 下载数据集

#TODO 下载数据集的整个仓库
openxlab dataset get --dataset-repo username/repo-name
                     --target-path /path/to/local/folder
# 示例
openxlab dataset get -r username/repo-name 
                     -t /path/to/local/folder

#TODO 下载数据集文件
openxlab dataset download --dataset-repo username/repo-name
                          --source-path /train/file
                          --target-path /path/to/local/folder

openxlab dataset download -r username/repo-name
                          -s /train/file
                          -t /path/to/local/folder
  • 参数说明:

    参数缩写是否必填参数类型参数说明示例
    dataset-repo-rString数据集仓库的地址,由 username/repo_name 组成username/repo-name
    source-path-sString对应数据集仓库下文件的相对路径-s /train/file
    target-path-tString下载仓库指定的本地路径username/–target-path /path/to/local/folder

3.2 使用 SDK 下载数据集

#TODO 下载数据集的整个仓库
from openxlab.dataset import get
get(dataset_repo='username/repo_name', target_path='/path/to/local/folder')

#TODO 下载数据集文件
from openxlab.dataset import download
download(dataset_repo='username/repo_name', source_path='/train/file', target_path='/path/to/local/folder')
  • 参数说明:

    参数缩写是否必填参数类型参数说明示例
    dataset-repo-rString数据集仓库的地址,由 username/repo_name 组成username/repo-name
    source-path-sString对应数据集仓库下文件的相对路径-s /train/file
    target-path-tString下载仓库指定的本地路径username/–target-path /path/to/local/folder

4. 下载示例

  • 本文以ImageNet-22k下载为例,openxlab 中显示界面如下:
    在这里插入图片描述
  • 使用 SDK 下载:
    from openxlab.dataset import get
    get(dataset_repo='OpenDataLab/ImageNet-21k', target_path='./Datasets/ImageNet-21k') 
    
  • 数据集下载中界面展示:
    在这里插入图片描述耐心等待数据下载完成即可!!!

参考链接: openxlab 文档中心

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值