用OpenDataLab下载PASCAL VOC 2007等公开数据集

原创已于 2023-12-29 16:28:23 修改 · 1.2k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #数据集下载

于 2023-12-29 16:27:26 首次发布

基础学习专栏收录该内容

19 篇文章

订阅专栏

OpenDataLab提供丰富多样的数据集资源，包括PascalVOC2007，集成了搜索、可视化和下载功能，帮助企业/机构快速找到并训练AI模型。通过SDK或直接下载，享受无广告、跨语言的优质体验。

OpenDataLab

OpenDataLab 公开数据集平台，集海量优质的多模态数据集资源、数据集智能检索、数据可视化展示、数据在线预览、下载优化、标准化管理等功能于一体，力争将平台打造成企业、高校、科研机构等的AI 模型训练的必备利器，帮大家解决数据集烦恼。

官网

OpenDataLab解决方案

收录了海量最新、热门、经典的数据集，涵盖30+应用场景、20+的标注类型；
平台提供了极简的数据集搜索路径，只需2步：打开网址，输入关键字，即可查询；
支持中英双语版本切换，全程无广告，无需登录、无需VPN，极佳的使用体验。

Pascal VOC 2007数据集介绍

这个挑战的目标是从现实场景中的许多视觉对象类别中识别对象（即不是预先分割的对象）。它基本上是一个监督学习问题，因为它提供了一组标记图像的训练集。已选择的 20 个对象类别是：人：人动物：鸟、猫、牛、狗、马、羊交通工具：飞机、自行车、船、公共汽车、汽车、摩托车、火车室内：瓶子、椅子、餐桌、盆栽、沙发、电视/显示器将有两个主要比赛和两个较小规模的“品酒师”比赛。内容：提供的训练数据由一组图像组成；每个图像都有一个注释文件，为图像中存在的 20 个类别之一中的每个对象提供一个边界框和对象类别标签。请注意，来自多个类的多个对象可能出现在同一图像中。

在这里插入图片描述

类定义

aeroplane
bicycle
bird
boat
bottle
bus
car
cat
chair
cow
diningtable
dog
horse
motorbike
person
pottedplant
sheep
sofa
train
tvmonitor

方法一：用SDK下载数据

步骤1：安装openxlab

pip install openxlab

步骤2：登陆openxlab账号

openxlab login

获取密钥管理，复制Access Key ID，输入后，再次复制Secret Access Key。

在这里插入图片描述
dataset_repo为你要下载的数据路径，target_path为下载文件指定的本地路径

from openxlab.dataset import get
get(dataset_repo='OpenDataLab/PASCAL_VOC2007', target_path='PascalVOC2007/images')

下载完成！

可能会遇到遇到问题：

403: {“code”:403,“msg”:{“en”:“To better provide you with data services, please go to the PC version of this dataset detail page and click “Download” to fill out the user information collection form.”,“zh”:“To better provide you with data services, please go to the PC version of this dataset detail page and click “Download” to fill out the user information collection form.”}}

多尝试几次就好了。