目标跟踪领域的数据集(Lasot,Got10k,TrackingNet, ImageNet-VID(ILSVRC 2015-VID))有多大

目标跟踪领域的数据集(Lasot,Got10k,TrackingNet, ImageNet-VID(ILSVRC 2015-VID))有多大

1. Lasot

在这里插入图片描述
Lasot address link
一共70个压缩包,也就是70类,每一类包含20个序列。共227GB。

压缩包中是啥呢?
以airplane为例,它是这样的:
在这里插入图片描述
再往里是这样的:
在这里插入图片描述
在这里插入图片描述
再往里img中是这样的:
在这里插入图片描述
groundtruth.txt是这样的:
在这里插入图片描述

2. Got10k

Got10k link address

可以看到Full data一个是66GB.
在这里插入图片描述
文件结构是这样的:

在这里插入图片描述

3. TrackingNet

TrackingNet google云盘

在这里插入图片描述
共有13个压缩包,Train每个基本上都80GB以上,一个Test也有33G,一共是1061GB。
这个我没下载,太大了。

4. ImageNet-VID(ILSVRC 2015-VID)

数据主页
数据下载地址

我下载下来是92.1GB(ubunt系统下显示大小)。
官网上是86GB:
在这里插入图片描述
文件夹构成是这样的:
在这里插入图片描述
文件夹结构图:

ILSVRC2015
├── Annotations
│   └── VID
│       ├── train
│       │   ├── ILSVRC2015_VID_train_0000
│       │   ├── ILSVRC2015_VID_train_0001
│       │   ├── ILSVRC2015_VID_train_0002
│       │   └── ILSVRC2015_VID_train_0003
│       └── val
│           ├── ILSVRC2015_val_00000000
│           ├── ILSVRC2015_val_00000001
│           ├── ILSVRC2015_val_00000002
│           ├── ILSVRC2015_val_00000003
│           ├── ILSVRC2015_val_00000004
│  		 ├── ...
│           ├── ILSVRC2015_val_00177000
│           └── ILSVRC2015_val_00177001
├── cache.json
├── Data
│   └── VID
│       ├── snippets
│       │   ├── test
│       │   ├── train
│       │   └── val
│       ├── test
│       │   ├── ILSVRC2015_test_00000000
│       │   ├── ILSVRC2015_test_00001000
│       │   ├── ...
│       │   ├── ILSVRC2015_test_00291000
│       │   └── ILSVRC2015_test_00291001
│       ├── train
│       │   ├── ILSVRC2015_VID_train_0000
│       │   ├── ILSVRC2015_VID_train_0001
│       │   ├── ILSVRC2015_VID_train_0002
│       │   └── ILSVRC2015_VID_train_0003
│       └── val
│           ├── ILSVRC2015_val_00000000
│           ├── ILSVRC2015_val_00000001
│           ├── ...
│           ├── ILSVRC2015_val_00177000
│           └── ILSVRC2015_val_00177001
├── ImageSets
│   └── VID
│       ├── test.txt
│       ├── train_10.txt
│       ├── train_11.txt
│       ├── train_12.txt
│       ├── train_13.txt
│       ├── train_14.txt
│       ├── train_15.txt
│       ├── train_16.txt
│       ├── train_17.txt
│       ├── train_18.txt
│       ├── train_19.txt
│       ├── train_1.txt
│       ├── train_20.txt
│       ├── train_21.txt
│       ├── train_22.txt
│       ├── train_23.txt
│       ├── train_24.txt
│       ├── train_25.txt
│       ├── train_26.txt
│       ├── train_27.txt
│       ├── train_28.txt
│       ├── train_29.txt
│       ├── train_2.txt
│       ├── train_30.txt
│       ├── train_3.txt
│       ├── train_4.txt
│       ├── train_5.txt
│       ├── train_6.txt
│       ├── train_7.txt
│       ├── train_8.txt
│       ├── train_9.txt
│       └── val.txt
└── Record
    ├── VID_2015_train.tfrecord
    └── VID_2015_val.tfrecord

具体数据集介绍可以参考这个博客.

LaSOT数据集转换为LMDB格式的步骤如下: 1. 首先,需要下载并解压缩LaSOT数据集。您可以从以下链接下载数据集:http://vision.cs.stonybrook.edu/~lasot/download.php 2. 然后,您需要安装LMDB库。您可以从以下链接下载并安装LMDB库:https://github.com/LMDB/lmdb 3. 接下来,您需要使用脚本将LaSOT数据集转换为LMDB格式。以下是一个示例脚本: ``` import lmdb import os import cv2 import numpy as np def prepare_lmdb_data(data_dir, lmdb_file): env = lmdb.Environment(lmdb_file, map_size=int(1e12)) txn = env.begin(write=True) for root, dirs, files in os.walk(data_dir): for file in files: if file.endswith(".jpg"): video_name = os.path.basename(root) frame_name = os.path.splitext(file)[0] img_path = os.path.join(root, file) img = cv2.imread(img_path) img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # 将图像转换为LMDB格式 datum = caffe.proto.caffe_pb2.Datum() datum.channels = 3 datum.height = img.shape[0] datum.width = img.shape[1] datum.data = img.tobytes() datum.label = -1 key = (video_name + "/" + frame_name).encode("ascii") txn.put(key, datum.SerializeToString()) txn.commit() env.close() if __name__ == "__main__": data_dir = "/path/to/LaSOT/dataset" lmdb_file = "/path/to/LaSOT/lmdb" prepare_lmdb_data(data_dir, lmdb_file) ``` 4. 运行脚本,将LaSOT数据集转换为LMDB格式。请注意,此过程需要一些时间和计算资源,具体取决于数据集大小和您的计算机性能。 5. 转换完成后,您可以使用LMDB库读取和处理数据集。以下是一个示例代码片段: ``` import lmdb import caffe env = lmdb.open('/path/to/LaSOT/lmdb', readonly=True) with env.begin() as txn: cursor = txn.cursor() for key, value in cursor: datum = caffe.proto.caffe_pb2.Datum() datum.ParseFromString(value) img = np.fromstring(datum.data, dtype=np.uint8).reshape(datum.channels, datum.height, datum.width) img = img.transpose((1, 2, 0)) # 转换为RGB格式 label = datum.label # 处理图像和标签 env.close() ``` 希望这可以帮助您将LaSOT数据集转换为LMDB格式。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值