Ground truth annotations for UCSD dataset
文件包括
vidd vidf两个场景
以vidd为例
原视频为30fps,尺寸740*480,转为10fps,238*158.
选取其中4000帧,每200帧的标记表示成一个文件。
$ucsepeds\gt\vidd
vidd1_33_000_frame_full.mat
每帧包含的所有信息
fgt.frame中的200个文件表示每一帧中的人的
Loc (x,y,frame)
Id 每个人的标记
Ldir瞬时速度(dx,dy,frame)
Tdir 方向
vidd1_33_000_count_4K_roi
以帧为目标
存储每一帧在6个运动模式((左快,左慢,右快,右慢),所有运动,未运动)上的人数计数数据(count)。
vidd1_33_001_people_full
以人为目标
loc (x,y,frame)
id 行人标签
num_pets id出现的帧数
Ldir瞬时速度(dx,dy,frame)
Tdir 方向