将一个目标框出来matlab,【学界】中科院发布了目标追踪数据集,1万多条视频,150万个边界框...

中科院发布了一个目标追踪数据集,叫做Got-10k。很大,很精致。

它包含了超过10,000条视频,主角都是在现实世界里移动的物体,分成560多个类别。

物体的边界框全部是手动标记,总计超过150万个。

除此之外,数据集还是个Benchmark,可以用来衡量模型的性能,也已经有排行榜了。

59b97b5866cab35ea23c70bbc808d8f6.gif

官方还提供Python工具包,以便小伙伴们用这个Benchmark来测试自己的AI。

那么,来仔细观察一下数据集,吧。

除了规模大,Got-10k还有许多重要的特质。

7ce2ce49a02e3bb0ecc6b873051aca84.gif

数据集是以WordNet英文词汇数据库作为骨架,搭建起来的。分成5个大类:

动物 (Animal) 、人造物体 (Artifact) 、人物 (Person) 、自然物体 (Natural Object) ,以及Part。

大类之下再细分,一共563个类别。

88a8141abb00929c11ff1db46a722a86.gif

上面讲的是目标类别,只是数据的其中一个标签。

另一个标签是动作类别,一共分为87种。一部分按照WordNet来划分,还有一部分是数据收集者定义的。

为了训练出的模型能有更强的泛化能力,训练集和测试集之间不存在交集。

模型可以用少量的数据去学习分类,这样也能避免测试结果偏向AI熟悉的那些样本类别。

6e5b11b456aad0f50f8cf4f082132cc6.gif

所有方法都用相同的训练数据。依靠这样的协议,来保障所有追踪器之间的公平对比。

除了目标类别、动作类别和标记框之外,还有其他标签。

比如,目标可见比 (针对遮挡或者出画的情况) ,负责监督那些难度比较大的任务。

62ef870ad7f6d6acf9dc014c6c7302f1.gif

测试集包含180段视频,分属于84个目标类别,32个动作类别,用来衡量模型的追踪能力。

现在,完整的GOT-10k数据集已经可以下载了。

7e9c4a62375a20a91ebe3ae8074db762.gif

并且,评估服务器 (Evaluation Server) 准备好为各路模型打分了,排行榜也会实时更新。

温暖的官方为小伙伴们提供了Python工具包,用来运行实验,方便在Benchmark上评估性能。

另外,除了Python工具包,还有MATLAB工具包。

你还不来么?

7c4accf8930c58ecb130770d8ad6b95e.gif

MATLAB工具包:-10k/toolkit-matlab

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值