ILSVRC 2017竞赛的results昨天(2017年7月17日)发布。在两个跟踪类别中,Task 3c(通过提供的训练数据从视频中进行目标检测/跟踪)和Task 3d(通过附加训练数据从视频中进行目标检测/跟踪)中的赢家是这个团队:
邓建康(1)、周玉祥(1)、余宝生(2)、陈哲(2)、扎菲里奥(1)、陶大成(2)、伦敦帝国理工学院(2)悉尼大学
以下是他们的出版物、源代码和演示文稿:
[1] Deep Feature Flow for Video Recognition
朱锡洲,熊玉文,戴继峰,吕远,魏宜晨,IEEE计算机视觉与模式识别会议,2017。在
该代码具有以下先决条件:Python 3.2.0+
微软的MXNet
赛顿
OpenCV(Python绑定)
他们的代码需要至少6GB内存的GPU。在
另一个选项是ROLO。作者是广汉宁,他使用youonlylookonce(YOLO)进行检测,并使用TensorFlow实现LSTMs跟踪。在
先决条件:Python 2.7或3.3+
张量流
神经质的
OpenCV(Python绑定)
他的一些工作视频: