作者:商汤 X-Lab 组
编译:CV君
今天,来自商汤科技的 X-Lab 组开源了用于视频理解的代码库X-Temporal,提供了一众 State-of-the-art 的视频分类模型。
该库基于 PyTorch 深度学习框架。
开源地址:
https://github.com/Sense-X/X-Temporal
实现的模型来自论文:
1.Temporal Segment Networks
https://arxiv.org/abs/1608.00859
2. Temporal Interlacing Network
https://arxiv.org/abs/2001.06499
3. Temporal Shift Module
https://arxiv.org/abs/1811.08383
4. ResNet 3D
https://arxiv.org/pdf/1711.11248
5. SlowFast Networks for Video Recognition
https://arxiv.org/abs/1812.03982
6. Non-local Neural Networks
https://arxiv.org/abs/1711.07971
目前该库支持的视频理解框架:
SLowFast
R(2+1)D
R3D
TSN
TIN
TSM
支持各类数据集:
Kinetics, Something2Something, Multi-Moments in Time...
支持视频作为输入;
支持视频RGB帧作为输入;
支持视频帧间光流作为输入;
支持多标签数据集;
官方称该库具有高性能和模块化设计的特点,可以方便研究人员快速验证idea,训练和测试代码均已开源。
另外,开发团队曾凭借该库赢得 ICCV19 - Multi Moments in Time 挑战赛冠军!
END
备注:视频理解
视频分类视频理解交流群
视频相关技术,分类、理解、视频摘要等技术,若已为CV君其他账号好友请直接私信。
我爱计算机视觉
微信号:aicvml
QQ群:805388940
微博知乎:@我爱计算机视觉
投稿:amos@52cv.net
网站:www.52cv.net
在看,让更多人看到