机器之心发布
来源:百度飞桨
飞桨 (PaddlePaddle) 致力于让深度学习技术的创新与应用更简单。7 月初,随着 Paddle Fluid 1.5 版本的发布,国内业界首个视频识别与定位工具集 PaddleVideo 也迎来了重磅更新。
PaddleVideo 在实际工业界可以形成很多具体应用,包括:视频精彩片段预测、关键镜头定位、视频剪辑等任务,例如定位 NBA 篮球赛视频中扣篮镜头,电视剧中的武打镜头等。如下图所示:
![4d8ab9ae21b0e54d8b1f5ce142c19d0b.png](https://i-blog.csdnimg.cn/blog_migrate/ebaa7350d9e965d9e62108b12586b796.jpeg)
本文末尾,为广大算法和开发同学准备了 PaddleVideo 模型实战的应用案例,视频剪辑、素材拼接和标题生成工作完全是程序模型自动完成的,极大地减轻了人力剪辑的工作量,效果也还不错。不过,在看具体模型具体应用之前,让我们可以先来了解一下 PaddleVideo。
1.PaddleVideo 是什么?
PaddleVideo 是飞桨在计算机视觉领域为用户提供的模型库 PaddleCV 中的视频识别与定位部分的模型库。PaddleVideo 的全部模型都是开源的,用户可以一键式快速配置模型完成训练和评测。
PaddleVideo 目前视频分类和动作定位模型包括:
![887c553a8d7a608d8cf5b2a7d0f61264.png](https://i-blog.csdnimg.cn/blog_migrate/029c652b488e9667201d436370f56194.jpeg)
2.重磅更新内容详解
本次重磅更新要点如下:
- 增加动作定位模型 C-TCN,该模型是 2018 年 ActivityNet 夺冠方案。
- 增加已发布的模型骨干网络,Non-local 模型增加 ResNet101 和 l3d 网络结构
- 优化已经发布的分