Grounded video description

最新推荐文章于 2024-01-07 14:26:57 发布

yyyyyyyyXu

最新推荐文章于 2024-01-07 14:26:57 发布

阅读量1.6k

点赞数

分类专栏：阅读笔记

本文链接：https://blog.csdn.net/qq_40711769/article/details/104970490

版权

Grounded video description. CVPR, 2019.
这篇文章的主要贡献在于提出了新的密集事件描述ActivityNet Entities数据集，在Activity Captions的基础上，添加了captions中NP名词短语与视频中的物体的对齐。
由于源数据集中数据量过大，因此采用了稀疏标注的方法，对每个视频切割出segment，在每个segment中标注物体的class和bounding box，并且要求每个segment中该物体仅标注一帧。该文章使用这种方法，有效提高了caption的精度（由于bbx的召回率和准确率都不高，提升性能并不大）。
主要贡献：ActivityNet Entities数据集
解决问题：密集事件描述中实体定位grounded

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注