阅读 TALL: Temporal Activity Localization via Language Query

最新推荐文章于 2021-08-13 17:36:46 发布

eglxiang

最新推荐文章于 2021-08-13 17:36:46 发布

阅读量544

点赞数

分类专栏： CVPR2018

本文链接：https://blog.csdn.net/eglxiang/article/details/83241280

版权

CVPR2018 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

misalign to be penalized in the loss

regression for temporal stamps of event that corresponds to a sentence description.

I think this task can still be categorized into event detection/retrieval.

There's an embedding learning from videos by using 3D CNN and pooling.

There's an embedding learning from text by using word2vec or the ***graph technique.

The fusion is done FC layers with loss designed as mentioned above - try to align text with the event.

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

eglxiang

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Flinksql bug : Temporal table join requires an equality condition on fields of table

Direction_Wind的博客

12-05

1013

不支持已经是int的类型再次cast(int类型字段 as int) 与 cast(string类型字段 as int) 做关联必须 string类型字段 = cast(int类型字段 as string) 这么做。如果关联条件都是字符串，内容是数字，两测都强制类型转换，cast（feild as bigint）会报错。很奇怪做了强制类型转换反而报错了。关联条件必须等值关联也就是必须是等号，并且关联条件两边要确定数据类型相同。

TimesNet：Temporal 2D-variation modeling for general time series analysis 论文要点

weixin_48018951的博客

03-10

1062

时间序列分析在天气预报、异常检测、动作识别等领域有着广泛的应用。时间变化建模是大量分析任务中常见的关键问题。以前的方法试图直接从1D时间序列中完成这一点，由于复杂的时间模式，这是极具挑战性的。通过对时间序列多周期性的观察，我们将复杂的时间变化分解为多个周期内变化和周期间变化。为了解决一维时间序列在表示能力上的局限性，我们将一维时间序列转换为一组基于多个周期的二维张量，从而将时间变化分析扩展到二维空间。这种变换可以将周期内变化和周期间变化分别嵌入到二维张量的列和行中，使得二维变化可以很容易地用二维核来建模。

参与评论您还未登录，请先登录后发表或查看评论

ICMR 19：Temporal Activity Localization by Language

黄鑫的博客

06-04

1667

介绍一下我之前在校，独立完成的一项工作，已被ACM ICMR 2019 接收为oral paper 论文：《Cross-Modal Video Moment Retrieval with Spatial and Language-Temporal Attention》代码：https://github.com/BonnieHuangxin/SLTA 一、论文任务 Examples: ...

TALL: Temporal Activity Localization via Language Query

Hello World

04-27

1538

这是ICCV2017 Spotlight的一篇关于temporal activity localization via language query in an untrimmed video的文章，paper连接https://arxiv.org/abs/1705.02101，作者的homepage https://jiyanggao.github.io/，code已经被released出来了h...

基于WiFi信号应用的相关文献整理以及相关国内外团队介绍

丫头的博客

07-24

6534

Awesome-Cross-Modal-Video-Moment-Retrieval

05-18

Awesome-Cross-Modal-Video-Moment-Retrieval 持续更新该方向的重要论文，并做一句话简评。 Temporally Language Grounding，text-to-clip retrieval，query-based moment retrieval等等都是本领域的工作。旨在使用一段文本检索视频中的对应片段/时刻。部分文章涉及多个“创新点”，暂时只整理了最突出的贡献，完整论述请对应原文。有 :hollow_red_circle: 的论文是个人认为比较突出的必看论文。部分重要论文已经整理在博客中： 2017:2 1[ICCV 2017] [CTRL] TALL Temporal Activity Localization via Language Query:hollow_red_circle: 2[ICCV 2017] [MCN] Localizing Moments in Video with Natural

ICCV 2017 paper

qq_34848537的博客

10-08

5277

参考链接 ICCV 2017 open access Paperlist Globally-Optimal Inlier Set Maximisation for Simultaneous Camera Pose and Feature Correspondence Robust Pseudo Random Fields for Light-Field Stereo Matching A L...

DiffTAD: Temporal Action Detection with Proposal Denoising Diffu

10-26

DiffTAD: Temporal Action Detection with Proposal Denoising Diffu

完全监督时序动作定位Fully Supervised Temporal Action Localization 论文阅读

NEUXia的博客

08-13

2761

Learning to Refactor Actionand Co-occurrence Features for Temporal Action Localization Bottom-Up Temporal Action Localization with Mutual Regularization Class Semantics-based Attention for Action Detection

wifi 人体定位Multi-Person Localization via RF Body Reflections

11-20

wifi 人体定位Multi-Person Localization via RF Body Reflections

视频理解新方向：时域语言定位综述

我爱计算机视觉

06-06

1700

点击我爱计算机视觉标星，更快获取CVML新技术本文原载于知乎，作者吴捷，目前于中山大学就读研究生。研究领域为计算机视觉与自然语言处理。作者不仅综述了时域语言定位（Temporally L...

Reflections 详细介绍

热门推荐

GoodIdea

05-30

2万+

Reflections 详细介绍Reflections 通过扫描 classpath，索引元数据，允许在运行时查询这些元数据，也可以保存收集项目中多个模块的元数据信息。使用 Reflections 可以查询以下元数据信息： 1）获得某个类型的所有子类型2）获得标记了某个注解的所有类型／成员变量，支持注解参数匹配。3）使用正则表达式获得所有匹配的资源文件4）获得所有特定签名（包括参数，参数注解，返回...

关于定位、指纹匹配的相关工作总结和调研

丫头的博客

11-09

3066

无线室内定位大概分为两类： 1）基于指纹匹配的室内定位 2）基于模型的室内定位（These schemes calculate locations based on geometrical models rather than search for best-fit signatures from pre-labeled reference database. These approaches...

Video Moment Retrieval 数据集整理

AAliuxiaolei的博客

08-13

2932

几个常用的数据集 CharadesSTA CharadesSTA是在Charades上进行了时间标注。数据集论文： TALL: Temporal Activity Localization via Language Query https://arxiv.org/pdf/1705.02101.pdf 数据集特征地址：https://prior.allenai.org/projects/charades 数据集标注地址：https://github.com/jiyanggao/TALL 视频样例

Reflections scans your classpath, indexes the m...

weixin_33969116的博客

06-17

为什么80%的码农都做不了架构师？>>> ...

Cross-modal Video Moment Retrieval（跨模态视频时刻检索综述）

nakaizura

07-13

1万+

这个方向的出的文章已经有很多了，但是似乎还没有一个统一一点的名字，叫时域语言定位（Temporally Language Grounding），或者跨模态视频时刻检索/定位（Cross-modal Video Moment Retrieval/Localization）等等都有。大概给一个定义就是：给定一句自然语言描述的查询语句query，在未剪裁的完整视频中确定该描述发生的时间片段（起始时间，终止时间），简单来讲如上图，就是用一段文字查询具体的视频片段。它与纯的动作定位任务不同之处在于多了跨模态（文.

Finding Tiny Faces in the Wild With Generative Adversarial Network 感想

eglxiang的博客

08-09

1361

你看今年cvpr的这篇文章，提供了一种写文章的思路：基本上算是拿GAN在face super resolution上应用，自然要在低分辨率的tiny face上做。这种工作意义大不大还真不好说，但是做的performance好了发cvpr还是没问题的，因为它看起来很新：做人脸检测太多，但做tiny人脸检测要少很多，而且性能还没有饱和。但如果是拿faster rcnn一类做tiny人脸检测，估计这样...

阅读 CVPR 2018 papers on detecting facial action units

eglxiang的博客

08-17

1176

List 1. Learning Facial Action Units From Web Images With Scalable Weakly Supervised Clustering 2. Weakly Supervised Facial Action Unit Recognition Through Adversarial Training 3. Optimizing ...

PPFNet: Global Context Aware Local Features for Robust 3D Point Matching 阅读

eglxiang的博客

08-13

1115

It's based on PointNet but the important thing is the N-tuple loss, which is a many-to-many loss. The basic idea is still the reproject error sum. So the authors call them point pair features (PPF). T...

weakly supervised temporal action localization via representative snippet kn