
【CV | TAL】论文浅读 - -PGCN: Graph Convolutional Networks for Temporal Action Localization
目前大多数最前沿的时序动作定位模型会单独处理每个动作proposals,而不会在学习过程中明确利用不同proposals之间的关系。大多数Two-Stage的TAL模型首先生成一组一维时空proposals,然后对每个proposals单独进行动作分类和动作边界回归,然而,在预测阶段单独处理每个proposals,势必会忽略提议之间的语义关系。



























