论文
文章平均质量分 85
卡伊德
我没有超能力,但我能用代码嗨翻你!
展开
-
因果学习篇(2)-Causal Attention for Vision-Language Tasks(文献阅读)
一篇由南洋理工大学和澳大利亚莫纳什大学联合发表自2021年的CVPR顶会上的一篇文献,提出了一种新的注意力机制:因果注意力(CATT),使用因果推断中的“前门准则”解决训练数据中存在的虚假相关性,刨析了注意力机制在推理过程中的因果原理,在提高模型性能的前提下,加强了模型的可解释性,打开了神经网络的黑匣子,具有非常好的参考意义。原创 2024-03-06 17:45:59 · 2346 阅读 · 0 评论 -
视频行为识别(二)——小样本动作识别的分层组合表示
一篇小样本动作识别的论文,提出了一种新的分层合成表示(HCR)学习方法,用于小样本动作识别。原创 2023-07-10 23:16:17 · 602 阅读 · 0 评论 -
视频行为识别(一)——综述
解读2023CVPR上的一篇综述论文,讲述了当前热门的视频人体行为识别方向。原创 2023-07-09 00:25:48 · 1177 阅读 · 0 评论 -
论文阅读--Semantic Grouping Network for Video Captioning
Semantic Grouping Network for Video Captioningabstract提出了Semantic Grouping Network(SGN)网络:用部分已经解码的字幕中,选择可可以区分的单词短语对视频帧进行分组,也就是将表达不同意思的帧分组(与聚类相似);对语义对齐的组进行解码,以预测下一个单词;(根据前面的已经生成的、分好组的词预测下一个)以前:丢弃或者合并重复视频信息SGN:检索最有鉴别能力的单词短语,然后将这些词与视频帧关联 。这样可以让语义差不多的帧原创 2021-12-28 20:22:25 · 1157 阅读 · 0 评论