![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
文章平均质量分 87
锋年
这个作者很懒,什么都没留下…
展开
-
Stacked Hybrid-Attention and Group Collaborative Learning for Unbiased Scene Graph Generation
直观地说,由于单个分类器难以实现合理的预测权衡,可以将有偏见的谓词类划分为几个平衡的子集,然后引入更多的分类器来克服每个子集,并最终利用这些分类器来合作解决这一挑战。由此提出GCL(Group Collaborative Learning)策略。首先是divide:由于单个分类器足以区分平衡数据集中的类,我们首先根据训练实例的数量将所有谓词划分为一组相对平衡的组。...原创 2022-08-18 14:37:48 · 1240 阅读 · 0 评论 -
VOLO: Vision Outlooker for Visual Recognition 阅读笔记
为了利用精细级别的标记表示,在第一阶段,调整补丁嵌入模块,使图像在大小为8×8而不是16×16的小图像补丁上进行标记。精细级别的信息可以通过更细粒度的图像标记化编码为标记,但这会导致更大长度的标记序列,从而二次增加ViT的自注意力机制的复杂性。outlookattention采用滑动窗口机制对令牌表示进行局部编码,并在一定程度上保留了视觉任务的关键位置信息;方法提出的原因1)每个空间位置的特征具有足够的代表性,可以生成注意力权重,用于局部聚合其相邻特征;.........原创 2022-07-31 19:23:46 · 747 阅读 · 0 评论