精读AI论文系列
文章平均质量分 88
将持续输出
咯吱咯吱咕嘟咕嘟
兵来将挡水来土掩
展开
-
论文阅读CVPR2022 《Language As Queries for Referring Video Object Segmentation》
自从读完DETR之后,一直对set prediction相关的工作比较感兴趣。所以又找了一篇关于transformer的query机制的工作,不过这次升级到video处理的更复杂的任务了(其实也没有多么复杂)原创 2022-09-02 17:42:33 · 1726 阅读 · 0 评论 -
论文阅读CVPR Maskformer和Mask2former
目前研究多将语义分割算法作为一种像素级的分类算法,而将实例分割作为一种mask分类算法论文的重要观点是:mask分类任务能够同时有效解决语义和实例级的分割任务基于上述观念,提出了MaskFormer,一种预测二值mask(每个mask用于预测一个类别)的mask分类模型实验显示,MaskFormer在ADE20K和COCO分割任务上实现state-of-the-art.........原创 2022-08-13 12:18:10 · 3178 阅读 · 1 评论 -
论文阅读 CVPR2022《Rethinking Semantic Segmentation:A Prototype View》
流行的语义分割解决方案,尽管它们有不同的网络设计(基于 FCN 或基于注意力)和掩码解码策略(基于参数 softmax 或基于像素查询),但可以通过将 softmax 权重或查询向量视为可学习类原型来归为一类。鉴于这种原型观点,本研究揭示了这种参数分割方案的几个局限性,并提出了一种基于不可学习原型的非参数替代方案。我们的模型不是以前的方法以完全参数化的方式为每个类学习单个权重/查询向量,而是将每个类表示为一组不可学习的原型,仅依赖于该类中几个训练像素的平均特征。因此,通过检索非参数最近原型来实现密集预测。这原创 2022-08-13 11:25:54 · 2802 阅读 · 6 评论