![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉
文章平均质量分 90
zhangkexin96
这个作者很懒,什么都没留下…
展开
-
On Calibration of Modern Neural Networks论文笔记
上图里面左面两张图固定宽度的情况下,不同深度的 resnet 以及固定深度的情况下,不同宽度的 resnet 的实验结果。可以看到,增加模型深度/宽度,可以降低模型的错误率,但是模型预测概率与准确率之间的偏差会增大。读这篇文章是因为在实验中发现会有一些错的很离谱的 bad case,模型预测概率还非常高,所以希望看看之前在这方面有什么研究。这篇论文发现一些比较新的模型虽然在性能上有所提升,但是模型预测概率与准确率之间的偏差远远大于最早期的模型,论文里分析了这种现象产生的可能原因,并且罗列了一些缓解方法。原创 2024-05-22 10:51:48 · 260 阅读 · 0 评论 -
Deformable DETR论文笔记
Deformable DETR 提出了 deformable attention module 弥补了经典 attention 模块导致的训练收敛慢以及小物体上检测性能不佳的问题,并且在实验中证明了该模块达到了设计目的。缺陷是 inference 速度有所下降。原创 2024-05-09 18:05:34 · 905 阅读 · 0 评论 -
GLIP论文笔记
经典的目标检测方法在固定的类别上训练模型,当需要处理新的类别时,只能在新类别上收集数据重新训练。CLIP 方法通过引入图像文本对的方式,使模型可以利用文本中的类别信息,从而在没有见过的类别上有一定泛化性,但 CLIP 方法仅能应用于分类任务。本文提出的 GLIP 可以应用到检测任务。先用标注好的数据训练模型,然后用训练好的模型在未标注 bounding box 的数据上执行 grounding 任务生成伪标签,再把伪标签加入训练。采用 multi head attention 融合图像和文本信息。原创 2024-05-06 18:50:48 · 943 阅读 · 0 评论 -
DINO论文笔记
的 crop,teacher model 仅接受 global view 的输入,student model 可以接受 global 和 local view 的输入。训练过程中,student model 的参数用 sgd 更新,teacher model 的参数由 student model 和 teacher model 的参数加权得到,DINO 的方法设计并不复杂,但是用 DINO 预训练得到的 feature map 与图像分割 mask 有很强的联系,这个性质比较有趣。原创 2024-04-29 19:26:29 · 771 阅读 · 0 评论