论文阅读
文章平均质量分 93
Donny0v0
这个作者很懒,什么都没留下…
展开
-
【论文阅读】Recognize Anything: A Strong Image Tagging Model
提出了 Recognize Anything Model(RAM),一个强的基础模型用于image tagging,表现出在各种常见类别上的高精度的零样本泛化能力RAM 提出了新的image tagging 范式,利用图像文本对训练,而不是手工标注数据通过自动文本语义解析(automatic text semantic parsing)图像文本对的文本中提取图像的 tags初步模型使用自动标注训练。训练策略使用 image caption 和 image tagging 两个任务真值分别监督。原创 2024-05-08 18:23:00 · 2128 阅读 · 0 评论 -
【论文阅读】Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data
这篇论文提出了一个使用的方案,用于鲁棒的单目深度估计,Depth Anything论文的模型结构没有创新,主要贡献在于1. 探索了简单有效的数据扩展方式(如何有效利用大量的无标签数据2. 从预训练模型继承语义(使用冻结的 DINOv2 进行特征约束论文的方法在各中深度估计数据集上都取得了SOTA原创 2024-04-17 23:06:52 · 2131 阅读 · 0 评论 -
【论文阅读】Pointrend: Image segmentation as rendering
用于高效的、高质量的图像分割像素标记任务面临的过采样和欠采样问题,模拟经典的用于有效渲染的计算机视觉方法,从新的视角去看待图像分割问题(点渲染)论文提出了 PointRend(Point-based Rendering 基于点渲染)的神经网络模块:这个模块基于迭代细分算法(an iterative subdivision algorithm),自适应的选择位置,然后在这些位置上进行基于点的分割预测。这个模块是通用的,能够集成在实例和语义分割任务效果输出更加清晰的边缘。原创 2023-07-20 21:30:14 · 201 阅读 · 0 评论