GroundingDINO 项目推荐

GroundingDINO 项目推荐

GroundingDINO 论文 'Grounding DINO: 将DINO与基于地面的预训练结合用于开放式目标检测' 的官方实现。 GroundingDINO 项目地址: https://gitcode.com/gh_mirrors/gr/GroundingDINO

1. 项目基础介绍和主要编程语言

GroundingDINO 是由 IDEA-Research 团队开发的一个开源项目,旨在通过将 DINO 与 Grounded Pre-Training 结合,实现开放集对象检测(Open-Set Object Detection)。该项目的主要编程语言是 Python,并且使用了 CudaC++ 进行高性能计算和底层优化。

2. 项目核心功能

GroundingDINO 的核心功能包括:

  • 开放集对象检测:能够在没有特定类别限制的情况下检测图像中的对象。
  • 语言引导的检测:通过文本描述来引导对象检测,使得模型能够识别和定位特定的对象。
  • 高性能:在 COCO 数据集上表现出色,零样本检测达到了 52.5 AP,微调后达到了 63.0 AP。
  • 灵活性:支持与 Stable Diffusion 和 GLIGEN 等模型结合,进行图像编辑和控制。

3. 项目最近更新的功能

最近,GroundingDINO 项目更新了以下功能:

  • Semantic-SAM 发布:2023年7月18日,发布了 Semantic-SAM,这是一个通用的图像分割模型,能够以任何所需的粒度分割和识别任何对象。
  • COCO 零样本性能评估示例:2023年6月17日,提供了评估 GroundingDINO 在 COCO 数据集上零样本性能的示例。
  • 与 GLIGEN 和 Stable Diffusion 结合的演示:2023年4月8日,发布了与 GLIGEN 和 Stable Diffusion 结合的演示,用于更可控的图像编辑。
  • Grounded-Segment-Anything 演示:2023年4月6日,发布了 Grounded-Segment-Anything 演示,结合了 GroundingDINO 和 Segment-Anything,支持在 GroundingDINO 中进行分割。
  • CPU 模式支持:2023年3月27日,增加了对 CPU 模式的支持,使得模型可以在没有 GPU 的机器上运行。

通过这些更新,GroundingDINO 不仅在性能上有所提升,还扩展了其应用场景,为用户提供了更多的灵活性和便利性。

GroundingDINO 论文 'Grounding DINO: 将DINO与基于地面的预训练结合用于开放式目标检测' 的官方实现。 GroundingDINO 项目地址: https://gitcode.com/gh_mirrors/gr/GroundingDINO

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

尹毓淞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值