在进行NMS之前，为什么要对boxes进行类偏移

努力做学霸的学渣

于 2024-05-08 11:34:11 发布

阅读量224

点赞数 1

文章标签：人工智能

本文链接：https://blog.csdn.net/qq_40424333/article/details/138565231

版权

boxes = x[:, :4] + c  # boxes (offset by class)
i = torchvision.ops.nms(boxes, scores, iou_thres)  # NMS

如果不对检测框进行类偏移，在进行 NMS 时可能会导致不同类别之间的检测框发生混淆，从而影响最终的检测结果。通过对检测框进行类偏移，可以确保 NMS 只考虑同一类别的检测框之间的重叠情况，避免不同类别之间的混淆。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

努力做学霸的学渣

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

目标检测的Tricks | 【Trick9】nms非极大值抑制处理（包括变体merge-nms、and-nms、soft-nms、diou-nms等介绍）

Clichong

04-23

6561

如有错误，恳请指出。用这篇博客记录一下nms，也就是非极大值抑制处理，算是目标检测后处理的一个难点。在训练阶段是不需要nms处理的，只有在验证或者是测试阶段才需要将预测结果进行非极大值抑制处理，来挑选最佳的正样本。下面就详细查看一下非极大值抑制处理算法的一个大致流程。文章目录1. NMS主要步骤2. NMS代码实现3. NMS的变体与实现3.1 hard_nms_batch3.2 hard_nms3.3 and-nms3.4 merge-nms3.5 soft-nms3.6 iou-nms3.7 .

基于卷积神经网络(Convolutional Neural Network, CNN) 的一种高级物体检测技术，通过对深度学习、目标检测、Faster-RCNN等相关技术进行研究及实践，实现物体检测

程序员光剑

08-04

1397

物体检测(Object detection) 是计算机视觉领域中一个重要任务，该任务旨在从图像或视频中检测并识别目标对象。相比于图像分类(Image classification)，它可以更精确地定位目标位置，提高检测准确率。目前已有许多物体检测模型被广泛应用，如YOLOv3、SSD等。然而，这些模型仍存在一些局限性，特别是在小目标上的检测能力较差。

1 条评论您还未登录，请先登录后发表或查看评论

【Opencv】cv::dnn::NMSBoxes（）函数详解

热门推荐

cv君的博客

12-20

6万+

文章目录项目结构与使用教程目标检测模式影像分类模式数据采集演示与训练出来的模型演示训练出来的目标检测模型演示训练出来的分类模型演示【固定框检测模式】一键训练YOLOv3 YOLOv4 YOLOv5 方法转换数据训练与检测训练检测核心部分介绍目标检测数据标注分类分类训练部分分类推理部分模型导出部分后续优化优化tips1：使用更多数据增强优化tips2：使用高质量相机采集，或者修改图片size获取更高清图片优化tips3：使用更高质量跟踪算法：比如deepsort ，我已经做了，后续慢慢会开源优化tips4：

NMS(Python实现)

先说一下，就简单地写点儿氵文，不是博客，只是我的笔记本/工具书

08-23

834

目标检测按照多类一起和单个类进行NMS操作

weixin_42064949的博客

04-25

660

agnostic参数 True表示多个类一起计算nms，False表示按照不同的类分别进行计算nms。max_wh这里是4096，这样偏移量仅取决于类IDX，并且足够大。x[:, :4]表示box（从二维看第0，1，2，3列）按照每个类进行nms可能会出现一个目标多个类别框的情况。x[:, 5:6]表示类IDX（从二维看第5列）x[:, 4] 表示分数（从二维看第4列）四.将所有的类别框当做一个类别进行nms。代码重点是在 '+c’这里的c就是偏移量。

c++版的NMS（非极大抑制）实现

ltshan139的专栏

03-14

1万+

NMS(非极大抑制)是深度学习目标检测中常用的小算法，用来过滤掉同一个物体上的那些置信度较低的bbboxes，最后只剩下该目标检测框集中最大置信度的那个。算法原理说它是小算法的原因是其原理很简单。 1）先对输入检测框按置信度由高到低排序 2）挑选第一个检测框(即最高置信度，记为A）和其它检测框（记为B）进行iou计算 3）如果iou大于nmsThreshold，那就将B清...

NMS 和 Soft-NMS简单介绍

09-29

1015

一　NMS NMS算法的大致思想：对于有重叠的候选框：若大于规定阈值（某一提前设定的置信度）则删除，低于阈值的保留。对于无重叠的候选框：都保留。所谓非极大值抑制：先假设有6个输出的矩形框(即proposal_clip_box)，根据分类器类别分类概率做排序，从小到大分别属于车辆的概率(scores)分别为A、B、C、D、E、F。 (1)从最大概率矩形框F开始，分别判断A~E与F的重叠度IOU是否大于某个设定的阈值; (2)假设B、D与F的重叠度超过阈值，那么就扔掉B、D；并标记第一个矩形框F，是我

NMS(非极大值抑制)代码一步步详解

qq_23604781的博客

07-25

2468

NMS(非极大值抑制)代码一步步详解

opencv-python 小白笔记（18）

????爱好者的博客

06-24

1333

第十八节：opencv的dnn模块（四）结语（四）结语学习opencv有很多的方法，我的建议是你可以加一些群，可以充分利用B站，CSDN，和百度。在我的博客中，我不会讲解opencv的算法实现（当然我也不太会），我只会讲解一些函数的调用，不理解就多改一些参数，多尝试尝试，慢慢你就理解来。相信你总有一天可以说opencv不过“Ctrl+C，Crtl+V” PS：如果有什么错误的地方，还请大家批评指正，不过错了也没啥关系，反正也没什么人看最后，希望小伙伴们都能有所收获。码字不易，喜欢的话，关注一波在走吧

NMS（non maximum suppression）非极大值抑制

丑小鸭

10-20

282

目标检测中，NMS被用于后期的物体边界框去除中. NMS 对检测得到的全部 boxes 进行局部的最大搜索，以搜索某邻域范围内的最大值，从而滤出一部分 boxes，提升最终的检测精度. NMS 算法流程：输入：检测到的Boxes(同一个物体可能被检测到很多Boxes，每个box均有分类score) 输出：最优的Box....

cv2.dnn.NMSBoxes 无法运行解决方法

先说一下，就简单地写点儿氵文，不是博客，只是我的笔记本/工具书

04-10

2696

当前 python cv2 版本：4.5.1 今儿碰到一个问题 cv2.dnn.NMSBoxes(boxes, confidences, self.confThreshold, self.nmsThreshold) 当我的boxes的数组，是二维 ndarray 时，我的 spyder 编辑器直接restart kernel 了改成二维数组，就是变成：boxes.tolist() 他就没问题了，openCV这个接口设计第一个参数不用np.ndarray 嘛 cv2.dnn.NMSBoxes(box

目标检测基础（NMS）

Victory_gx的博客

02-15

2530

目标检测基础（NMS）什么是非最大值抑制非最大值抑制是一种主要用于目标检测的技术，旨在从一组重叠框中选择最佳边界框。在下图中，非最大值抑制的目的是删除黄色和蓝色框，这样我们只剩下绿色框作为最终的预测结果。计算NMS的步骤为了了解什么是boundingbox，以及IOU的含义，我在前篇发表了关于IOU的文章。前篇文章中描述的术语将在本文中继续介绍。我们首先描述NMS在这个特定示例中的工作过程，然后解释一个更通用的算法，将其扩展到不同的场景下。 1、术语定义我们将使用的每个边界框的格式如下： b

Region proposal network生成什么

08-05

### 回答1： Region Proposal Network (RPN) 是 Faster R-CNN 的关键组件之一，用于生成候选区域。具体来说，RPN 接收卷积特征图作为输入，并输出一系列候选区域及其对应的置信度得分。这些候选区域被送入后续的网络中进行目标检测任务，比如分类和位置回归。RPN 的输出是一个包含多个候选区域的边界框，其中每个边界框都被赋予一个得分，表示该框中可能包含一个对象的概率。这些候选区域将被用于后续的ROI Pooling操作，将区域内的特征映射成固定长度的向量，供分类器进行分类和回归任务。因此，RPN 的作用是在卷积特征图上生成一些具有潜在包含对象的候选区域，以便后续网络进行目标检测任务。 ### 回答2： Region Proposal Network（RPN）是一种用于目标检测的神经网络模型，主要用于生成候选区域。目标检测是计算机视觉中的重要任务，它的目标是在图像中准确地定位和识别出特定的目标物体。 RPN的主要功能是通过使用锚框（anchor boxes）和卷积神经网络（convolutional neural network，CNN）来生成可能包含目标物体的候选区域。锚框是一些预定义的边界框，它们以不同的尺寸和长宽比分布在图像的不同位置。RPN会在每个锚框的位置上滑动，通过判断锚框内是否包含目标物体来生成候选框。 RPN通过与训练图像进行卷积运算，并在每个锚框的位置上预测两个值：1）锚框里面是否包含物体（前景）；2）锚框里面是否不包含物体（背景）。这些预测值可以通过使用分类器和回归器来实现。分类器主要用于判断锚框是否包含目标物体，回归器则用于调整锚框的位置和大小，以更准确地包围目标。通过这些预测值，RPN能够根据锚框的位置和特征信息，选择最有可能包含目标物体的候选区域。这些候选区域会进一步传递给后续的目标识别网络进行目标分类和精确定位。总之，Region Proposal Network（RPN）生成的是候选区域，这些候选区域是目标检测任务中可能包含目标物体的位置，并为后续的目标分类和定位提供了重要的输入。 ### 回答3： Region proposal network（RPN）是一种深度学习模型，用于生成可能包含对象的区域建议。 RPN是目标检测中的一个关键组件，用于在输入图像中提取可能包含对象的候选区域。RPN通过在图像上滑动一个小窗口（称为滑动窗口）来生成多个候选区域。对于每个滑动窗口，RPN会对其进行特征提取，并将其作为输入传递给两个全连接层。这两个全连接层分别用于预测候选区域是否包含目标对象（二元分类）以及调整候选区域的边界框位置（回归问题）。通过这样的设计，RPN可以同时生成候选区域的分类概率和边界框坐标偏移。 RPN生成的候选区域根据其得分排序，选择具有高置信度的区域作为最终的检测结果。为了提高候选区域的质量，RPN还会应用非极大值抑制（NMS）来去除高度重叠的重复区域。总结而言，Region proposal network生成可能包含目标对象的候选区域，并对其进行分类和位置调整，以提供给后续的目标检测模型进行进一步的处理。这种生成的区域建议是目标检测中重要的一步，能够提高检测的准确性和效率。