YOLOv3中do_nms_sort详解

最新推荐文章于 2024-03-27 05:54:26 发布

Wzw_L_Wx

最新推荐文章于 2024-03-27 05:54:26 发布

阅读量375

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/qq_40703341/article/details/110118736

版权

笔记专栏收录该内容

30 篇文章 2 订阅

订阅专栏

总结起来就是三个过程：

1）去除没有物体的检测结果。

2）按照检测结果类别排序。

3）计算检测结果之间的iou，若大于thresh，则舍去。

参考：
1

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Wzw_L_Wx

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
YOLOv3中do_nms_sort详解

总结起来就是三个过程：1）去除没有物体的检测结果。2）按照检测结果类别排序。3）计算检测结果之间的iou，若大于thresh，则舍去。参考：1
复制链接

扫一扫

专栏目录

yolov5_trt_deepsort

03-30

用户可以通过克隆或下载这个压缩包，然后在本地环境中编译和运行代码，实现在实时视频流上运行YOLOv5目标检测和DeepSort追踪的功能。为了运行此项目，用户需要安装必要的依赖库，如OpenCV用于图像处理，NVIDIA CUDA...

【darknet源码】：训练过程（待补充from笔记darknet源码2）

yuanCruise

08-03

1588

darknet是一个较为轻型的完全基于C与CUDA的开源深度学习框架，其主要特点就是容易安装，没有任何依赖项（OpenCV都可以不用），移植性非常好，支持CPU与GPU两种计算方式。 1、test源码(泛化过程) (1)test image a(预测):load_network（network.c） —> network_predict（network.c） —> f...

参与评论您还未登录，请先登录后发表或查看评论

YOLO，VOC数据集标注格式

weixin_49513223的博客

10-14

5057

YOLO，VOC数据集标注格式

Python实现txt文本文档每行按顺序排列

日常学习记录

02-14

2284

Python实现txt文本文档每行内容按首字母ASCII码值或者拼音排序

YOLO | 用YOLOv7训练自己的数据集（超详细版）

热门推荐

weixin_44649780的博客

02-07

2万+

第一次训练时，在ymal文件中未设置train_list.txt和val_list.txt，可以训练，未提示错误，yaml文件如下，数据是从Rowblow上下载好的格式（不是自己的数据集）。nc: 38names: [#这里省略]个人认为默认指向路径下的图片，具体原因还在研究中。。。yolov7训练时的出来labels指的是什么，为什么每一个epoch的标签数都不同？

数据集txt格式训练yolov5-master

qq_45828295的博客

10-09

3714

自己的txt格式数据集训练yolov5s-master

cpu_nms.py

03-05

重写覆盖原模型中使用的 cpu_nms.pyx, 解决碰到的 ModuleNotFoundError: No module named 'utils.nms.cpu_nms' 报错

deep_sort_pytorch:使用Deepsort和yolov3与pytorch进行MOT跟踪

04-28

将YOLOv3检测器替换为高级检测器。欢迎对此存储库做出任何贡献！介绍这是MOT跟踪算法深度排序的一种实现。深度排序与排序基本相同，但深度CNN模型添加了CNN模型以提取受检测器限制的人体部位图像中的特征。这...

tiny_yolov3权重keras_h5

04-15

一、Tiny YOLOv3详解 Tiny YOLOv3是YOLOv3的简化版，它通过减少网络层数和特征图尺寸来降低计算复杂度，同时保持了较高的检测精度。 Tiny YOLOv3的网络结构主要包括以下部分： 1. 输入层：通常设置为416x416的图像...

Github_YOLOv3_VOC_2007.zip

09-26

这个压缩包"Github_YOLOv3_VOC_2007.zip"包含了YOLOv3模型在PASCAL VOC 2007数据集上的预训练权重文件。 PASCAL VOC（Visual Object Classes）是计算机视觉领域的一个经典数据集，主要用于物体识别和分割任务。2007...

【YOLOV5学习记录，txt文件直接划分比例】

qq_42395188的博客

09-20

1327

YOLOv5

darknet源码剖析（四）do_nms_sort详解

Andy.Wang的博客

02-05

3788

在yolo模型inference执行完成后，会产生很多的冗余结果，此时就需要调用nms对冗余结果进行去重。 nms函数在darknet框架中是do_nms_sort函数，位于box.c文件中，现对do_nms_sort过程做详细分析： for(i = 0; i <= k; ++i){ if(dets[i].objectness == 0){ ...

yolo python_YOLO目标检测快速上手

weixin_39737757的博客

12-09

262

介绍YOLO是基于深度学习端到端的实时目标检测系统，YOLO将目标区域预测和目标类别预测整合于单个神经网络模型中，实现在准确率较高的情况下快速目标检测与识别，更加适合现场应用环境。本案例，我们快速实现一个视频目标检测功能，实现的具体原理我们将在单独的文章中详细介绍。下载编译我们首先下载Darknet开发框架，Darknet开发框架是YOLO大神级作者自己用C语言编写的开发框架，支持GPU加速，有两...

C++ YOLOv3推理第三讲: 模型推理

qq_19859865的博客

01-29

548

如果对于yolov3的模型结构感兴趣，欢迎阅读yolov3论文的原文～上一章讲到模型参数加载，本文主要讨论，如何基于加载的模型实现模型的推理。

darknet | darknet之nms do_nms_sort详解

最新发布

m0_57195758的博客

03-27

560

darknet | darknet之nms do_nms_sort详解

yolo_soft-nms修改

qq_1191265562的博客

12-28

1430

在box.c中 void do_nms_sort(detection *dets, int total, int classes, float thresh) { int i, j, k; k = total-1; for(i = 0; i <= k; ++i){ if(dets[i].objectness == 0){ de...

Yolo 目标检测总结帖（yolov3,yolov2）

uncle_ll的博客

06-27

1万+

由于项目的需求，需要完成一个目标检测的任务，经过个人一段时间的实践，现将自己实现的功能以及体验过的事情在这里做个总结，以便后续查看，也让其它人少走一些弯路，在这个过程中参考了一些博客，便于入门与提升。个人将大多数的时间花费在yolov3上，其精度效果会比yolov2的效果要好，但仿真和测试时间会花费一倍左右的时间，并且将yolov3的过程弄明白之后，yolov2如何跑动只是更改部分参...

使用Vue+layui做弹出层表格

qq_44872313的博客

11-04

2891

第一加载vue和layui 功能快捷键撤销：Ctrl/Command + Z 重做：Ctrl/Command + Y 加粗：Ctrl/Command + B 斜体：Ctrl/Command + I 标题：Ctrl/Command + Shift + H 无序列表：Ctrl/Command + Shift + U 有序列表：Ctrl/Command + Shift + O 检查列表：Ctrl/Co...

手把手教你用深度学习做物体检测(四)：模型使用

程序员一一涤生

09-04

742

上一篇《手把手教你用深度学习做物体检测(三)：模型训练》中介绍了如何使用yolov3训练我们自己的物体检测模型，本篇文章将重点介绍如何使用我们训练好的模型来检测图片或视频中的物体。如果你看过了上一篇文章，那么就知道我们用的是AlexeyAB/darknet项目，该项目虽然提供了物体检测的方法，分别是基于c++和python编写的物体检测代码，但是有几个问题如下： ...

Yolov3中使用的nms函数如何使用

04-28

在 YOLOv3 中，nms 函数用于过滤检测结果中的重叠框，保留置信度最高的框。nms 函数的具体实现可以参考以下代码： ```python def non_max_suppression(prediction, confidence, num_classes, nms_conf=0.4): """ 使用非极大值抑制过滤检测结果中的重叠框 """ # 获取所有检测框的左上角和右下角坐标 box_corner = prediction.new(prediction.shape) box_corner[:, :, 0] = prediction[:, :, 0] - prediction[:, :, 2] / 2 box_corner[:, :, 1] = prediction[:, :, 1] - prediction[:, :, 3] / 2 box_corner[:, :, 2] = prediction[:, :, 0] + prediction[:, :, 2] / 2 box_corner[:, :, 3] = prediction[:, :, 1] + prediction[:, :, 3] / 2 prediction[:, :, :4] = box_corner[:, :, :4] output = [None for _ in range(len(prediction))] # 对每个图片的检测结果进行处理 for image_i, image_pred in enumerate(prediction): # 获取该图片中置信度最高的类别 max_conf, max_conf_idx = torch.max(image_pred[:, 5:5 + num_classes], 1) max_conf = max_conf.float().unsqueeze(1) max_conf_idx = max_conf_idx.float().unsqueeze(1) # 将置信度最高的类别和置信度分数合并到一起 seq = (image_pred[:, :5], max_conf, max_conf_idx) image_pred = torch.cat(seq, 1) # 删除置信度小于阈值的框 non_zero_indices = (torch.nonzero(image_pred[:, 4])) try: image_pred_ = image_pred[non_zero_indices.squeeze(), :].view(-1, 7) except: continue # 获取所有检测框的面积 img_classes = unique(image_pred_[:, -1]) for cls in img_classes: # 获取该类别的检测结果 cls_mask = image_pred_ * (image_pred_[:, -1] == cls).float().unsqueeze(1) class_mask_idx = torch.nonzero(cls_mask[:, -2]).squeeze() image_pred_class = image_pred_[class_mask_idx].view(-1, 7) # 按照置信度排序 conf_sort_index = torch.sort(image_pred_class[:, 4], descending=True)[1] image_pred_class = image_pred_class[conf_sort_index] idx = image_pred_class.size(0) # 检测框的数量 for i in range(idx): # 计算当前检测框与其它检测框的 IoU try: ious = bbox_iou(image_pred_class[i].unsqueeze(0), image_pred_class[i + 1:]) except ValueError: break except IndexError: break # 将 IoU 大于阈值的检测框删除 iou_mask = (ious < nms_conf).float().unsqueeze(1) image_pred_class[i + 1:] *= iou_mask non_zero_indices = torch.nonzero(image_pred_class[:, 4]).squeeze() image_pred_class = image_pred_class[non_zero_indices].view(-1, 7) batch_index = image_pred_class.new(image_pred_class.size(0), 1).fill_(image_i) # 将图片索引加入到检测框中 seq = batch_index, image_pred_class if not output[image_i]: output[image_i] = torch.cat(seq, 1) else: output[image_i] = torch.cat((output[image_i], torch.cat(seq, 1))) return output ``` 其中，bbox_iou 函数用于计算两个框的 IoU 值，unique 函数用于获取一个张量中的所有唯一值。使用时，可以将预测结果和对应的置信度输入到 non_max_suppression 函数中进行处理，如下所示： ```python # 获取预测结果和置信度 prediction = model(x) conf_mask = (prediction[:, :, 4] > confidence_threshold).float().unsqueeze(2) prediction = prediction * conf_mask # 过滤掉重叠的检测框 output = non_max_suppression(prediction, confidence_threshold, num_classes) ```