- 博客(489)
- 资源 (29)
- 收藏
- 关注
原创 ultralytics 中的 RT-DETR 之 模型结构解析
本文详细解析了RT-DETR-ResNet50混合检测模型在ultralytics框架中的实现。首先,文章介绍了ResNet50作为Backbone的逐层结构,包括各模块的参数、输入输出维度及其作用,重点解释了Bottleneck结构的通道扩展机制和下采样实现。随后,文章解析了Head网络的混合注意力架构,包括特征增强、多尺度特征融合、金字塔结构构建和跨层级联解码等阶段,详细说明了每个模块的功能及其对特征图的影响。整体上,该模型通过优化Bottleneck结构和特征融合策略,显著降低了计算量,同时保持了较高
2025-05-14 11:58:14
165
原创 关于ultralytics框架计算出的结果与COCOtools结果不一致问题
博主在实验中对比了ultralytics框架和COCOtools中不同目标检测方法(如YOLO和DETR)的AP(Average Precision)计算结果,发现两者存在显著差异。在ultralytics框架中,YOLO类方法的AP值高于DETR类方法,而在COCOtools中,DETR类方法的AP值则优于YOLO类方法。博主排除了IoU阈值、面积范围和最大检测数等常见因素,认为这些差异可能与计算方式或框架实现细节有关,但具体原因尚不明确,希望与读者进一步探讨。
2025-05-13 09:38:51
98
原创 ultralytics框架计算大中小目标检测精度
先前在跑DETR类目标检测算法时,由于其默认使用的是COCO数据集,所以输出结果中包含不同尺度的检测精度,即大、中、小目标。而现在博主在使用时,发现其并没有这个指标效果,但在先前的实验中,博主发现DETR中计算这些指标使用的是这个工具包,那么我们就可以将检测结果和标注数据采用这个工具进行计算。话不多说,我们开整。
2025-05-12 20:59:31
307
原创 YOLO使用CableInspect-AD数据集实现输电线路缺陷检测
本文介绍了使用CableInspect-AD数据集进行输电线路缺陷检测的流程。首先,将COCO格式的数据转换为YOLO格式,通过Python脚本将json文件转换为txt格式的标签文件,并存储在labels文件夹中。接着,提取数据集中的图像文件到images文件夹,并根据标签文件进行数据集的划分。整个过程包括数据格式转换、图像提取和数据集划分,为后续的模型训练和缺陷检测提供了基础。
2025-05-09 16:06:43
273
原创 ultralytics框架进行RT-DETR目标检测训练
自DETR提出以来,其采用匈牙利匹配方式真正的实现了端到端检测效果,避免了NMS等后处理过程,同时,相较CNN的局部特征提取,其凭借着强大的全局特征提取能力,在目标检测领域可谓大杀四方,基于的目标检测方法因此层出不穷。然后,尽管DETR类目标检测方法具有较好的数据拟合能力,但本身的计算复杂度较高,这使其很难完成实时检测任务,而今天我们则要介绍的便是百度提出的实时DETR目标检测方法,这个方法我已经在先前的博客中有过介绍,当时是基于RT-DETR的源码进行介绍的,今天我们则要介绍的是中的RT-DETR模型。
2025-05-06 17:38:59
516
原创 基于 PyQt 的YOLO目标检测可视化界面+ nuitka 打包
在人工智能和计算机视觉领域,是一种广泛使用的实时目标检测算法。为了直观地展示YOLO算法的检测效果,我们使用Pyqt框架进行检测结果的可视化,同时为了使其能够脱离Python环境,我们将模型文件转换为ONNX格式,并使用nuitka进行打包。
2025-05-04 20:59:10
494
原创 YOLO旋转目标检测之ONNX模型推理
YOLO旋转检测相较于目标检测而言,其只是最后的输出层网络发生了改变,一个最明显的区别便是:目标检测的检测框是xywh,而旋转检测则为xywha,其中,这个a代表angle,即旋转角度,其余的基本相同。
2025-05-02 22:30:42
450
原创 YOLO旋转检测模型简化
尽管从精度角度来看,其检测效果下降了许多(大概30%),但其模型大小也由原本的32MB下降到了700KB,这等程度的模型体积下降幅度还是深得我心的,毕竟我的这个项目场景对精度的要求并没有很高。YOLO模型作为单阶段目标检测方法的代表,其已经应用在多个领域。
2025-04-27 16:48:30
252
原创 YOLO目标检测之模型剪枝
剪枝(Pruning)是一种模型压缩技术,旨在通过移除神经网络中不重要的权重或神经元来减少模型的大小和计算复杂度,同时尽量保持模型的性能。
2025-04-27 11:28:44
582
原创 YOLO检测目标后实现距离测量
相较而言,单目测距依赖与经验值,而深度估计测距则依赖模型性能,综上双目测距的方式无论是在速度方面还是精度方面都能有较好的表现。
2025-04-12 16:45:11
559
1
原创 YOLO系列模型格式转换为 tf-lite 与模型量化
在YOLO中,使用的是YOLO自己的数据格式,因此我们需要将其进行转换,并将其进行训练,这里我就不再赘述了。综上,由于我们需要将这个模型部署在安卓端等算力不足的边缘设备上,所以tf-lite变成了我们的首选。然而,不幸的是,量化后的int8模型精度很差,无法满足我们的需求,我们也就只能选择。格式,这里就来到了我们进入的重点,我们要实现将 .pt 格式的模型文件转换为。框架中,已经帮我们封装好了相关方法,我们只需要配置好环境,就可以了。这里我们需要注意的是,转换代码中,需要我们手动下载安装。
2025-04-10 16:57:41
770
原创 《基于 Cloth Simulation 的机载 LiDAR 滤波方法》集成到点云标注工具做地面标注
而基于 Cloth Simulation 的机载 LiDAR 滤波方法便可以较好的识别地面信息,从而帮助我们节省很多成本。在我们标注点云时,因为地面和植被紧贴在一起,因此我们地面很难进行较为精细的标注(当然很多情况下地面我们都会忽略)至此,完成地面提取。接下来便是进行地面滤波处理完成的后续操作,根据地面类别的颜色进行赋值,完成点云地面标注。原理我们在此不去深究,我们主要看起如何应用到我们的点云标注工具中。实现代码如下,这里我们选用。可以看到,其提取效果不错。
2024-10-24 18:07:05
351
原创 点云标注工具开发记录(五)之点云文件加载、视角转换
在Open3D中,通过read方法,我们可以读取不同格式的点云数据,那么,在不使用Open3D。
2024-10-24 17:00:04
664
原创 点云标注工具开发记录(四)之点云根据类别展示与加速渲染
先前我们使用的是Open3D进行点云加载与展示,但由于Open3D更侧重于点云处理,其缺少一些相关的GUI控件,因此采用PyQt进行开发,同时使用OpenGL进行3D渲染,那么具体要如何实现呢?
2024-10-23 17:59:03
667
原创 点云标注工具开发记录(三)之框选点云与渲染颜色
参照open3d中的交互式点云可视化,我们可以理解其是如何进行框选点云的。可以看到,要想进行点云框选,首先要锁定视角,随后便可以在上面进行选择了。
2024-10-23 14:47:21
511
原创 Open3d开发点云标注工具问题总结(二)
似乎,这样的逻辑并没有什么问题,但将3D点云向2D屏幕投影,他的坐标是固定的,也就是说,每个点云的点在加载后,其往屏幕的投影就是确定的,那么,在我们框选过程中,当点云经过旋转、平移、缩放等操作后,他的投影依旧不会变化,这就导致其根本不能实现框选操作。
2024-10-18 16:25:04
419
原创 使用 Open3D 实现 las 格式点云文件读取
事实上,las文件中不但包含了点云的坐标、颜色等特征,还具有需要其他特征,如类别。格式是一种为激光雷达点云数据的交换和存档而设计的文件格式,是一种被。来实现读取,随后将读取的点云文件进行转换,即提取出。格式被广泛使用并被视为激光雷达数据的行业标准。坐标以及颜色等属性特征,最后进行可视化即可。格式文件读取的接口,但我们可以借用。而在Open3D中,并没有专门用于。首先是取las点坐标时是小写的。指定的开放二进制格式。,如果写成大写,会发现。可以直接读取点云坐标。中并未提供小写选项。
2024-10-15 10:23:47
816
原创 利用Open3D GUI开发一款点云标注工具问题总结(一)
工作需求:利用Open3D开发一款用于点云标注的工具,即按照点云类别赋予不同颜色实现效果如下:通过点击颜色面板的不同颜色可以进行颜色切换,在我们选择两个点后,点击Create Box可以创建一个轴对称框体,从而将该框体内的点云设置为对应颜色,点击Save后则可以保存结果。需求并不复杂,但对于我这个半路出家的门外汉而言,还是有些难度的,这篇博文主要记录一下实现思路与在设计过程中遇到的问题。
2024-10-14 18:01:47
1037
原创 PointNet++训练自定义数据集
我们已经学习了PointNet++的网络结构,以及在S3Dis数据集上的训练、测试以及可视化等操作,那么如何使用该模型来训练我们自己的数据集呢,其实,操作十分简单,只需要修改几个参数即可。
2024-10-09 14:19:49
2083
8
原创 PointNet++网络详解
其中,对于points,16是batch-size,4096是点云数量(我们在前一篇博客中说过,为了使输出的值统一,我们的输入值的数量也要统一,这里设置一个batch中输入的点云数量为4096,9则是其点云维度。组合点云和类别,在先前为方便运算,将场景中的点云进行了切分,每个batch含有4096个,在完成对4096个点的分类后,将其组合起来,即恢复为原来的场景。下面的代码是训练的核心部分,即完成加载数据集,将数据送入模型,计算损失,反向传播等功能,其中我们着重看一下数据在模型中是如何变化的。
2024-10-08 17:22:11
2525
原创 基于深度学习的点云处理模型PointNet++学习记录
根据其论文中给出的介绍,Point++是用于点云分割与分类的深度学习模型,由下图可知,该模型主要分为三部分,分别是点空间特征提取、分割模型以及分类模块。其中,由一系列点集抽象层()组成,而每一个。:Sampling layer的作用是从点云中选择很多个质点和围绕在这些质点的局部区域。作为输入,通过使用FPS算法(,最远点采样法)选出一系列点作为质点,与随机选取相比,这样可以更好的覆盖整个点集空间。
2024-09-30 15:52:11
2858
1
原创 点云与Open3D入门
点云与三维图像的关系深度图(以灰度表达物体与相机的距离),几何模型(由CAD软件建立),点云模型(所有逆向工程设备都将物体采样成点云)。和二维图像相比,三维图像借助第三个维度的信息,可以实现天然的物体——背景解耦。点云数据是最为常见也是最基础的三维模型。点云模型往往由测量直接得到,每个点对应一个测量点,未经过其他处理手段,故包含了最大的信息量。这些信息隐藏在点云中需要以其他提取手段将其萃取出来,提取点云中信息的过程则为三维图像处理。点云是某个坐标系下的点的数据集。
2024-09-24 18:47:39
1304
1
原创 大模型学习记录之Agent部署
首先,需要明确大模型的概念,通过百度的文心一言的结果,我们得到如下概念:大模型(Large Models) 在人工智能和机器学习领域,特别是深度学习领域,指的是那些具有大量参数、复杂结构和高度计算需求的模型。这些模型通常需要在大规模数据集上进行长时间的训练,以捕捉数据中的复杂模式和关系。大模型的出现和发展,主要得益于计算能力的提升、算法的优化以及大规模数据集的可用性。大模型的特点可以概括为以下几个方面:大模型的发展也带来了一些挑战和争议。一方面,大模型需要消耗大量的计算资源和时间成本,这限制了其在实际应用中
2024-09-19 09:11:29
1565
原创 ChatGLM-6B部署到本地电脑
ChatGLM-6B是由清华大学开源的双语对话大模型,该模型有62亿参数,但在经过量化后模型体积大幅下降,因此不同于其他需要部署到服务器上的大模型,该模型可以部署到本地电脑,那么接下来我们来看看如何部署该模型。此时可以先将模型下载到本地,然后从本地加载,当然此时我们需要修改一下对应的地址。随便提一个问题,说起来确实一套一套的,好像谁不知道似的,说点干活嘛。之后,我们将人类语言转化为了机器语言,接下来就可以输入模型了。然后从这里手动下载模型参数文件,并将下载的文件替换到本地的。
2024-09-17 21:58:27
1649
原创 ultralytics实现DeepSort之级联匹配
DeepSort算法引入的特征提取模块,并在匹配时首先使用特征作为匹配指标,因此,这使得DeepSort算法能够在目标遮挡后再次出现时能够重新匹配成功(ReID),当然这也意味着其速度上较不使用特征提取方法的跟踪算法,(如ByteTrack)速度慢了一些。
2024-09-12 18:09:20
4732
原创 ultralytics实现DeepSort目标追踪算法之特征提取网络
我们看下这个网络具体是如何实现的,其实这里我们并不需要了解其具体结构,只需要知道其输入输出即可,根据 x = torch.randn(4,3,128,64)可知,其传入的数据即为图像,即(batch-size,通道数,宽,高)的格式,而根据最后连接的分类头nn.Linear(256, num_classes),可知,其最终输出的结果必与类别数有关。事实上最终的结果为(batch-size,751)即该图像中目标的类别。
2024-09-07 00:07:24
6398
1
原创 ultralytics框架实现ByteTrack目标追踪算法
在框架中,提供了两种用于目标追踪的算法,分别是ByteTrack算法与Botsort算法,这两种算法都是在Sort算法的基础上改进的,今天,我们学习一下ByteTrack算法。
2024-09-04 23:22:10
8128
1
原创 RT-DETR+Sort 实现目标跟踪
等后处理过程,但它依旧需要对结果进行筛选,这里直接通过对置信度进行筛选即可。算法是用来做跟踪的,在这个算法中的追踪器是卡尔曼滤波追踪器。类目标检测算法作为一种端到端的目标检测方法,并不需要。算法实现目标跟踪,在今天这篇博客中,博主将利用。获得的检测结果如下,分别是预测类别,检测框的。算法相结合,从而实现目标跟踪。在前一篇博客中,博主介绍了利用。算法,我们缕清一个思路即可,即。
2024-09-01 13:23:24
6997
原创 YOLO+Sort实现目标追踪
在前面的目标检测、实例分割的学习中,我们多是对单张图像进行处理,而事实上在我们的实际应用中多数需要对视频进行操作,当然这个操作也是讲视频转换为一帧帧的图像,但博主发现在这个算法平台中,针对视频的处理多调用track方法,即跟踪算法,比如在车辆测速、车辆测距等应用中,那么跟踪算法到底是如何实现的呢,这便是我们今天要学习的内容。
2024-08-25 00:19:17
8444
1
原创 CV党福音:YOLOv8实现实例分割(二)之训练过程
在上一篇博客中,我们已经了解了实例分割的基本流程,本章则是对数据集、以及训练过程等进行进一步的学习。在本次训练中,博主使用的是这个小数据集进行实验,该数据集内只有张图像:我们以第一张图像为例,其标签标注如下:按行划分目标,第一个数字为目标类别,后面每两个数值为一个坐标(即标注的关键点的坐标)第一张图像的检测与分割结果如下:与语义分割不同,实例分割一般是首先使用目标检测算法找到图像中的不同实例对象,然后对每个实例对象进行语义分割。在YOLOv8中则是在原本检测头的基础上增加了分割头,两者共同作用。总的来
2024-08-16 13:25:15
1719
原创 CV党福音:YOLOv8实现实例分割(一)之模型结构与预测
前面我们得知YOLOv8不但可以实现目标检测任务,还包揽了分类、分割、姿态估计等计算机视觉任务。在上一篇博文中,博主已经介绍了YOLOv8如何实现分类,在这篇博文里,博主将介绍其如何将语义分割给收入囊中。
2024-08-10 15:25:54
7339
2
原创 CV党福音:YOLOv8实现分类
YOLO作为目标检测领域的常青树,如今以及更新到了YOLOv10,并且还有YOLOXYOLOS等变体,可以说该系列已经在目标检测领域占据了半壁江山,如今,YOLOv8的发行者竟有一统江山之意,其在提出的框架中不但集成了v3到v10的YOLO目标检测模型,还包揽了分类,语义分割、目标追踪和姿态估计等计算机视觉任务。那么,今天我们就来看看YOLOv8是如何将这些计算机视觉任务融合在一起吧其实从思路上很简单,YOLOv8继续沿用了YOLO的基本架构,即将整个模型分为特征提取骨干网络(Backbone。
2024-08-07 21:02:23
2803
原创 YOLOv8由pt文件中读取模型信息
Pytorch的pt模型文件中保存了许多模型信息,如模型结构、模型参数、任务类型、批次、数据集等在先前的YOLOv8实验中,博主发现YOLOv8在预测时并不需要指定任务类型,因为这些信息便保存在pt模型中,那么,今天我们便来看看,其到底是如何加载这些参数的。我们首先对pt。
2024-08-05 12:35:52
3000
原创 YOLOv8目标检测算法改进之融合SCconv的特征提取方法
经过上述过程,我们便将SCconv模块插入到了YOLOv8模型中,当然这个改进是十分简单的,我们可以对SCconv模块再进行改进,让其更加的适配YOLOv8检测模型,同时我们需要记住的是,写一篇论文不但要求你的创新点要新颖,如何去描述你的创新更是重中之重,正所谓做的好不如说的好(博主还是希望能够既做的好,又说得好)。
2024-08-02 15:52:40
3536
3
原创 可视化目标检测算法推理部署(三)YOLOv8模型视频推理
至此,模型的视频推理过程便完成了,但我们在UI界面上却发现,上传的视频是没有画面的,同时,返回的视频虽然成果保存,但其在界面上却显示为NaN其实,对于学习YOLO模型推理的过程而言,这已无伤大雅,但博主还有那么一点完美主义精神的,看看能否解决呢?经过查询相关资料,发现这是由于OpenCV合成视频操作造成的,解决方式是使用moviepy,具体如何做呢?
2024-07-31 10:56:09
1211
原创 可视化目标检测算法推理部署(二)YOLOv8模型图像推理
在先前的RT-DETR中,博主使用ONNX模型文件进行了视频、图像的推理,在本章节,博主打算使用YOLOv8模型进行推理,因此,我们除了需要获取YOLOv8的ONNX模型文件外,还需要进行一些额外的操作,如NMS。
2024-07-30 16:08:42
1332
2
SSM音乐视频网站.zip
2021-08-10
JavaWeb学生选课系统
2021-07-26
SSM校园服务系统.zip
2020-04-28
java电话簿管理系统.zip
2020-02-28
library.zip
2020-02-07
library.zip
2020-02-07
bookstore.zip
2020-02-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人