自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

い天然呆的博客

深度学习、图像处理、模式识别

  • 博客(101)
  • 收藏
  • 关注

原创 使用ultralytics库微调 YOLO World 保持 Zero-Shot 能力

在训练 YOLO World 模型时,如果希望在特定数据集(如火灾数据集)上进行微调,同时保留模型的 Zero-Shot 能力,可以参考以下几点方法。Zero-Shot 能力指的是模型在未见过的类别上仍具备一定的推理能力,但在特定数据集上的微调有时会导致模型过度专注于新任务,从而丧失这种能力。

2024-09-20 15:50:44 261

原创 鼠标点击来动态确定 HSV 范围

根据鼠标点击来动态确定 HSV 范围,可以先获取用户点击的像素值,然后使用这个值生成合适的 HSV 范围。这样,我们可以提取图像中的特定颜色(比如蓝色框)

2024-09-10 09:04:29 304

原创 yolo训练策略--使用 Python 和 OpenCV 进行图像亮度增强与批量文件复制之(图像增强是按梯度变化优化)

这个函数 augment_and_copy_files 的目的是处理和增强图像,并将处理后的图像及其相关的注释和标签文件复制到指定的输出文件夹中。具体来说,它对图像进行亮度调整,并生成多个增强版本,同时可选择处理和复制对应的注释和标签文件。

2024-08-31 17:26:33 544

原创 yolo训练策略--使用 Python 和 OpenCV 进行图像亮度增强与批量文件复制

在计算机视觉和深度学习项目中,数据增强是一种常用的技术,通过对原始图像进行多种变换,可以增加数据集的多样性,从而提高模型的泛化能力。本文将介绍如何使用 Python 和 OpenCV 实现图像的亮度增强,并将增强后的图像与对应的注释文件批量复制到新目录中。

2024-08-31 15:29:34 721

原创 使用Python查找并移动两个文件夹中不重名的文件

在日常工作中,有时我们需要比较两个文件夹中的文件,找出那些只存在于其中一个文件夹中的文件,并将这些文件移动到一个新的文件夹中。本文将介绍如何使用Python脚本来实现这一任务,并详细讲解代码的实现过程。

2024-08-31 11:21:52 199

原创 使用 OpenCV 组合和缩放多张图像

在图像处理领域,我们经常需要将多张小图像组合成一张大图。例如,将多张图像按一定布局排列在一起,或者创建一个缩略图画廊。在这篇博客中,我将向你展示如何使用 Python 的 OpenCV 库来完成这一任务。

2024-08-27 15:47:40 657

原创 在 Ubuntu 22.04 中将 Pycharm.desktop 文件标记为可信的步骤

在 Ubuntu 22.04 中,当你创建或下载了一个 .desktop 文件(例如用来启动 PyCharm 的 Pycharm.desktop 文件)时,系统可能会弹出一个对话框提示“Untrusted Desktop File”(不可信的桌面文件),并阻止你启动该文件。虽然提示中建议右键点击文件并选择“Allow Launching”(允许启动),但有时右键菜单中并不会显示这一选项。针对这种情况,可以按照以下步骤解决问题。

2024-08-23 11:01:44 329

原创 浏览器可以进github,但是终端不行的解决办法

改为原来的只读状态,保证后面这个文件不会被随意修改。修改配置文件,添加ip地址代理。

2024-08-22 17:33:15 213

原创 linux下的finalshell的版本升级(2024.8.13)

由于老版本的软件无法使用remove卸载,只能通过以下方式清除。

2024-08-21 16:20:42 85

原创 yolo系列pt模型,无缝实现文件夹内图片批量单脚本推理以及保存

yolo系列pt模型,无缝实现文件夹内图片批量单脚本推理以及保存

2024-08-12 17:45:26 137

原创 rknn yolo系列之量化前预处理,解决量化精度低以及出现类似未作nms的很多框子的问题

rknn官方代码在处理onnx量化到rknn模型时并未提供脚本进行图像缩放,如果直接简单的将图片路径写入txt文件,然后进行量化输出的话就会导致输出的rknn模型文件推理精度低,或者没有精度的情况。

2024-08-07 15:11:58 363

原创 针对 NVIDIA Jetson 和 Rockchip 平台分析系统的内核版本来提取相关硬件和平台信息

通过分析系统的内核版本来提取相关硬件和平台信息,特别是针对 NVIDIA Jetson 和 Rockchip 平台。

2024-08-05 16:47:04 166

原创 关于香橙派系统烧录,1.1.8或者1.1.10两个版本都无法启动Orangepi5

git log 默认会显示较新的提交记录。这会以简洁的方式显示所有分支的提交记录,并以图形化的方式展示提交历史。

2024-07-30 16:53:14 356

原创 高效地整理和迁移数据集图片和注释

自动查找‘images’和‘annotations’两个目录下的文件确定名称相匹配的图像和注释文件把它们移动到新的目录结构中。

2024-06-05 11:52:32 327

原创 使用 FiftyOne 导出 VOC 数据集的完整指南

在机器学习和计算机视觉项目中,处理和准备数据集是一个既重要又经常耗时的步骤。FiftyOne 是一个非常强大的开源工具,它提供了一个丰富的API和用户界面,可以帮助您有效地探索、可视化、修改和导出您的数据集。在本文中,我们将重点讲解如何使用FiftyOne将数据集导出为 VOC (Visual Object Classes) 格式,这是一个在计算机视觉任务中广泛使用的数据集格式。首先,如果您还没有安装 FiftyOne,请打开终端或命令提示符,运行以下命令来安装:设置和导出 VOC 数据集定义数据集参数

2024-06-05 11:05:10 292

原创 自动化迁移和更新物体检测XML数据集

在本文中,我们将介绍一个简单的Python脚本,该脚本自动化了迁移和更新标注过的XML数据集的过程。和任何自动化处理一样,使用这个脚本时,你应该先在少量文件上测试来确保它按预期执行,以避免意外的数据丢失或损坏。这些模块包括操作XML文件的ElementTree,进行文件操作的os和shutil,还有处理图片的cv2等。完整脚本可以在本文附带的代码段中找到。在脚本的开始部分,我们首先导入必要的模块,并定义源目录和目标目录的路径。脚本中定义了两个重要的函数来处理XML文件的创建和物体标记的添加。

2024-06-05 10:24:01 602

原创 清除Ubuntu系统中的无法启动的Ubuntu 24实例

通过以上步骤,你应该已经成功地从系统中移除了无法启动的Ubuntu 24,并且更新了GRUB配置以反映这些更改。删除分区: 在确定了Ubuntu 24安装在哪个分区后,你可以使用GParted来删除这个分区。请确保选中了正确的分区,因为此操作是不可逆的。(4)更新GRUB配置: 在删除了无法启动的Ubuntu 24的分区之后,你可能需要更新GRUB引导加载程序以确保它不再尝试引导已删除的系统。(2)启动到工作的操作系统实例: 首先,你需要启动到另一个工作的Ubuntu实例或任何其他可用的操作系统。

2024-06-04 22:20:37 458 1

原创 yolov8推理由avi改为mp4

修改\ultralytics-main\ultralytics\engine\predictor.py,即可。

2024-05-25 23:02:39 455

原创 jetson nano sd card b01镜像备份

【代码】jetson nano sd card b01镜像备份。

2024-05-20 11:24:34 379

原创 关于yolov8-class Pose(Detect)

这里 y 是一个多维数组(在这种情况下很可能是一个二维数组,代表批量的关键点预测),: 表示选择所有行,2::3 的意思是从索引 2 开始,每隔 3 个元素选取一个。(1)执行的是对关键点解码过程中的一个特定步骤,特别针对预测关键点的第三个维度(如果存在)进行 sigmoid 激活函数的操作。(3)y[:, :, :2] 是网络对于每个锚点位置的偏移预测,通过乘以 2.0 将这个预测偏移放缩至预期的大小范围(因为网络输出通常是限制在 [0, 1] 之间的),使得这个偏移能够表示出更远的距离。

2024-04-24 17:09:52 360

原创 NVIDIA TensorRT的上下文中打印模型的结构

这两个函数是用C++语言编写的,并且用于NVIDIA TensorRT的上下文中。TensorRT是一个用于高性能深度学习推断的库。这两个函数都是关于打印网络层和张量的维度信息的调试辅助函数,它们可以帮助开发者理解模型的结构。

2024-04-23 11:21:52 286

原创 使用官方代码打印yolov8 PyTorch模型结构

在进行深度学习模型的开发时,一个清晰的模型结构有助于理解网络是如何从输入数据中提取特征,并执行分类或回归任务的。对于如YOLOv8这样的复杂模型来说,理解每个层的作用和相互间的连结尤为重要。

2024-04-23 10:42:42 762

原创 关于YOLO模型架构中的strides

在Ultralytics YOLO模型架构中,m.stride是一个非常关键的属性,用于描述网络在不同尺度(scale)上的空间压缩程度。解释m.stride的原理之前,我们首先要了解深度学习中卷积神经网络(CNN)的基本工作原理。

2024-04-22 16:52:43 703

原创 利用Python进行图像和XML标注数据的批量处理

在机器学习项目中,特别是涉及到图像识别和分类的领域,经常需要对大量数据进行预处理。这些数据预处理可能包括图像转换、格式化标签、数据集划分等。本文将介绍一个基于Python的脚本,该脚本能够自动化这些常见任务,并且还支持多进程处理以加速这些操作。

2024-04-12 10:40:46 650

原创 关于yolov8x-p2.yaml

细化的yolov8x-p2.yaml,以及网络输出。

2024-04-09 14:24:23 716 1

原创 关于yolov8x6.yaml的一些理解

这意味着对于每个位置(像素)在这个特征图上,模型需要预测80个类的得分加上额外的一个边界框坐标regression,每个坐标包含4个值(通常是中心x,中心y,宽度和高度),这里有16个这样的边界框。(17)第28层:Concat模块,与经过卷积的27和第11层连接,27层(768x10x10) + 第11层(Layer conv11: type=Conv, out_channels=1024, size=10x10)= 2560x10x10。(4)第15层:upsample,第14层作为输入。

2024-03-30 17:30:19 990

原创 关于tensorrt里面的wts校验

显而易见 name: model.0.conv.weight dtype: 1 dim: [16, 3, 3, 3],它的内积就是Weight name: model.0.conv.weight, Count: 432, Type: FLOAT。

2024-03-11 13:40:08 394

原创 关于tensorrtx里面的convBnSiLU以及相关应用解析

(2)std::map<std::string, nvinfer1::Weights> weightMap:这是一个映射,以字符串键(通常是层的名称)存储一个权重结构(nvinfer1::Weights),包括权重数据和数据类型等。由于这是卷积层 conv0,假设该层设置的输出通道数是16,那么完整的输出特征图的维度就是 [16, 112, 112]。(7)int p:表示卷积层的填充(padding),用来在输入数据的边缘上添加额外的层,以保持尺寸或只进行边缘的减少。

2024-03-11 11:44:50 913

原创 关于opecv的gpu版本的源码编译安装

这样,系统中不会残留无用的包,整个系统更为干净。因为在cmake时,选择了自动生成OpenCV的pkgconfig文件,在/usr/local/lib/pkgconfig路径可以看到文件。-j8表示使用多个系统内核进行编译,从而提高编译速度,不清楚自己系统内核数的,可以使用make -j$(nproc)如果编译时报错,可以尝试不使用多个内核编译,虽然需要更长的编译时间,但是可以避免一些奇怪的报错。是一个新建的空文件,直接添加路径,同理这个路径是cmake编译时填的动态库安装路径加上/lib。

2024-03-09 08:50:48 383

原创 关于yolov8的DFL模块(pytorch以及tensorrt)

11、return self.conv(x.view(b, 4, self.c1, a).transpose(2, 1).softmax(1)).view(b, 4, a):这是前向传播的关键操作。x.view(b, 4, self.c1, a) 的意思是将 x 的形状由 (b, c, a) 改变为 (b, 4, self.c1, a)。6、self.conv.weight.data[:] = nn.Parameter(x.view(1, c1, 1, 1)):初始化卷积层的权重。

2024-03-07 10:45:17 4164

原创 关于yolov8的output0

关于yolov8的output0。

2024-03-05 17:40:01 358

原创 关于yolov8的一些模块

对于yolov8的c2f模块,就是上一层的输出被split成了两部分,一部分不动,另一部分经过conbnsilu提取特征在拼回去,结构图如下:onnx的netron图如下:(1)c2f(2)bottleneck对于yolov8的SPPF模块,就是上一层的输出进行convbnsilu卷积提取特征后,一部分拿去做池化,将不同层的池化特征与另一部分经过conbnsilu提取特征在拼回去,最后再进行特征提取,结构图如下:

2024-02-06 14:48:45 2475 3

原创 香橙派--编译MNN报错,关于汇编的嵌套展开

类似地,第一个 FMIN 函数 FMIN v10, v15, v16, v17, v18 计算向量 v15, v16, v17, v18 中的最小值,并将结果存储在 v10 向量中。其中,FMAX 和 FMIN 函数分别用来计算一组向量中的最大值和最小值,并将结果存储在新的向量中。这段代码中使用了多个 FMAX 和 FMIN 函数,它们分别计算一组向量 v15 到 v30 中的最大值和最小值,并将结果存储在两个不同的向量(v9 和 v10)中。

2024-01-13 10:13:30 686

原创 当前目录下,给所有视频文件赋予 777 权限

【代码】当前目录下,给所有视频文件赋予 777 权限。

2024-01-04 15:56:15 429

原创 Ubuntu 22.04 安装 xserver-xorg-core-hwe-18.04 和 xserver-xorg-video-dummy-hwe-18.04

【代码】Ubuntu 22.04 安装 xserver-xorg-core-hwe-18.04 和 xserver-xorg-video-dummy-hwe-18.04。

2024-01-03 09:02:30 1431

原创 香橙派--关于jammy-xfce-arm64.f12a43b3e629442a073a7236bf9166ce.tar.lz4的rootfs定制与镜像制作

香橙派--关于jammy-xfce-arm64.f12a43b3e629442a073a7236bf9166ce.tar.lz4的rootfs定制与镜像制作

2024-01-02 14:06:09 1521

原创 香橙派--关于jammy-gnome-arm64.e9d0e792c112dbb637bca901a75061e3.tar.lz4的根目录文件系统挂载,预装opencv

解压缩 jammy-gnome-arm64.e9d0e792c112dbb637bca901a75061e3.tar.lz4 文件,并将其挂载到一个目录中。安装 OpenCV 和其他所需的软件包。

2023-12-25 15:50:59 442

原创 Ultralytics YOLOv8.0.225 的onnx导出

【代码】Ultralytics YOLOv8.0.225 🚀的onnx导出。

2023-12-08 17:41:36 729

原创 libeigen3矩阵运算

【代码】libeigen3矩阵运算。

2023-09-26 16:35:01 111

原创 八公山豆腐发展现状与销售对策研究

八公山豆腐作为中国传统特色食品之一,一直以来备受人们的喜爱。然而,在现代社会中,由于消费者对于营养健康的追求以及市场竞争的加剧,八公山豆腐的市场份额逐渐缩小。因此,为了更好地推广和发展八公山豆腐,有必要对其发展现状进行分析,并提出相应的销售对策。

2023-09-18 18:01:07 211

coco80里面提取的coco800,包含所有类别

coco80里面提取的coco800,包含所有类别

2023-07-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除