Color Space-CSDN博客

原创 C#图像处理 | EmguCV+OpenCVSharp二合一教程你值得拥有

VS2017+EmguCV3.4高清入门视频教程视频教程原链接如上，内容预览与目录如下EmguCV+OpenCVSharp视频教程二合一版本 C#视觉开发者必备EmguCV基础视频教程---第01讲(EmguCV介绍与安装配置)EmguCV基础视频教程---第01讲---补充更新(EmguCV3.4.1安装配置)EmguCV基础视频教程---第02讲(EmguCV自带例程赏析)EmguCV基础视频教程---第03讲(图像读取_显示_保...

2021-02-06 15:30:14 4253

原创 TensorFlow深度学习视频教程基础入门到实战图像分类目标检测TensorFlow Object Detection API

TensorFlow基础入门与实战教程，适合Python C++ C#视觉开发者，基于TensorFlow深度学习框架，涉及TensorFlow基础、图像分类、目标检测训练与测试以及后期在C++和C#的使用。SSD，Faster RCNN，Mask RCNN训练检测目录如下：学到内容预览：...

2019-10-27 21:42:39 1395

原创 Barcode解码一维码、二维码识别物流单号识别

支持一维码、QRCode、DataMatrix等二维码，效果如下：

2025-06-11 18:48:51 570

原创实战 | YOLO11自定义数据集训练实现缺陷检测 (标注+训练+预测保姆级教程)

安装完成后，命令行直接输入labelimg，回车即可打开labelimg，数据集类型切换成YOLO，然后依次完成标注即可。标注好之后，使用下面的脚本划分训练集、验证集，注意设置正确的图片和txt路径：。defects.yaml内容如下，注意修改自己的数据集路径即可：。安装好后可以查看是否安装成功，上面安装的gpu版本，查看指令与结果：。在weights文件夹下生成两个模型文件，直接使用best.pt即可。训练脚本如下：。预测脚本如下：。

2024-12-13 21:16:16 566

原创实战 | C# 中使用GPU加速YOLOv11 推理

本文主要介绍如何在C#中使用GPU加速YOLOv11推理。YOLOv11介绍C# 中使用YOLOv11 （GPU版本）【1】环境和依赖项。下载安装CUDA12.6和CUDNN9.6，截止文章日期最新版本，注意选择自己的版本，我的系统是win11 64位。https://developer.nvidia.com/cuda-12-6-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=11&target_type

2024-12-07 15:23:03 1518

原创实战 | C# 中使用YOLOv11实现实例分割（步骤 + 源码）

其中原来的Detect变成了Segment，检测变分割，使用下面代码保存得到官方的结果图。本文主要介绍在C#中使用YOLOv11实现实例检测，并给详细步骤和源码。注意安装ultralytics最新版本，避免模型转换失败！代码部分，没有UI的代码和目标检测部分基本一致，主要是这句。

2024-12-07 14:41:27 1648

原创实战 | C# 中使用YOLOv11实现目标检测（步骤 + 源码）

上面文章详细介绍了YOLO11相关知识，也包括如何训练自己的YOLO11目标检测模型，后续将不在赘述。将转换后的onnx模型和测试图片准备好，使用下面代码加载即可预测：。本文主要介绍在C#中使用YOLOv11实现目标检测，并给详细步骤和代码。最新版为6.0.1，本文只演示CPU版本，GPU版本可以自行尝试。转换后生成onnx模型文件yolo11s.onnx。对比来看准确率相当，可以使用。解压密码：992915。

2024-11-23 11:47:52 1595

原创实战 | C#中使用YoloV8和OpenCvSharp实现目标检测（步骤 + 源码）

需先安装VS2022最新版，.NetFramework8.0，然后新建项目，nuget安装。本文主要介绍在C#中使用YoloV8实现目标检测，并给详细步骤和代码。最新版6.0.1，本文只演示CPU版本。

2024-11-20 18:57:41 2461

原创实战 | YOLOv8使用TensorRT加速推理教程（步骤 + 代码）

这一步主要是安装根据自己的硬件安装GPU驱动，下载CUDNN等，以往的文章已经介绍过多次，可以点击下面的图片跳转到对应文章查看(点击图片跳转)。DeepSparse：专为稀疏模型设计的CPU推理运行时，可以有效加速基于WSL2的Windows环境下的推理。OpenVINO：Intel的推理工具套件，用于CPU上的模型优化和加速，支持量化和多种硬件加速。可以使用官网下载的模型也可以使用自己训练好的模型。保持框架最新：确保使用的深度学习框架版本是最新的，以获得最新的优化和bug修复。

2024-07-09 20:07:16 4341

原创实战 | YOLOv10 自定义数据集训练实现车牌检测 (数据集+训练+预测保姆级教程)

例如，在 COCO 数据集上，YOLOv10-S 的速度是 RT-DETR-R18 的 1.8 倍，而 YOLOv10-B 与 YOLOv9-C 相比，在性能相同的条件下，延迟浏览器打开 46%，参数浏览器打开 25%。YOLOv10是清华大学研究人员在Ultralytics Python包的基础上，引入了一种新的实时目标检测方法，解决了YOLO以前版本在后处理和模型架构方面的不足。YOLOv10中的主干网负责特征提取，它使用了增强版的CSPNet（跨阶段部分网络），以改善梯度流并减少计算能力。

2024-06-08 21:00:12 3470

原创基于OpenVINO实现无监督异常检测

下面的函数run_inference()将以 FiftyOne 样本集合（例如我们的测试集）作为输入，以及推理器对象和用于将结果存储在样本中的键。在此示例中，我们将使用 0.5 的阈值，但您可以尝试使用不同的值。然而，视觉异常检测对于检测制造中的缺陷、识别监控录像中的可疑活动以及检测医学图像中的异常至关重要。train_and_export_model()下面的函数使用 Anomalib 的类训练异常检测模型Engine，将模型导出到 OpenVINO，并返回模型“推理器”对象。我们将重点关注的对象类别。

2024-06-08 20:58:03 2454

原创 AI一键换衣：开源虚拟试穿项目IDM-VTON介绍与使用

对时尚设计师和零售商而言，在电子商务网站线上提供试穿服务，不仅能够降低库存成本，提高销售效率，提升购物体验和客户满意度，协助时尚设计师预览新设计在不同体型上的效果，还能减少实体试衣间的需求，从而节省空间和运营成本。使用两个不同的模组来编码服装图像的语义，给定扩散模型的基础 UNet，将从视觉编码器提取的高级语义融合到交叉注意力层，进一步提升影像的细节品质。IDM-VTON 透过分析人物和服装的图像，即使在复杂背景和多样姿势下，IDM-VTON 也能保持服装的细节特征，产生逼真的试穿效果。

2024-06-08 20:54:52 1446

原创实战 | 通过微调SegFormer改进车道检测效果（数据集 + 源码）

在本次实验中，我们利用 BDD（Berkeley DeepDrive）车道检测数据集提供的丰富多样的数据，成功展示了微调的 SegFormer 模型在车道检测任务中的应用。这种方法凸显了微调的有效性以及 SegFormer 架构在处理自动驾驶和道路安全中的复杂语义分割任务时的稳健性，即使在漆黑的夜晚也是如此。车道检测的流畅性和准确性（在叠加的绿色蒙版中可视化）证明了该模型的有效性。最后，可以肯定的是，即使有多种尖端的车道检测算法，对 SegFormer 这样的模型进行微调也能获得出色的结果！

2024-06-08 20:51:57 2265

原创 YOLOv8自定义数据集训练实现火焰和烟雾检测

在本例中，图像文件位于/content/drive/MyDrive/D-Fire/runs/detect/train/confusion_matrix.png.该width=600参数将显示图像的宽度设置为600像素，它控制显示时图像的大小。例如，如果您的 Google 云端硬盘中有一个文件，您可以使用路径“/content/drive/MyDrive/”引用该文件，后跟该文件在 Google 云端硬盘目录结构中的位置。该文件可能包含有关数据集的信息，例如图像的路径和相应的对象标签。

2024-05-27 21:20:50 1111 1

原创实战 | 使用YoloV8实例分割识别猪的姿态（含数据集）

epoch 的数量主要取决于您愿意等待多长时间，epoch 越多，结果越好，但是，总有一个点是无法实现任何改进的，因此从 100 个 epoch 开始似乎是个好主意。使用 Yolov8 时，可以记录某一类别的猪的数量（例如正在进食的猪），这样您就可以随时统计猪的数量。如果您不熟悉虚拟环境，虚拟环境的目的是将当前项目中安装的包与计算机上的其他项目分开，这样您就可以避免项目之间的版本不匹配。以及 dataset.yaml 文件的路径，它指向我们的数据、标签和要识别的类的数量。确保路径与您在计算机上的期望相符。

2024-05-27 21:18:12 2423 12

原创 YOLOv10介绍与推理--图片和视频演示（附源码）

例如，在 COCO 数据集上，YOLOv10-S 的速度是RT-DETR-R18 的 1.8 倍，而 YOLOv10-B 与 YOLOv9-C 相比，在性能相同的情况下，延迟减少了 46%，参数减少了 25%。YOLOv10是清华大学的研究人员在Ultralytics Python包的基础上，引入了一种新的实时目标检测方法，解决了YOLO 以前版本在后处理和模型架构方面的不足。然而，对 NMS 的依赖和架构上的低效阻碍了最佳性能的实现。利用一致的双重分配来消除对 NMS 的需求，从而减少推理延迟。

2024-05-27 21:16:14 6718

原创 PyRun_SimpleString(“import cv2“)；报错解决

opencv-python版本4.8.0.76。卸载opencv-contrib-python。

2024-05-07 16:49:18 470

原创实战 | YOLOv8自定义数据集训练实现手势识别 (标注+训练+预测保姆级教程--含数据集)

安装完成后，命令行直接输入labelimg，回车即可打开labelimg，数据集类型切换成YOLO，然后依次完成标注即可。可以自己写一个从摄像头存图的脚本保存一下不同手势图到本地，这里提供一个供参考：。标注好之后，使用下面的脚本划分训练集、验证集，注意设置正确的图片和txt路径：。安装好后可以查看是否安装成功，上面安装的gpu版本，查看指令与结果：。hand.yaml内容如下，注意修改自己的数据集路径即可：。预测脚本如下：。

2024-03-29 15:39:11 919

原创实战 | 微调训练TrOCR识别弯曲文本

TrOCR（基于 Transformer 的光学字符识别）模型是性能最佳的 OCR 模型之一。在我们之前的文章中，我们分析了它们在单行打印和手写文本上的表现。

2024-03-25 19:07:47 3182 1

原创 TrOCR—基于Transformer的OCR入门

多年来，光学字符识别 (OCR) 出现了多项创新。它对零售、医疗保健、银行和许多其他行业的影响是巨大的。尽管有着悠久的历史和多种最先进的模型，研究人员仍在不断创新。与深度学习的许多其他领域一样，OCR 也看到了变压器神经网络的重要性和影响。如今，我们拥有像。

2024-03-25 19:04:10 3005

原创实战 | 基于YOLOv9和OpenCV实现车辆跟踪计数（步骤 + 源码）

先进的计算机视觉技术（例如对象检测和跟踪）可应用于监控录像，以识别和跟踪车辆在摄像机视野中移动。现在让我们指定类：。之后，我们找到检测到的车辆的中心，然后在它们穿过人工创建的红线时对它们进行计数。在上面的代码中，我们循环遍历视频中的每个帧，然后进行检测。然后，由于我们仅对车辆进行计数，因此仅过滤掉汽车的检测结果。在这里，我们在加载视频后获取视频属性，因为它们对于使用计数器重新创建视频并最终将其存储在本地非常有用。我们可以看到，当车辆越过红线时，视频左上角的计数器不断增加。

2024-03-13 20:38:33 3952 2

原创实战 | 使用YOLOv8图像分割实现路面坑洞检测（步骤 + 代码）

trainImagePath = os.path.join(dataDir, 'train','images')：此行构造包含训练图像的目录的路径。对于每个子图，它使用加载相应的图像os.path.join(validImagePath, selectedImage[i])，使用方法执行推理bestModel.predict()，并使用绘制带注释的图像results[0].plot()。在整个项目中，我们从数据管理到模型训练、推理和评估，揭示了图像分割的复杂性及其在计算机视觉中的变革潜力。

2024-03-02 21:22:29 3530 2

原创 OpenCV自带的三种白平衡算法使用演示(代码 + 效果)

许多传统的白平衡算法都是基于统计的，即它们依赖于这样一个事实：某些假设应该在正确白平衡的图像中成立，例如众所周知的灰色世界假设。然而，通过在基于学习的框架中利用具有地面实况光源的大型图像数据集，通常可以获得更好的结果。python learn_color_balance.py -i <包含训练图像的文件夹的路径> -g <real_illum_568..mat的路径> -r 0,378 --num_trees 30 --max_tree_depth 6 --num_augmented 0。

2024-02-24 11:53:36 4758 1

原创实战 | 使用CNN和OpenCV实现数字识别项目(步骤 + 源码)

x_train, x_val, y_train, y_val = train_test_split(x_train, y_train, test_size=0.2, random_state=42)进一步将训练集分为训练集 (x_train和y_train) 和验证集 (x_val和y_val)。这有助于模型从更多样化的增强图像中学习，提高其泛化新的和未见过的数据的能力。定义用于图像分类的 CNN 模型，对其进行编译，使用数据增强对其进行训练，并保存训练模型的权重和架构以供将来使用。

2024-02-17 21:01:19 1022

原创实战 | 基于YOLOv8和OpenCV实现车速检测(详细步骤 + 代码)

在高速公路的路肩上，通常有垂直的柱子——标记，每隔固定的距离间隔开。在一种情况下，我们可以计算每一帧的速度：计算两个视频帧之间行进的距离，并将其除以 FPS 的倒数，在我的例子中为 1/25。要对视频执行对象检测，我们需要迭代视频的帧，然后对每个帧运行我们的检测模型。最后，我们将顶点A-B-C-D和的坐标分别重新组织A'-B'-C'-D'为二维SOURCE和TARGET矩阵，其中矩阵的每一行包含一个点的坐标。这样，汽车行驶的距离明显大于闪烁引起的小盒子移动，我们的速度测量也更接近真实情况。

2024-02-17 20:57:36 1587

原创用Python和OpenCV搭建自己的一维码和QRCode扫描仪（步骤 + 源码）

本文我们将创建一个程序来扫描图像中的二维码和条形码。对于这个程序，我们需要三个包，分别是OpenCV、NumPy和pyzbar。大多数 Python 程序员都熟悉 OpenCV 和 Numpy 库。OpenCV 是一个开源计算机视觉和机器学习库。它是一个有用的图像处理库。我们在项目中使用这个库来处理设备捕获的视频中的每一帧。我们在这里使用 Numpy，因为 pyzbar 可与 OpenCV / numpy ndarrays 配合使用。而 pyzbar 库用于从给定图像中读取条形码和 QR 码。

2024-02-17 20:54:48 1789 2

原创开源项目 | 用AI给人像照片换发型和发色（附详细步骤 + 避坑指南)

我们新颖的表示方法能够从多个参考图像中传输视觉属性，包括痣和皱纹等特定细节，并且因为我们在潜在空间中进行图像混合，所以我们能够合成连贯的图像。我们的方法避免了其他方法中存在的混合伪影，并找到全局一致的图像。源码中是用yaml直接创建环境，environment/environment.yaml ，这里我们需要将environment.yaml文件中需要pip的包复制出来，粘贴进新建的一个requirements.txt中，这里我已经在本地电脑建好，直接上传到Barbershop根目录。

2024-02-02 20:56:48 8024

原创实战 | OpenCV+OCR实现弧形文字识别实例(详细步骤 + 源码)

测试图如下，目标是正确识别图中的字符。

2024-01-28 08:21:35 936

原创实战 | OpenCV两种不同方法实现粘连大米粒分割计数(步骤 + 源码)

测试图如下，图中有个别米粒相互粘连，本文主要演示如何使用OpenCV用两种不同方法将其分割并计数。

2024-01-17 21:27:11 1154

原创基于YOLOv8 + BotSORT实现球员和足球检测与跟踪 (步骤 + 源码)

本文旨在了解 YOLO 架构并在自定义数据集上对其进行训练，然后微调模型以获得更好的结果，并运行推理以了解最有效的方法。

2024-01-09 22:24:21 3503 4

原创基于Segformer实现PCB缺陷检测(步骤 + 代码)

PCB缺陷检测是电子制造的一个重要方面。利用Segformer等先进模型不仅可以提高准确性，还可以大大减少检测时间。传统方法涉及手动检查，无法扩展且容易出错。利用机器学习，特别是 Segformer模型，提供自动化且精确的解决方案。

2024-01-04 17:00:57 2009

原创实战 | 使用OpenCV快速去除文档中的表格线条(步骤 + 源码)

测试图如下，目标是去除下面三张图中的表格线条，方便后续图像处理。

2023-12-28 19:27:45 1512

转载实例化报错-OpenCvSharp.Internal.NativeMethods”的类型初始值设定项引发异常

在 System.Windows.Forms.Application.ComponentManager.System.Windows.Forms.UnsafeNativeMethods.IMsoComponentManager.FPushMessageLoop(IntPtr dwComponentID, Int32 reason, Int32 pvLoopData)在 System.Windows.Forms.Control.ControlNativeWindow.WndProc(Message& m)

2023-12-26 17:48:39 957

HAProxy for Windows 3.1/3.2 (exe)

OpenCV stitching-detailed.cpp解读

空空如也