- 博客(8)
- 收藏
- 关注
原创 YOLO:针对极端长宽比图像的训练优化方案
本文针对道床异物检测中YOLO模型处理2100×300极端长宽比图像的问题,提出优化方案。通过分析YOLO默认预处理对长图的不适配性(产生大量无效黑边),提出保留原始长宽比、适配网络下采样机制的核心思路。关键优化包括:设置输入尺寸为2112(可被32整除)、开启矩形训练(rect=True)、关闭马赛克增强等。实验证明该方法显著提升了模型精度,同时避免了显存溢出问题。该方案为处理特殊长宽比图像提供了有效参考。
2026-03-25 11:32:07
395
原创 无需负样本的异常识别!GANomaly 实操指南:从环境搭建到项目落地
本文介绍了GANomaly模型在异常检测中的实际应用,重点讲解了环境搭建与实验复现的详细步骤。文章首先阐述了GANomaly的核心原理:通过生成对抗网络仅用正常样本训练,在测试时通过潜在向量差异检测异常。随后详细说明了运行环境准备过程,包括代码获取、虚拟环境创建、依赖项安装及常见报错解决方案(如Pillow版本冲突、CUDA兼容性问题)。最后提供了复现CIFAR10数据集实验的具体命令,并针对可能出现的环境配置不兼容问题给出了实用解决方案。该指南为工程实践中实现无监督异常检测提供了完整的技术路线。
2026-01-21 11:02:04
575
原创 YOLO分类数据集划分:训练集 / 验证集图片随机移动
本文介绍了一个Python脚本,用于在深度学习分类任务中随机划分训练集和验证集。该脚本可以自动从源文件夹中随机选取指定数量的图片,并将其移动到目标验证集文件夹。主要功能包括:自动创建目标文件夹、筛选有效图片格式、随机打乱图片顺序、处理同名文件冲突以及异常捕获。用户只需修改配置区的3个参数即可使用,脚本会输出详细的移动过程和统计结果。该方案解决了手动划分效率低、易出错的问题,确保数据集划分的随机性和代表性。
2026-01-19 17:25:28
398
原创 YOLO:使用训练好的模型实现图像的自动标注
本文介绍了基于YOLO模型的自动标注方法,通过加载预训练权重、批量推理未标注图片并转换坐标格式,快速生成YOLO格式的标注文件。代码实现包含环境配置、模型加载、批量处理等关键步骤,支持设置置信度阈值过滤低质量检测结果。作者强调自动标注仅作为辅助工具,建议后续仍需人工校验调整,并提供了完整的Python代码示例和参数说明,适用于需要大规模数据标注的计算机视觉项目。
2026-01-09 09:19:37
256
原创 YOLOv13:单通道训练改造全流程
摘要:本文详细介绍了将YOLOv13模型从默认3通道RGB输入改造为单通道灰度图像输入的完整方案。改造涉及8个关键步骤,包括修改配置文件、注释预训练模型校验、调整数据加载和模型预热等环节的通道数适配。重点解决了单通道与预训练权重的兼容性问题,并提供了各修改点的具体代码示例。改造后模型参数量和计算量降低,推理速度提升,适用于红外、医学等灰度图像的目标检测任务。实施时需确保所有环节通道数一致,且不建议使用官方3通道预训练权重。
2026-01-09 09:18:22
1087
原创 YOLOv13环境配置(cpu版)
找到Anaconda文件夹下,envs文件夹,找到刚刚创建的yolo13cpu文件,打开找到python.exe,选择它。文件中列出的所有 Python 依赖包及其指定版本,通过 pip 工具自动批量下载并安装,确保项目运行环境的依赖一致性。等待pycharm完成环境加载完成。提前安装好Anaconda 和pycharm。使用打开requirements.txt,注释。打开pycharm,点击右下较。选择现有,点击文件夹图标。
2025-12-25 15:19:40
198
原创 YOLOv13改为单通道模型后,上传灰度图进行推理报通道错误
1 表示取 0 到 1 之间的元素,即仅保留第 0 个通道),丢弃另外 2 个冗余通道,将通道数从 3 压缩为 1。(对应:批次数量 n、通道数 3、图像高度 h、图像宽度 w)的数组,默认将单通道灰度图自动扩展为 3 通道。在ultralytics/engine/predictor.py里加了一行代码(等号里是新加入的代码)模型预期传入 1 通道图像,实际输入 3 通道图像。但传入的图像为灰度图。通过切片操作截取通道维度的第 1 个通道(索引从 0 开始,这是由于传入图像经过框架预处理后,变为形状为。
2025-12-25 14:39:57
220
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅