诸葛铁牛氵-CSDN博客

原创 PyTorch 快速入门（2026）

本文将会从零开始进行PyTorch的学习。

2026-03-27 00:11:41 426

本文针对道床异物检测中YOLO模型处理2100×300极端长宽比图像的问题，提出优化方案。通过分析YOLO默认预处理对长图的不适配性（产生大量无效黑边），提出保留原始长宽比、适配网络下采样机制的核心思路。关键优化包括：设置输入尺寸为2112（可被32整除）、开启矩形训练(rect=True)、关闭马赛克增强等。实验证明该方法显著提升了模型精度，同时避免了显存溢出问题。该方案为处理特殊长宽比图像提供了有效参考。

2026-03-25 11:32:07 395

原创无需负样本的异常识别！GANomaly 实操指南：从环境搭建到项目落地

本文介绍了GANomaly模型在异常检测中的实际应用，重点讲解了环境搭建与实验复现的详细步骤。文章首先阐述了GANomaly的核心原理：通过生成对抗网络仅用正常样本训练，在测试时通过潜在向量差异检测异常。随后详细说明了运行环境准备过程，包括代码获取、虚拟环境创建、依赖项安装及常见报错解决方案（如Pillow版本冲突、CUDA兼容性问题）。最后提供了复现CIFAR10数据集实验的具体命令，并针对可能出现的环境配置不兼容问题给出了实用解决方案。该指南为工程实践中实现无监督异常检测提供了完整的技术路线。

2026-01-21 11:02:04 575

原创 YOLO分类数据集划分：训练集 / 验证集图片随机移动

本文介绍了一个Python脚本，用于在深度学习分类任务中随机划分训练集和验证集。该脚本可以自动从源文件夹中随机选取指定数量的图片，并将其移动到目标验证集文件夹。主要功能包括：自动创建目标文件夹、筛选有效图片格式、随机打乱图片顺序、处理同名文件冲突以及异常捕获。用户只需修改配置区的3个参数即可使用，脚本会输出详细的移动过程和统计结果。该方案解决了手动划分效率低、易出错的问题，确保数据集划分的随机性和代表性。

2026-01-19 17:25:28 398

原创 YOLO：使用训练好的模型实现图像的自动标注

本文介绍了基于YOLO模型的自动标注方法，通过加载预训练权重、批量推理未标注图片并转换坐标格式，快速生成YOLO格式的标注文件。代码实现包含环境配置、模型加载、批量处理等关键步骤，支持设置置信度阈值过滤低质量检测结果。作者强调自动标注仅作为辅助工具，建议后续仍需人工校验调整，并提供了完整的Python代码示例和参数说明，适用于需要大规模数据标注的计算机视觉项目。

2026-01-09 09:19:37 256

原创 YOLOv13：单通道训练改造全流程

摘要：本文详细介绍了将YOLOv13模型从默认3通道RGB输入改造为单通道灰度图像输入的完整方案。改造涉及8个关键步骤，包括修改配置文件、注释预训练模型校验、调整数据加载和模型预热等环节的通道数适配。重点解决了单通道与预训练权重的兼容性问题，并提供了各修改点的具体代码示例。改造后模型参数量和计算量降低，推理速度提升，适用于红外、医学等灰度图像的目标检测任务。实施时需确保所有环节通道数一致，且不建议使用官方3通道预训练权重。

2026-01-09 09:18:22 1087

原创 YOLOv13环境配置（cpu版）

找到Anaconda文件夹下，envs文件夹，找到刚刚创建的yolo13cpu文件，打开找到python.exe，选择它。文件中列出的所有 Python 依赖包及其指定版本，通过 pip 工具自动批量下载并安装，确保项目运行环境的依赖一致性。等待pycharm完成环境加载完成。提前安装好Anaconda 和pycharm。使用打开requirements.txt，注释。打开pycharm，点击右下较。选择现有，点击文件夹图标。

2025-12-25 15:19:40 198

原创 YOLOv13改为单通道模型后，上传灰度图进行推理报通道错误

1 表示取 0 到 1 之间的元素，即仅保留第 0 个通道），丢弃另外 2 个冗余通道，将通道数从 3 压缩为 1。（对应：批次数量 n、通道数 3、图像高度 h、图像宽度 w）的数组，默认将单通道灰度图自动扩展为 3 通道。在ultralytics/engine/predictor.py里加了一行代码（等号里是新加入的代码）模型预期传入 1 通道图像，实际输入 3 通道图像。但传入的图像为灰度图。通过切片操作截取通道维度的第 1 个通道（索引从 0 开始，这是由于传入图像经过框架预处理后，变为形状为。

2025-12-25 14:39:57 220

weixin_55707690的博客