wjt102020-CSDN博客

原创基于NestedUNet++的医学图像分割系统

摘要：本文实现了一个基于NestedUNet++的医学图像分割系统，主要包含数据预处理、模型训练和评估三个部分。预处理阶段将原始图像和掩码调整为96×96统一尺寸；训练部分采用深度监督策略，支持多种损失函数和优化器选择；评估阶段计算IoU指标并进行可视化展示。系统实现了UNet和NestedUNet两种网络结构，其中NestedUNet通过密集跳跃连接增强特征复用，在数据集划分上采用80/20的比例，并应用了旋转、翻转等数据增强技术。实验结果表明，该方法能有效处理医学图像分割任务，模型性能可通过IoU指标

2025-11-03 16:42:50 115

原创 U-net 系列算法

本文介绍了U-net系列图像分割算法的演进过程。基础U-net采用编码-解码结构和特征拼接机制，在医学图像分割中表现优异。U-net++引入密集连接和深度监督，显著提升了特征融合效果和模型灵活性。U-net+++进一步通过多尺度池化优化了高低阶特征整合。该系列的核心演进逻辑是逐步强化特征利用率：从基础框架到密集融合，再到多尺度优化，持续提升分割精度。这些改进使U-net系列在保持结构简洁的同时，不断突破性能瓶颈。

2025-10-31 11:51:19 417

原创图像分割项目

图像分割是像素级分类任务，用于预测目标轮廓和像素语义归属，广泛应用于人像抠图、医学影像、自动驾驶等领域。其任务分为语义分割（仅分类）、实例分割（区分个体）和全景分割（覆盖全图）。主流数据集包括PASCAL VOC、Cityscapes和COCO，评价指标以IoU系列（如mIoU）为核心。技术原理基于编码器-解码器结构，通过卷积降维提取特征，反卷积升维恢复分辨率，典型网络如ResNet结合反卷积模块实现端到端分割。

2025-10-29 13:40:33 904

原创 YOLOv5模型的训练脚本

该代码是YOLOv5模型的训练脚本。

2025-10-28 11:31:15 283

原创基于YOLOv5的目标检测模型训练

本文介绍了基于YOLOv5的目标检测模型训练代码实现。代码包含完整的训练流程，支持数据加载、模型构建、损失计算、优化器设置、学习率调整等核心功能。通过argparse模块实现丰富的训练参数配置，包括学习率、批大小、epoch数等。训练过程采用混合精度训练、EMA权重更新、多尺度训练等技术，并支持训练中断恢复功能。此外，代码还实现了模型评估、结果可视化、超参数优化等辅助功能，为YOLOv5模型的训练提供了完整的解决方案。文章详细解析了模型结构、训练优化策略以及多GPU训练支持等关键技术点。

2025-10-27 11:18:55 262

原创 YOLO5目标检测（续）

该代码实现了YOLO目标检测数据集的预处理和增强功能。主要包括：图像加载、马赛克增强（将4张图片拼接为1张）、随机透视变换（旋转、缩放、平移等）、HSV色彩空间增强、边界填充（letterbox）等数据增强方法。同时提供了标签坐标转换、图像裁剪遮挡(cutout)等功能，支持多种图像格式转换。这些预处理步骤可有效提升模型训练效果，增强泛化能力。代码采用OpenCV和NumPy实现，与PyTorch框架配合使用，适用于目标检测任务的数据增强和预处理。

2025-10-24 13:54:14 207

原创 YOLOv5目标检测

本文介绍了YOLOv5目标检测框架中的数据加载和预处理模块，主要包括以下内容：数据加载器实现：支持图像和视频输入，包含图像格式验证、缓存处理、标签加载等功能。使用多线程优化数据读取效率。数据增强方法：实现多种数据增强技术，包括Mosaic拼接、随机透视变换、HSV调整、镜像翻转等，提升模型泛化能力。辅助功能：提供图像尺寸调整、格式转换、数据集拆分等实用工具函数。高效处理：采用缓存机制加速训练过程，支持分布式训练的数据同步。该模块为YOLOv5提供了高效的数据管道，支持多种输入格式和丰富的数据增强策

2025-10-24 13:52:14 187

原创 YOLOv4 中的关键优化技术

本文介绍了两种提升深度学习模型性能的技术：1.标签平滑（Label Smoothing）通过软化分类标签（如将[0,1]变为[0.05,0.95]），缓解模型过度自信导致的过拟合问题，增强泛化能力；2.IOU系列损失函数优化，从传统IOU到GIoU、DIoU、CIoU逐步改进，解决了无重叠时无法优化、无法区分框位差异等问题，通过引入最小封闭框、中心点距离和长宽比约束，显著提升目标检测中边界框的回归精度。两项技术分别从标签设计和损失函数层面优化模型性能。

2025-10-22 13:52:57 940

原创 YOLO_V4--(续）

本文总结了目标检测中的关键技术改进：1）Soft-NMS通过降低置信度而非直接剔除来保留更多有效框；2）特征提取优化包括SPPNet、CSPNet和注意力机制（SAM、CBAM）；3）特征融合采用PAN网络增强信息传递；4）使用Mish激活函数提升性能，并通过调整系数消除网格敏感性。这些方法在保持效率的同时显著提升了检测精度。

2025-10-21 15:35:46 160

原创 YOLOv4的学习

YOLOv4在保持YOLO系列"快且准"优势的同时，通过双维度优化提升性能。关键技术包括数据增强（Mosaic等）、损失函数优化（CIoU等）和网络改进（CSPNet、PAN等），支持单GPU训练降低门槛。实验验证了各模块有效性，在精度和速度上具有竞争力。其创新设计平衡了训练成本和推理效率，为实时目标检测提供了高效解决方案。

2025-10-20 11:19:41 707

原创 YOLO-V3

YOLO-V3在多尺度检测、网络架构和先验框设计上进行了优化：采用三尺度特征图(13×13至52×52)提升小目标检测能力；引入残差连接和全卷积结构增强特征提取；先验框扩展至9种并分尺度适配；改用Logistic分类函数支持多标签预测。在COCO数据集上，YOLO-V3在速度与精度间取得平衡，尤其擅长小目标检测和多标签场景，608尺寸模型mAP-50达57.9，推理时间51ms。

2025-10-17 11:17:11 183

原创 YOLO-V1和YOLO-V2

YOLO-V1到V2的核心改进包括：网络结构升级为DarkNet，引入BatchNorm和1×1卷积；边界框优化采用Anchor Box和直接位置预测；通过细粒度特征融合和多尺度训练提升检测能力。V2在VOC2007上的mAP从70提升至78.6，同时保持高速检测，实现了速度与精度的平衡。改进重点包括归一化处理、先验框聚类、感受野优化等，使模型更稳定高效。

2025-10-16 13:45:30 557

原创深度学习目标检测项目

本文系统介绍了深度学习目标检测的核心知识，包括基本概念、主流数据集、评估指标和方法演进。重点阐述了VOC和COCO两大数据集的特点，以及YOLO、VOC、COCO三种数据格式的差异。详细解析了IoU、TP/FP等核心评估指标的计算方法，比较了mean和average的区别。最后梳理了目标检测方法的发展历程，从传统滑动窗口到基于Anchor的深度学习方法，并说明了两阶段和一阶段算法的流程差异，以及NMS在结果优化中的关键作用。全文为理解目标检测技术提供了系统的知识框架。

2025-10-15 13:57:22 838

原创 CIFAR-10图像分类任务

本文实现了一个基于PyTorch的深度学习模型集成方法，用于CIFAR-10图像分类任务。研究比较了CNNNet、Net、LeNet三种卷积神经网络结构，并采用投票机制进行模型集成。实验结果表明，集成模型能有效提升分类准确率。此外，文章还实现了VGG16网络作为对比，展示了不同网络架构在相同任务上的性能表现。所有模型均采用Adam优化器和交叉熵损失函数进行训练，通过20个epoch的迭代优化参数。该研究为神经网络模型集成提供了实践参考，验证了集成学习在计算机视觉任务中的有效性。

2025-10-15 09:13:31 148

原创用PyTorch实现MNIST手写数字分类的神经网络模型

本文介绍了使用PyTorch实现MNIST手写数字分类的神经网络模型。首先加载MNIST数据集并进行预处理，包括归一化和数据增强。构建了一个包含两个隐藏层的全连接网络，使用ReLU激活函数和批归一化，输出层采用Softmax。训练过程中使用SGD优化器和交叉熵损失函数，动态调整学习率。通过20个epoch的训练，在测试集上评估模型性能，并记录训练/测试的损失和准确率。最后使用TensorBoard可视化训练过程，并绘制损失曲线图展示模型收敛情况。

2025-10-14 08:49:57 480

原创代码案例实践

该代码实现了一个基于PyTorch的CIFAR-10图像分类系统，包含三个CNN模型架构（CNNNet、Net和LeNet）。系统首先加载并进行数据增强处理，然后训练指定模型10个epoch，使用SGD优化器和交叉熵损失函数。代码还提供了模型参数统计工具，可输出各层输入输出形状及参数数量。训练完成后，系统评估模型在测试集上的准确率。整个流程支持GPU加速，并包含详细的训练过程日志输出。

2025-10-10 11:30:19 213

原创卷积神经网络(CNN)的图像分类任务

该代码实现了一个卷积神经网络(CNN)的图像分类任务，主要包含以下内容：1) 测试网络准确率，计算整体和每个类别的分类精度；2) 定义了一个CNN网络结构，包含2个卷积层、最大池化层、全局平均池化层和全连接层；3) 将网络转移到GPU设备上运行并统计参数总数。网络采用了全局平均池化层替代传统的展平操作，减少了参数量。代码还展示了如何计算模型在测试集上的整体准确率和每个类别的单独准确率。

2025-09-27 13:53:31 126

原创使用PyTorch实现CIFAR-10图像分类

本文展示了使用PyTorch实现CIFAR-10图像分类的完整流程。通过构建包含两个卷积层、两个池化层和两个全连接层的CNN网络，对32x32彩色图像进行10分类。代码实现了数据加载、归一化处理、模型训练和测试评估，使用SGD优化器和交叉熵损失函数，在GPU上完成10个epoch的训练。实验结果表明该CNN模型能够有效识别飞机、汽车等10类物体，并可视化展示了预测结果与真实标签的对比。

2025-09-26 16:01:44 108

原创图像分类项目

图像分类学习摘要：本文系统梳理了图像分类的核心知识，包括三层分类境界（通用分类、细粒度分类、实例级分类）、基于混淆矩阵的关键评估指标（准确率、召回率、F1值等），以及模型基础概念（网络深度与宽度）。针对小样本问题，提出迁移学习和数据增强两大解决方案：前者利用预训练模型迁移特征，后者通过几何/像素变换或GAN生成扩充数据。为图像分类项目实践提供了完整的理论框架与落地方法。

2025-09-25 11:55:29 363

原创 PyTorch 数据处理与 TensorBoard 可视化

本文介绍了PyTorch的数据处理工具与可视化方法。在数据处理方面，主要包含两个模块：1）utils.data模块提供基础数据加载功能，包括自定义Dataset类和批量处理DataLoader；2）torchvision模块专用于图像处理，支持预处理变换和分类图像读取。可视化部分重点讲解了TensorBoard的使用，包括模型结构可视化、训练损失记录和特征图展示等核心功能。文章提供了完整的代码示例，涵盖数据加载、预处理到模型分析的全流程实现。

2025-09-24 12:03:36 339

原创 Pytorch神经网络工具箱（续）

本文介绍了PyTorch中构建神经网络模型的进阶方法。主要内容包括：1）通过继承nn.Module基类并结合三种模型容器（nn.Sequential、nn.ModuleList、nn.ModuleDict）实现模块化建模；2）详细说明残差块和ResNet18的实现，包括基础残差块、下采样残差块及其组合方式；3）概述模型训练核心流程，涵盖数据准备、损失函数、优化器配置等关键步骤；4）提供三种构建nn.Sequential的具体代码示例（直接参数、add_module方法和OrderedDict）。这些方法可提

2025-09-23 11:48:04 971

原创 PyTorch 神经网络工具箱

本文介绍了神经网络的核心组件与构建方法。核心组件包括层、模型、损失函数和优化器；构建工具主要涉及nn.Module和nn.functional。模型构建可采用继承基类、Sequential顺序构建或组合方式。以残差块为例说明自定义模块的实现，包括基础块和下采样块。最后概述了标准训练流程：数据准备、定义损失、选择优化器、循环训练验证及结果可视化。全文系统性地讲解了神经网络从组件到应用的完整知识体系。

2025-09-22 11:50:14 366

原创卷积神经网络核心基础

摘要：卷积神经网络通过共享参数和池化技术有效解决了全连接层处理图像时的参数爆炸问题，保留空间结构信息。其核心设计遵循视觉认知的平移不变性和局部性原则。卷积层利用多通道计算、填充与步幅控制特征图维度，而池化层通过最大/平均下采样进一步降低计算量并增强平移鲁棒性。这些机制使CNN成为计算机视觉任务的高效解决方案。

2025-09-19 11:33:36 502

原创多层感知机

感知机是神经网络的基础单元，1957年由Frank Rosenblatt提出，通过权重和偏差实现二分类任务，可构建逻辑门电路。但单层感知机无法解决线性不可分问题（如异或门），为此发展出多层感知机。多层感知机通过隐藏层和非线性激活函数（如ReLU、tanh）实现复杂分类，输出层可采用Softmax处理多分类。训练过程包括前向传播、反向传播和参数更新，需平衡模型复杂度以防止过拟合/欠拟合，通过数据集划分和交叉验证优化性能。多层感知机是最简单的深度神经网络，突破了单层感知机的局限性。

2025-09-18 11:33:11 468

原创线性回归与 Softmax 回归

文章摘要：本文系统介绍了线性回归与Softmax回归的核心原理与应用。线性回归通过权重矩阵实现连续值预测，可视为单层神经网络；Softmax回归则适配多分类任务，通过Softmax运算输出概率分布。优化算法方面重点讲解了梯度下降及其变种，强调学习率与批量大小的选择策略。损失函数部分对比了平方损失、L1损失、Huber损失和交叉熵损失的特点。全文揭示了这些基础模型与神经网络的内在关联，为理解深度学习奠定了基础。（148字）

2025-09-17 11:29:17 1162

原创深度学习预备知识

人工智能领域快速发展，深度学习成为核心技术。本文系统梳理了AI领域职业需求、工业文明与AI发展脉络、机器学习与深度学习的核心概念及应用。重点分析了机器学习的数据、模型、目标函数等核心构成，以及监督学习、无监督学习、强化学习三大类型。同时介绍了深度学习的成功案例、图灵测试和主流的PyTorch框架，展现了AI从理论到应用的完整知识体系。

2025-09-16 11:32:16 844

原创支持向量机（SVM）内容概述

本文系统介绍了支持向量机(SVM)的核心原理与优化方法。SVM旨在寻找能最大化分类间隔的划分超平面，关键点包括：1)通过拉格朗日乘子法求解最优超平面；2)引入软间隔处理噪声样本，平衡分类精度与泛化能力；3)采用核函数将低维不可分数据映射到高维空间实现线性可分。文章遵循"问题-目标-求解-优化"的逻辑，完整呈现了SVM从理论推导到实际应用的完整框架，重点阐述了其数学基础与解决非线性问题的关键技术，为理解这一重要分类算法提供了清晰路径。

2025-08-26 13:15:26 469

原创朴素贝叶斯总结

本文介绍了朴素贝叶斯算法的核心内容：1）通过学生穿长裤案例推导贝叶斯公式，展示如何计算条件概率；2）应用实例包括拼写纠正和垃圾邮件分类，解释了先验概率和似然概率的作用；3）详细说明三种朴素贝叶斯类型（多项式、高斯、伯努利）的适用场景和sklearn参数；4）提供模型常用方法及手写数字识别练习。内容涵盖理论推导、实际应用和代码实现，系统介绍了朴素贝叶斯算法的原理和使用方法。

2025-08-25 11:34:06 1034

原创线性回归的学习

线性回归是一种通过特征线性组合进行预测的模型，其目标是找到最优线性关系使预测误差最小。单特征模型为f(x)=W₀+W₁x，多特征扩展为f(x)=w₁x₁+...+w_dx_d+b。最小二乘法通过最小化均方误差求解参数，得到系数w和截距b的解析解。评估指标包括残差平方和(SSE)、均方误差(MSE)和决定系数(R²)，其中R²衡量模型解释能力。多元回归采用矩阵形式Ŷ=Xw简化计算。实践案例展示了使用scikit-learn进行房价预测的方法，包括参数设置和评估指标应用。

2025-08-22 11:23:20 664

原创机器学习--续

从 “弱学习器”（性能略优于随机猜测的模型）开始，通过迭代调整样本权重与学习器权重，逐步提升模型性能，最终融合为 “强学习器”。流程：通过有放回采样生成多个不同的训练集，并行训练多个个体学习器，最终用 “投票法”（分类）或 “简单平均法”（回归）融合结果。加权平均法：对回归 / 分类任务，根据个体学习器的性能（如准确率）分配不同权重，加权求和得到最终结果（性能越好，权重越高）。投票法：对分类任务，采用 “少数服从多数” 原则，统计所有个体学习器的预测类别，得票最多的类别为最终结果。分阶段融合多种学习器；

2025-08-21 11:47:12 1112

原创数据预处理核心技术—— 从数据变换到特征处理

本文介绍了三种常见的数据预处理方法：归一化、标准化和二值化。归一化通过MinMaxScaler将特征值映射到指定区间（默认[0,1]），消除量纲差异；标准化使用StandardScaler转换为标准正态分布（均值0，标准差1），适用于依赖距离计算的模型；二值化通过Binarizer按阈值将连续特征转换为0/1值。文章详细说明了每种方法的实现步骤、参数设置和注意事项，并展示了在泰坦尼克号数据集上的完整预处理流程，包括缺失值填补、标准化和二值化的串联操作，最后总结了数据预处理的核心目标和工具链使用逻辑。

2025-08-20 12:44:45 804

原创决策树的学习（二）

本PPT系统讲解决策树算法的核心原理与工程实践。重点剖析ID3、C4.5、CART三种算法的划分标准及其优缺点，针对连续值处理和过拟合问题，提出离散化方法和剪枝策略（预剪枝/后剪枝）。通过Python代码演示了决策树在泰坦尼克数据集上的完整实现流程，包括数据预处理、参数调优（max_depth、criterion等）和模型评估。最后结合网格搜索优化超参数，展示了从理论到实践的完整落地过程，为机器学习基础算法提供实用参考框架。

2025-08-19 11:49:56 1158

原创决策树的学习

本文系统讲解了决策树算法的核心概念与应用。决策树通过根节点、非叶子节点和叶子节点构成树形结构，训练阶段关键在于特征切分，使用信息增益选择最优特征（如计算熵值变化）。实例演示了基于天气等特征构建"是否打球"决策树的过程，包括初始熵计算、条件熵分析和信息增益比较。最后通过鱼类判断练习巩固特征选择与信息增益计算等知识点，体现从理论到实践的学习路径。

2025-08-18 12:56:37 844

原创《机器学习之 K 近邻算法（KNN）》

本文介绍了K近邻算法(KNN)的原理及应用。首先通过电影评分案例引出分类问题，然后详细讲解KNN算法步骤：计算距离、排序选取K个最近邻、统计类别频率进行预测。重点阐述了欧式距离和曼哈顿距离两种度量方式。最后通过鸢尾花分类和电影类型判断两个实例，展示了KNN的实际应用过程，包括数据划分、模型训练、评估及K值选择优化。文中还给出了完整的Python实现代码，包括数据集加载、模型训练、交叉验证和可视化分析，帮助读者理解如何选择最优K值以提高分类准确率。

2025-08-15 11:07:17 975

原创机器学习（一）

本文系统介绍了机器学习的基础知识与应用。首先以AlphaGo为例，说明机器学习是通过历史数据训练模型来提升任务效果的过程。其次介绍了机器学习在模式识别、NLP等领域的广泛应用。然后详细讲解了数据集、样本、特征等基本术语，以及监督学习（分类/回归）和无监督学习（聚类/关联）等主要学习类型。最后阐述了模型评估指标（错误率、查准率等）、拟合问题（欠/过拟合）及评估方法（留出法、交叉验证），强调需根据具体任务选择合适算法。全文通过西瓜数据集等实例，为机器学习入门提供了系统框架。

2025-08-14 11:35:38 815

原创电商双11美妆数据分析（二）

本文基于电商双11美妆销售数据，通过Python数据处理和可视化分析，揭示了以下关键发现：1）数据处理方面，使用jieba分词构建商品分类体系，新增性别标签和销售额特征；2）品牌分析显示相宜本草性价比最高，部分品牌可能存在刷单行为；3）护肤品占主导地位（超70%销量），清洁类和补水类最受欢迎；4）男士专用商品仅占8%，但清洁类产品需求突出；5）销售高峰出现在双11前（9日），而非活动当天。分析采用pandas、matplotlib等技术，为美妆电商的品类布局和营销策略提供了数据支持。

2025-08-13 10:31:38 1002

原创电商双11美妆数据分析（一）

本文对双十一淘宝美妆数据进行了清洗和分析。原始数据包含27598条记录，经过去重（删除86条）和缺失值填补处理后，利用jieba分词对商品标题进行关键词提取，并基于自定义分类词典将商品划分到护肤品和化妆品等大类。数据分析显示：相宜本草销量和销售额均居首，而SKII等品牌销量为零；价格亲民的品牌（0-200元区间）贡献了主要销售额；护肤品占总销量的绝对优势，其中清洁类和补水类产品最受欢迎。可视化分析揭示了价格、销量与销售额之间的关联性，为美妆电商运营提供了数据支持。

2025-08-12 14:12:01 753

原创数据科学与计算的一些实践案例

本文介绍了一个完整的中国大学排名数据爬取与分析案例。通过Python的Requests和BeautifulSoup库爬取高三网上的大学排名数据（包含820所学校的名称、总分、排名等信息），将数据存储为CSV文件。针对数据中的缺失值提供了四种预处理方法：删除空值行、文本替换、均值和中位数填充。最后利用Matplotlib对学校星级分布进行了可视化分析，包括柱状图、横向柱状图和饼图三种形式。该案例展示了从数据爬取、清洗到分析可视化的全流程，是数据科学领域的典型实践案例。

2025-08-11 13:03:17 941

原创数据科学与计算Matplotlib；Seaborn

本文介绍了Matplotlib和Seaborn两大Python可视化工具的核心功能。Matplotlib部分重点讲解了图像处理三函数：imshow()用于显示图像（支持灰度/彩色/热力图等），imsave()保存图像文件，imread()读取图像数据并支持修改（亮度调整/裁剪/颜色变换）。Seaborn部分则阐述了其作为统计可视化库的优势，包括主题设置、6种常用图表类型（散点图、折线图、柱状图、箱线图、热图、小提琴图）的实现方法，通过示例代码展示如何快速创建美观的统计图形。全文通过具体代码演示了从基础图像处

2025-08-08 13:34:20 597

原创数据科学与计算--Matplotlib

本文介绍了Python数据可视化库Matplotlib的基础与应用。主要内容包括：1)Matplotlib的安装导入方法；2)核心绘图功能如plot()函数、图表元素设置；3)多图绘制与常见图表类型（散点图、柱状图、饼图等）；4)图像显示与处理操作。最后通过三个实践案例（正余弦图、价格柱状图、运动喜好饼图）展示了Matplotlib的具体使用，包含完整代码示例。该教程适合初学者快速掌握Matplotlib的数据可视化基本技能。

2025-08-07 14:10:33 669

空空如也

空空如也