XIAO·宝-CSDN博客

原创深度学习------U-net系列算法

本文介绍了U-net系列网络在图像分割中的核心原理与应用。U-net凭借其U型架构（编码-解码+特征拼接）成为经典，编码路径压缩特征，解码路径还原尺寸，通过特征拼接结合细节与语义信息实现精准分割。U-net++通过多路径特征融合和深度监督进一步提升精度和稳定性。U-net+++则更灵活地整合不同尺度特征。对于新手，关键在于理解U型核心架构、特征拼接的重要性，并根据任务需求选择版本：简单任务用U-net，高精度要求用U-net++，复杂场景尝试U-net+++。掌握这些核心逻辑能够有效入门图像分割领域。

2025-10-31 11:45:01 882

原创深度学习------图像分割项目

图像分割是给每个像素分类的计算机视觉任务，比目标检测更精细，主要分为语义分割（分类不区分个体）、实例分割（区分个体）和全景分割（综合前两者）。常用数据集包括VOC（入门）、Cityscape（街景）和COCO（复杂场景）。核心技术是转置卷积，用于将压缩的特征图还原至原图尺寸。评估指标包括像素精度（PA）和交并比（IoU/mIoU）。建议新手从理解基本概念开始，明确任务类型后再选择对应数据集和方法。

2025-10-29 13:42:24 720

原创深度学习------《第三篇》

本文探讨了使用YOLOv5进行口罩检测训练时需掌握的基础知识。文章指出，许多新手直接调参往往效果不佳，关键在于理解深度学习基础概念。重点分析了三个核心环节：数据预处理（图像尺寸统一、数据增强、标签格式处理）、模型结构（卷积层、激活函数、损失函数）和训练过程（批次迭代、学习率调度、EMA）。作者以实际案例说明，只有吃透这些基础原理，才能真正理解代码逻辑，避免常见错误，提高模型检测精度和稳定性。

2025-10-28 15:04:56 502

原创深度学习------《YOLOv5源码》

本文拆解了YOLOv5网络结构的3个核心模块：Focus模块通过分块拼接降低计算量；BottleneckCSP采用分块两路计算减少冗余；PAN结构实现多尺度特征双向融合。文章推荐使用Netron+ONNX工具可视化网络结构，并建议新手先理清整体架构，再重点理解核心模块的设计思想。通过分析各模块的工作原理，揭示了YOLOv5在保持精度的同时提升速度的关键技术，为初学者提供了清晰的学习路径。

2025-10-28 14:58:00 965

原创深度学习------YOLOv5《第二篇》

本文深入解析YOLOv5中马赛克数据增强的核心实现。该技术通过拼接图片形成大训练样本，提升目标密度和场景多样性，降低小目标漏检率。关键点包括：随机生成拼接中心坐标；计算图像放置区域和偏移量；将目标框坐标从小图映射到大图；边界修正和二次增强。文章详细剖析了图像拼接逻辑、标签坐标转换公式(padw/padh偏移量计算)，以及PyTorch特有的实现方式。该增强技术通过;拼接-坐标映射-边界修正流程，显著提升模型训练效果。

2025-10-24 16:04:06 932

原创深度学习------YOLOv5《第一篇》

《YOLOv5口罩检测的数据准备术》摘要：训练YOLOv5进行口罩检测的关键在于数据预处理。首先需统一图像尺寸，采用letterbox方法保持比例填充，避免变形；其次需规范标注格式，使用相对坐标比例确保标签通用性，并进行严格的质量检查。数据增强环节通过Mosaic拼图、亮度/色调调整、小角度旋转等手段提升模型鲁棒性，但需控制增强幅度以防失真。采用缓存机制可加速数据加载过程。这些预处理步骤如同为模型打造优质的学习资料，直接影响最终的检测精度和泛化能力。

2025-10-23 19:19:44 722

原创深度学习------YOLOv4

YOLOv4实战笔记：单GPU训练的高精度目标检测方案 YOLOv4通过BOF和BOS两大模块优化，在保持单GPU训练的优势下显著提升检测性能。BOF模块包含Mosaic数据增强（提升小目标检测率8-17%）、DropBlock正则化（减少过拟合7%）和CIoU损失函数（加速收敛1倍）等;免费午餐;技术；BOS模块则通过CSPNet（训练提速33%）、PAN特征融合（小目标检测率+15%）和SPP多尺度池化等技术进一步提升精度。相比YOLOv3，mAP提高近10个百分点，在COCO数据集

2025-10-20 16:06:56 872

原创深度学习------YOLOV3

YOLOv3通过三大核心改进显著提升了小目标检测和整体精度：1）采用多尺度特征融合（52×52/26×26/13×13三级特征图），实现大小目标兼顾检测；2）引入残差网络Darknet-53，通过跳层连接解决深层网络梯度消失问题；3）优化先验框设计（9种尺寸）并改用Logistic分类，提升定位精度和多标签识别能力。相比前代，v3在保持实时性的同时将mAP提升近10个百分点，其创新主要在于对经典技术（多尺度、残差等）的系统性整合而非框架颠覆。学习重点应把握多尺度分工、残差机制和先验框优化三大核心改进。

2025-10-17 19:14:42 763

原创深度学习------YOLOV1和YOLOV2

本文解析了YOLO目标检测算法从v1到v2的核心改进。YOLOv1开创性地将检测任务转化为网格回归问题，实现实时检测，但仍存在小目标漏检、定位精度不足等问题。YOLOv2通过引入锚框+K-Means聚类、批量归一化、细粒度特征融合和多尺度训练等关键技术，显著提升了检测精度和速度。文章重点比较了两个版本在算法设计、损失函数和网络结构上的差异，并建议新手从理解v1的网格回归机制入手，再逐步掌握v2的优化思路。全文通过实例说明各改进点的实际效果，为初学者提供了清晰的学习路径。

2025-10-16 14:52:32 682

原创深度学习------目标检测项目

目标检测是计算机视觉中的关键任务，需要同时完成物体识别和定位。本文介绍了5个核心概念：边界框（标定目标位置）、交并比（评估定位精度）、锚框（预设检测基准）、单/双阶段算法（精度与速度权衡）以及训练/推理流程。同时强调了数据处理的重要性，包括精确标注和带框数据增强。相比图像分类，目标检测更复杂，但掌握这些基础知识能帮助新手快速入门。文章还提供了实际项目中的代码示例和常见问题解决方案，为初学者梳理了清晰的学习路径。

2025-10-15 14:20:27 663

原创深度学习------专题《使用模型和集成方法》

这篇深度学习入门指南总结了从环境配置到模型集成的关键预备知识：1. 工具准备：介绍了PyTorch核心模块(nn/optim)和辅助库(numpy/torchvision)的用途；2. 模型构建：通过CNNNet、LeNet等实例讲解卷积层、池化层的组合逻辑；3. 数据处理：详述CIFAR10数据集的增强变换和DataLoader分批加载；4. 集成方法：展示多模型投票如何提升预测准确率。文章强调理解这些基础模块（如张量形状变化、数据增强原理）对后续复杂任务的重要性，为深度学习实践打下坚实基础。

2025-10-14 16:11:15 911

原创深度学习------专题《神经网络完成手写数字识别》

摘要：本文分享了使用PyTorch实现手写数字识别的深度学习入门实战经验。通过MNIST数据集，详细介绍了从数据准备、模型构建（包含两层隐藏层和BatchNorm）到训练验证的全过程。关键点包括：使用ReLU激活函数和Softmax输出层，采用交叉熵损失和SGD优化器，实现训练损失可视化。该案例帮助初学者理解神经网络的工作原理，掌握quot数据处理→模型构建→训练验证quot的核心流程，为后续更复杂的深度学习项目打下基础。

2025-10-13 14:21:18 874 3

原创深度学习------专题《图像处理项目》终！

本文分享了使用PyTorch进行CNN模型参数可视化和训练调优的实战经验。作者开发了一个类似Keras的model.summary()函数，通过钩子(hook)机制记录各层输入输出形状、参数数量等关键信息，帮助理解模型结构。在训练优化方面，对比了SGD和Adam优化器的表现，强调了梯度清零(optimizer.zero_grad())的重要性，并分析了损失曲线的学习状态。最后提出后续优化方向，包括增加训练轮数、使用TensorBoard可视化等，强调了深度学习需要深入理解模型和训练过程。

2025-09-28 11:24:28 944

原创深度学习------专题《图像处理项目》下

本文介绍了CIFAR-10分类模型测试与优化过程。首先通过测试集评估模型整体准确率为66%，并发现模型对汽车（82%）识别较好，但对猫（45%）等细节多的类别表现欠佳。随后采用全局平均池化（GAP）替代全连接层，使参数量减少90%的同时准确率提升至70%。文章强调分类模型需细粒度评估，并验证了GAP在简化模型结构和防止过拟合方面的优势，为后续针对性优化（如数据增强）提供了方向。整个实验过程展现了模型性能诊断与优化的典型思路。

2025-09-27 15:42:06 780

原创深度学习------专题《图像处理项目》

本文详细记录了使用PyTorch实现CIFAR-10图像分类的完整流程。从数据预处理（transforms标准化）、Dataset加载到CNN网络搭建（两层卷积+池化+全连接），再到训练过程中的损失函数选择、优化器调参等关键步骤。作者分享了实际踩坑经验，如忘记梯度清零导致训练失败、数据标准化对收敛速度的影响等。最终模型测试准确率约50%，并提出了增加训练轮数、优化网络结构等改进方向。文章为深度学习初学者提供了从理论到实践的系统指导，特别强调了数据可视化验证和训练细节的重要性。

2025-09-26 16:42:21 1092

原创深度学习------图像分类项目

本文分享了图像分类项目的学习经验，重点梳理了三个核心内容：1）图像分类的三个层次（通用分类、细粒度分类、实例级识别）及各自特点；2）关键评估指标（准确率、精确率、召回率、F1）的选择与应用场景；3）解决样本不足的实用方案（迁移学习和数据增强）。作者通过自身踩坑案例，强调新手应重点掌握评估指标和样本增强技术，建议从基础分类任务入手循序渐进。全文提供了从理论到实践的完整学习路径，对初学者具有指导意义。

2025-09-25 13:45:53 547

原创深度学习------Pytorch数据处理工具箱

本文介绍了PyTorch数据处理的核心工具及标准化流程。这些工具的组合使用可显著简化从数据准备到模型训练的全过程。

2025-09-24 16:40:40 822

原创深度学习------Pytorch神经网络工具箱

本文总结了搭建神经网络的实用技巧，重点介绍了PyTorch的核心组件和工具。系统性地讲解了神经网络的四大核心组件（层、模型、损失函数、优化器）及其作用，并对比了nn.Module和nn.functional两大工具的特点与适用场景。文章还提供了三种构建模型的具体方法（继承nn.Module、使用nn.Sequential、结合模型容器），以MNIST手写数字识别为例详细说明实现代码，并给出不同复杂度的模型选择建议。最后作者强调打印模型结构查错的重要性，建议新手从简单模型入手逐步提升复杂度。

2025-09-22 15:24:35 816

原创深度学习------卷积神经网络

本文分享了学习卷积神经网络(CNN)的入门笔记，重点对比了CNN与多层感知机(MLP)处理图像的差异。作者通过具体案例说明MLP将图像展平为向量会丢失空间信息，导致参数量过大且识别效果差；而CNN通过"平移不变性"和"局部性"原则，像人类视觉一样分层处理图像。文章详细解析了CNN的核心组件：卷积层通过参数共享提取特征，池化层降低维度保留关键信息，并介绍了从LeNet到VGG的架构演进。最后作者强调CNN能自动学习分层特征，计划动手实践LeNet模型来巩固理解。

2025-09-19 14:12:27 760

原创深度学习------多层感知机

本文结合入门学习经历，从感知机入手，先介绍其原理及实现与门、或门等简单逻辑门的方法，再点出其 “线性不可分” 的局限性 —— 无法实现异或门。由此引出多层感知机，讲解其通过增加隐藏层组合特征、搭配激活函数（如 ReLU、sigmoid）提供非线性能力，从而解决非线性问题的核心逻辑。还分享实战细节：隐藏层数量与神经元个数的超参数选择思路，前向传播算预测、反向传播调参数的训练流程，以及用验证集、K 折交叉验证、权重衰减等应对过拟合 / 欠拟合的方法。

2025-09-18 16:17:20 733

原创深度学习------线性回归和softmax回归

本文结合入门学习经历，拆解深度学习中线性回归与 Softmax 回归两大基础模型。线性回归适用于房价预测等 “连续值估算” 任务，核心是 y=Xw+b 公式，通过平方损失衡量误差，依赖梯度下降优化参数，需重点调整学习率与批量大小；Softmax 回归针对手写数字分类等 “离散类别判断”，借 Softmax 运算将输出转为概率，用交叉熵损失优化，输出层神经元数需匹配类别数。文章明确两者适用场景差异，计划用 PyTorch 动手实践，帮助入门者清晰区分模型用法，避免混淆。

2025-09-17 15:28:26 1107

原创深度学习------预备知识

本文结合入门学习经历，从工业文明演进切入，点明人工智能时代已融入生活（如智能闹钟、人脸识别等）。通过 “唤醒小爱同学” 的案例，厘清人工智能与机器学习的关系，拆解机器学习 “数据、模型、目标函数、优化算法” 四大核心组件，解释典型训练过程。还介绍了监督学习（回归、分类等）、无监督学习、强化学习等任务类型，分析深度学习因数据量激增与 GPU 算力普及而爆发的原因，提及 ImageNet、AlphaGo 等案例，并说明选择 PyTorch 作为入门工具的理由，帮助新手从生活逻辑理解深度学习基础。

2025-09-16 13:44:30 939

原创机器学习--支持向量机

这篇文章深入浅出地讲解了支持向量机（SVM）的核心原理：通过寻找使间隔最大化的最优超平面来实现分类。作者从直观理解入手，逐步拆解关键概念如间隔、支持向量、优化目标等，并介绍了软间隔和核函数等进阶技巧。文章强调SVM“关注关键样本”的极简主义思想，以及数学推导如何服务于解决实际问题。整体内容条理清晰，既有理论深度又保持了可读性，适合机器学习初学者理解SVM的本质思想。

2025-08-26 13:49:34 1068

原创机器学习--朴素贝叶斯

本文记录了机器学习中朴素贝叶斯算法的学习过程，从基础的贝叶斯思想切入，通过 “摸球”“校园性别与着装” 等案例，清晰拆解正向概率与逆向概率的区别，推导贝叶斯公式核心逻辑 —— 用先验概率、似然概率结合观测信息计算后验概率。进而讲解朴素贝叶斯的 “朴素假设”（特征独立），并结合拼写纠正（如判断 “tlp” 应为 “top” 还是 “tip”）、垃圾邮件分类（通过邮件单词判断是否为垃圾邮件）两个实例，说明其实际应用原理。还介绍了适配不同数据类型的三种朴素贝叶斯模型（多项式、高斯、伯努利）的适用场景与关键参数。

2025-08-25 11:30:19 746

实战：豆瓣电影 Top250 爬取秘籍 -XPath 和 URL 不动，轻松拿下 10 页数据的偷懒技巧

用 Navicat 玩转正 MySQL 实验：从建表到 30 个查询的实操笔记

空空如也