尤超宇-CSDN博客

原创 U-net 系列算法知识解读

核心过程：U-net 的整体结构核心就是 “编码 - 解码”。你可以把这个过程想象成先 “拆” 后 “装”。编码阶段就像把一张完整的图片拆开，一步步提取图片里的关键特征，比如图片里物体的边缘、纹理这些；解码阶段就是把提取到的这些特征再重新组合起来，还原出和原图对应的分割结果，比如在医学影像里，标出哪里是肿瘤、哪里是正常组织。特点：结构简单但特别实用，应用范围很广。应用起源与现状：最开始是为了解决医学影像分割问题而生的，直到现在，在医学领域的应用依然很广泛，比如给 CT 影像、病理切片做分割。

2025-10-31 16:34:58 707

原创 YOLOv5模型的故事：智能城市守护者的诞生

精心设计的组织架构（网络结构）系统化的培训流程（训练策略）持续的优化改进（超参数调优）最终成为智慧之城中不可或缺的安全保障力量，24小时不间断地守护着城市的安全与秩序。

2025-10-27 16:18:46 490

原创 YOLOv3 目标检测算法核心技术

全卷积 + 残差连接：保证特征提取深度与效率；3 尺度特征融合：解决小目标检测痛点；9 种先验框：提升目标定位精度；Logistic 激活：支持多标签检测；速度 - 精度平衡：适配多场景需求。

2025-10-17 16:56:49 1691 1

原创基于卷积神经网络的 CIFAR-10 图像分类实验报告

本实验基于 PyTorch 深度学习框架，设计并实现了一款轻量级卷积神经网络（CNN），用于解决 CIFAR-10 数据集的 10 分类任务。实验通过数据标准化预处理、多轮迭代训练、GPU 加速计算等手段，完成了模型的构建、训练与测试。结果表明，经过 10 轮训练后，模型损失值从初始的 1.8 左右降至 0.8 以下，在测试集上对随机抽取的 4 个样本实现了 75% 以上的分类准确率，验证了轻量级 CNN 在小尺寸图像分类任务中的有效性。

2025-09-26 17:34:27 1172

原创【无标题】

3. 继承nn.Module + 模型容器：平衡灵活与简洁，在nn.Module类中用nn.Sequential/nn.ModuleList/nn.ModuleDict打包部分层（如Model_lay类用self.layer1 = nn.Sequential(...)），既减少forward中的重复代码，又保留自定义逻辑的能力，适合中等复杂度模型。• 模型类的forward方法（层的执行顺序），对应“训练阶段”的正向传播（从输入到预测值的计算流程）。

2025-09-22 16:58:36 527

原创卷积神经网络（CNN）演进与核心原理解读

当处理3600万像素的RGB图像时，即使只使用100个神经元的单隐藏层，参数量也会达到惊人的36亿个，这远超过地球上猫狗的实际数量。这种参数爆炸现象揭示了全连接网络处理图像数据的低效性——它通过展平操作完全破坏了图像的空间结构信息，而图像的空间局部性和平移不变性正是视觉识别的关键特性。CNN的发展不仅推动了计算机视觉领域的进步，更引领了深度学习的复兴，其核心思想（参数共享、局部连接、分层抽象）已渗透到语音识别、自然语言处理等领域。这种分层抽象能力模拟了人类视觉系统的处理方式，是CNN强大表征能力的核心。

2025-09-19 16:47:21 1032

原创多层感知机技术报告

摘要：本文系统介绍了感知机与多层感知机的基础原理及应用。感知机作为神经网络基础模型，通过权重和偏差实现二分类，但存在线性不可分问题（如异或门）。多层感知机通过引入隐藏层和激活函数（如ReLU、tanh）解决这一局限，能处理复杂非线性问题。文章详细阐述了模型学习过程（前向/反向传播）、评估方法（交叉验证）及过拟合/欠拟合的解决方案（权重衰减、暂退法）。最后强调需平衡模型复杂度与数据复杂度，选择合适的超参数以构建性能优良的网络模型。

2025-09-18 15:00:17 967

原创线性回归与 Softmax 回归技术报告

本报告详细介绍了线性回归和 Softmax 回归两种基础的深度学习模型。线性回归主要用于解决回归任务，通过建立输入特征与连续输出值之间的线性关系，利用梯度下降类优化算法最小化损失函数（如平方损失、L1 损失、Huber 损失）来确定模型参数。它可以看作是最简单的神经网络，为更复杂神经网络的学习奠定了基础。

2025-09-17 16:21:46 776

原创 SVM 分析 Auto-MPG 数据集代码全解析

三、SVM 分类：优化目标可视化函数 visualize_svm_margin_classification(df)该函数通过 “高 / 低油耗” 二分类任务，直观展示 SVM 分类的核心目标 ——最大化间隔，并标记支持向量，帮助理解 SVM 如何通过支持向量确定决策边界。例如，若 w = [-1.2, -0.8]，则 ||w|| = sqrt((-1.2)^2 + (-0.8)^2) ≈ 1.442，间隔宽度 ≈ 2 / 1.442 ≈ 1.387，间隔越大，模型泛化能力越强。

2025-08-26 18:36:08 808

原创波士顿房价线性回归预测讲解

这些指标从不同角度衡量模型的预测效果，其中 R² 值越接近 1 表示模型拟合效果越好。：展示预测误差的分布情况，理想情况下残差应随机分布在 0 值附近，无明显规律。：直观展示预测值与实际值的吻合程度，理想情况下点应分布在红色参考线附近。这些可视化图表帮助我们更直观地理解模型性能和特征影响。：展示各特征对房价的影响方向和大小。：按系数绝对值展示各特征的影响程度。

2025-08-22 18:52:38 364

原创 K 均值聚类（K-Means）演示，通过生成笑脸和爱心两种形状的模拟数据，展示了无监督学习中聚类算法的效果。以下是详细讲解：

生成两种空间上分离的形状（笑脸和爱心）数据，然后用 K 均值聚类算法自动将它们分为两类，验证聚类算法对 “空间分离明显的数据” 的分类能力。时，K 均值聚类能非常准确地将其划分为不同类别，聚类中心也会落在每个类别的 “密集区域中心”。用不同颜色展示聚类结果（0 和 1 类），黑色 “X” 标记聚类中心。用蓝色标记笑脸点，红色标记爱心点，清晰展示两种形状的空间分布。：用三角函数生成圆形轮廓，上移 0.5 单位，添加噪声。：生成更小的爱心内部点，使形状更丰满。：用三角函数生成下半圆，再添加噪声。

2025-08-21 19:05:43 472 1

原创基于随机森林的红酒分类与特征重要性分析

本次实验所使用的红酒数据集来自 scikit-learn 库，包含了 178 个样本，每个样本对应一款红酒，并标注了其所属类别（共 3 类）。数据集中的特征均为红酒的理化指标，具体包括酒精含量、苹果酸含量、灰分、灰分的碱度、镁含量、总酚、类黄酮、非黄烷类酚类、原花青素、颜色强度、色调、稀释葡萄酒的 OD280/OD315 值以及脯氨酸含量等 13 项指标。这些客观的理化数据为我们构建分类模型提供了坚实的基础。

2025-08-21 19:03:07 1013

原创详解 scikit-learn 数据预处理工具：从理论到实践

在机器学习工作流程中，数据预处理是连接原始数据与模型训练的关键桥梁。高质量的预处理能够显著提升模型性能，而 scikit-learn 库提供了一套全面且高效的预处理工具集，帮助开发者轻松应对各种数据转换需求。本文将系统介绍 scikit-learn 中 17 种常用预处理工具的原理与实践应用，通过实例代码展示其具体用法。

2025-08-20 18:30:48 899

原创基于决策树模型的汽车价格预测分析

这份代码实现了一个完整的机器学习预测流程，核心目标是通过汽车的各项特征预测其价格。这一步的目标是创建一个贴近真实的汽车数据集，包含影响价格的关键特征和目标变量（价格）。预处理是将原始数据转换为模型可输入的格式，包括缺失值处理、分类变量编码等。），因为它能很好地捕捉特征与价格之间的非线性关系，且结果易于解释。通过可视化理解数据分布和特征关系，为建模提供依据。使用决策树回归器构建预测模型，并评估其性能。R²提升至≈0.88。

2025-08-19 17:47:04 903

原创熵（Entropy）和信息增益（Information Gain）的计算

公式：\(H(X) = -\sum_{i=1}^{n} p_i \log_2(p_i)\) 其中：\(p_i\) 是第 i 类样本在总样本中的占比（\(0 \leq p_i \leq 1\)）。：衡量某特征对降低不确定性的贡献，值越大，该特征越适合作为当前节点的划分依据。公式：\(IG = 初始熵 - 按该特征划分后的加权熵\)二、用课堂练习数据集实战计算。：和 A=“是” 的计算相同（样本分布一致），\(H3 \approx 0.918\)：和 A=“否” 的计算相同，\(H4 = 0\)

2025-08-18 15:12:50 676

原创机器学习基础讲解

针对特定任务，以大量经验数据为基础。存在衡量任务完成好坏的评判标准。通过分析经验数据，不断优化任务的完成效果。一个广为人知的案例是 2016 年 3 月在韩国首尔，阿尔法围棋（AlphaGo）以总比分 4:1 战胜韩国围棋九段棋手李世石，这正是机器学习在复杂决策领域的精彩应用。从流程上看，机器学习通过对历史数据（经验）进行训练，归纳出规律并构建模型，当输入新的未知数据（属性）时，模型就能做出预测，从而解决新的问题。

2025-08-14 16:06:30 1050

原创销售数据预处理与分析学习总结

通过本次实践，掌握了从数据清洗到可视化分析的完整流程，理解了如何通过 Python 工具（基于标题关键词构建分类规则（大类：护肤品 / 化妆品；小类：乳液类 / 面膜类等），通过。）将原始数据转化为有价值的商业洞察。

2025-08-13 17:00:43 690

原创双十一淘宝美妆数据深度分析：从数据中挖掘消费趋势与品牌策略

高端化（300 元以上品牌贡献高销售额）、护肤主导（护肤品占比超 60%）、男士市场崛起（增速领先）。

2025-08-12 16:55:30 1220

原创车型销售数据爬虫代码详细解释

该函数的作用是建立与目标网站的连接并获取网页内容：。该函数负责将提取的数据保存为 CSV 文件：。主程序定义了整个爬虫的执行流程：。解析函数是数据提取的核心：。

2025-08-11 18:03:30 1252

原创 Pandas：数据科学与计算的利器

Pandas 以其简洁的语法和强大的功能，将数据处理的复杂度大幅降低，让分析师能更专注于业务逻辑而非技术实现。从数据读取、清洗到分析、运算，Pandas 构建了完整的数据分析流水线，是数据科学领域不可或缺的工具。无论是初学者还是资深工程师，掌握 Pandas 都将为数据探索之旅添上关键一笔。编辑分享写一篇介绍Pandas核心数据结构DataFrame的文章分享一些利用Pandas进行数据分析的实际案例详细介绍Pandas中的数据清洗方法。

2025-08-06 18:17:05 751

原创 NumPy 数组操作与字符串函数全解析

NumPy 作为 Python 科学计算的核心库，提供了丰富的数组操作功能和字符串处理工具，极大地简化了数据处理与分析的流程。本文将系统介绍 NumPy 中数组的堆叠、分割、形状调整、元素插入删除，以及字符串处理和数学运算等核心功能，帮助读者快速掌握 NumPy 的实用技巧。

2025-08-04 16:26:21 895

原创 NumPy 数组操作全解析：从广播到堆叠的实用指南

NumPy 提供了丰富的数组操作功能，从广播机制到迭代方法，从形状修改到数组连接，每一种操作都有其特定的应用场景。掌握这些操作技巧，不仅可以提高代码的简洁性和可读性，还能充分发挥 NumPy 的高性能优势。广播机制虽然便捷，但要注意数组形状的兼容性；迭代数组时，注意内存顺序对遍历结果的影响；形状修改函数中，区分返回副本和视图的函数，避免不必要的内存开销；数组连接时，确保输入数组的形状符合堆叠要求。

2025-08-01 18:14:53 1328

原创 NUMPY语言入门

NumPy 是个能方便处理数组和矩阵的工具，用它可以少写很多循环，还有很多数学函数能省事儿。安装可以用 pip 或 conda，导入时通常写成。：有个叫 Ndarray 的 N 维数组，里面装的都是同类型数据，从 0 开始索引。（元素类型）等，能帮我们了解数组的基本情况。

2025-07-31 19:08:03 361

原创 7.29PY mysql基础

复制cmd直接粘贴就可，首先要有python环境。

2025-07-29 18:08:00 672

原创 7.28MySQL代码细节

就是对一堆数据做 “汇总计算”，比如算总和（比如所有商品的总销量）、最大值（比如最高的售价）、最小值、平均值，还有计数（比如有多少种商品）。这些函数会忽略空值，而且可以和 “分组” 一起用，比如按 “店铺” 分组，算每个店铺的平均销量。就是 “查询里套查询”。总的来说，这份文档就是教你怎么用 MySQL 对数据进行增删改查，怎么按条件筛选、汇总数据，以及怎么处理多个表之间的数据关联，都是很基础但常用的操作。当需要同时用多个表的数据时（比如 “销售表” 和 “店铺表”），教你怎么把它们 “连起来” 查。

2025-07-28 17:10:00 441

2301_77510406的博客