zzZ6565-CSDN博客

原创用 PyTorch 训练 NestedUNet 分割细胞核

python运行import osself.img_ids = img_ids # 图像文件名列表（不含扩展名）self.img_dir = img_dir # 图像目录self.mask_dir = mask_dir # 掩码目录self.img_ext = img_ext # 图像扩展名self.mask_ext = mask_ext # 掩码扩展名self.transform = transform # 数据增强器# 读取图像和掩码（转为float32，便于PyTorch处理）

2025-11-03 16:48:03 472 1

原创 U-net 系列算法总结

如果你是语义分割新手，掌握 U-net 系列能帮你快速建立 “分割算法设计” 的核心认知；如果是做项目，U-net++ 的改进思路也能直接用到工程优化中。

2025-10-31 15:31:48 853

原创深度学习图像分割

将图像中的每个像素分配到特定类别，从而实现 “像素级分类”。与图像分类（判断整张图是什么）、目标检测（用框框出目标）不同，图像分割关注 “目标的轮廓边界”，是对图像最细粒度的语义理解。

2025-10-29 14:12:51 988

原创 YOLOv5 核心模块解析与模型可视化实战

Hardswish 是 Swish 激活函数的近似版本，计算方式如下：\(\text{Hardswish}(x) = x \cdot \frac{\max(0, \min(6, x + 3))}{6}\)当\(x \leq -3\)时，输出为 0；当\(-3 < x < 3\)时，输出为\(x \cdot (x + 3)/6\)；当\(x \geq 3\)时，输出为x。

2025-10-27 16:38:55 945

原创 YOLOv4

对比 EfficientDet，它用更高的速度实现了接近的精度，真正做到 “快且准”。提起 YOLOv4，最核心的标签就是 “亲民”。这类改进专注于 “优化训练过程”，通过增强数据多样性、改善损失函数等方式提升精度，推理时完全不增加耗时，是 YOLOv4 的 “性价比之王”。这类改进聚焦 “网络结构优化”，通过增强特征提取能力提升精度，虽然会增加一点推理耗时，但性价比极高。YOLOv4 的改进逻辑非常清晰，分为 “不增加推理成本” 和 “少量增加推理成本” 两类，前者叫。

2025-10-20 14:47:31 378

原创 YOLOv3 “速度与精度”

传统的 Softmax 激活函数假设 “类别互斥”（一个目标只能属于一个类别），但实际检测中，一个目标可能有多个标签（如 “黑色的猫” 同时属于 “猫” 和 “黑色物体”）。这种 “精度不弱于专用高精度模型，速度远超同类” 的表现，让 YOLOv3 成为当时工业界的 “香饽饽”，至今仍在很多实时检测场景中被使用。这种设计让每个特征图都能 “专注” 于自己擅长的目标尺寸，避免了 “大模板匹配小目标” 的浪费，也减少了 “小模板漏检大目标” 的问题。

2025-10-17 14:44:19 770

原创从 YOLOv1 到 YOLOv2：目标检测的早期突破与核心改进

针对 YOLOv1 的局限，YOLOv2（2017 年发表）提出了 8 项关键改进，将 VOC 2007 数据集的 mAP 从 63.4% 提升至 78.6%，同时保持实时性（67 FPS），成为当时单阶段检测的标杆。YOLOv1 发表于 2016 年，首次提出 “将检测任务转化为端到端回归任务” 的思路，彻底摆脱了两阶段算法（如 R-CNN）“生成候选框→分类” 的繁琐流程，实现了 “一眼看穿” 的实时检测。YOLOv2 摒弃了 YOLOv1 的自定义架构，设计了更高效的。

2025-10-16 15:21:03 409

原创目标检测全解析

当数据集包含多个类别时，mAP 是 “每个类别 AP 的算术平均值”，公式为：\(mAP = \frac{AP_1 + AP_2 + ... + AP_n}{n}\)其中n为类别数，mAP 是目标检测算法的核心评测指标（如 COCO 数据集用 mAP@0.5 衡量模型性能）。例如，在一张街景图中，目标检测模型需输出 “汽车（x=100,y=200,w=150,h=100）”“行人（x=400,y=350,w=80,h=180）” 这类结果，既包含类别，也包含位置信息。

2025-10-15 15:37:26 666

原创 PyTorch 实现 MNIST 手写数字识别全流程

设置批次大小、学习率和训练轮数等超参数，这些参数会影响模型的训练过程和结果。python运行本文详细介绍了使用 PyTorch 实现 MNIST 手写数字识别的全流程，包括数据准备、模型构建、训练评估与可视化。通过这个经典任务，能帮助初学者熟悉深度学习图像分类的基本步骤和 PyTorch 的使用方法。在实际应用中，还可进一步优化模型结构、调整超参数或使用数据增强等方法提升模型性能。

2025-10-13 14:19:34 371

原创用 PyTorch 搞定 CIFAR10 数据集

损失函数：衡量模型预测的错误程度（比如预测是 “猫”，实际是 “狗”，损失值就大）；优化器：根据损失函数的 “反馈” 调整模型参数，让损失越来越小（即模型越来越准）。python运行# 1. 学习率：控制参数更新的步长（太小收敛慢，太大可能不收敛，0.001是常用值）LR = 0.001# 2. 损失函数：交叉熵损失（CrossEntropyLoss）# 为什么用交叉熵？适合多分类任务，能有效衡量“预测概率分布”与“真实标签分布”的差异。

2025-09-26 16:27:35 858

原创深度学习图像分类：从基础理论到工业级解决方案

仍以 LeNet 为例，其宽度为：C1 层 6 个通道、C3 层 16 个通道 ——C1 层的 6 个通道可分别学习 “水平边缘”“垂直边缘”“斜线纹理” 等不同低级特征，C3 层的 16 个通道则学习更丰富的组合特征。P-R 曲线以 “Recall（查全率）” 为横轴，“Precision（查准率）” 为纵轴，通过遍历模型的所有预测阈值，绘制出 Precision 随 Recall 变化的曲线。网络宽度指 “每一层网络的通道数”（以卷积层为例），代表模型 “在同一特征层次上能学习到的特征种类”。

2025-09-25 16:33:10 1013

原创 PyTorch 数据处理与可视化工具箱

Dataset__init__：初始化数据（比如加载数据文件、标签）；：按索引返回 1 个样本（核心！数据格式转换也在这做）；__len__：返回数据集总样本数（让程序知道数据有多少）。

2025-09-24 13:45:30 1079

原创 PyTorch 核心工具与模型搭建

如果模型需要 “个性化流程”（比如某一步要先激活再做其他处理），就用这种方法。核心分两步：第一步 “初始化层”—— 在专用函数里定义好所有要用到的层（展平层、全连接层、归一化层等）；第二步 “定义前向传播”—— 明确数据要经过哪些层、按什么顺序走，完全自主控制，能应对大多数基础场景。

2025-09-22 16:02:01 382

原创深度学习入门：卷积神经网络（CNN）

1,-1,-1]）处理一张图片，输出的特征图会清晰显示出物体的边缘（比如猫的轮廓）；CNN 的发展不是一蹴而就的，从 1995 年的 LeNet，到 2012 年的 AlexNet，再到后来的 VGG，每一代架构都在 “更深、更高效” 上做优化。卷积层的核心是 “卷积核”（也叫滤波器），可以理解成一个 “特征探测器”—— 比如有的卷积核专门找边缘，有的专门找纹理，有的专门找颜色斑块。这两个技巧就像 “调整扫地机器人的路线”：填充是 “扩大清扫范围”，步幅是 “加快清扫速度”，能灵活控制特征图的维度。

2025-09-19 15:39:58 629

原创深度学习入门：从感知机到多层感知机，用逻辑电路讲透神经网络的进化

举个直观的例子：如果用 ReLU 当激活函数，隐藏层神经元 h₁的计算就变成 “h₁=ReLU (w₁x₁ + w₂x₂ + b)”—— 这样一来，h₁的输出就有了非线性，后续层再叠加，网络就能处理像异或门这样的复杂问题了。同理，“或门”（只要有一个输入为 1，输出就是 1）只要把偏置调小一点（比如 b=-0.3），“与非门”（和与门相反，两个输入都为 1 时输出 0）把权重设为负数（比如 w₁=-0.5、w₂=-0.5），都能轻松实现。激活函数的作用，就是给网络加入 “非线性”，让它能处理复杂问题。

2025-09-18 16:15:34 889

原创线性回归与 Softmax 回归

—— 这些影响因素就是 “输入特征”，而 “房价” 就是我们要预测的 “连续值”。学会线性回归，能预测房价、销量这些 “连续值”，但如果遇到 “给图片分类（是猫还是狗）”“给评论打分（是好评还是差评）” 这种 “选类别” 的问题，就得靠 Softmax 回归了 —— 它专门解决 “多分类任务”，还能告诉你每个类别的概率。：每次用 32 或 64 个样本算梯度，既比 “每次 1 个样本” 稳定，又比 “每次所有样本” 快，是深度学习的 “默认操作”损失函数就是 “给模型打分” 的工具，线性回归最常用？

2025-09-17 16:07:43 972

原创深度学习学习报告

本次深度学习学习，让我从 “了解概念” 到 “初步应用”，不仅掌握了基础理论和实践技能，更明确了未来的学习和职业方向。作为大学生，我们处于技术创新的黄金时期，深度学习领域充满机遇与挑战。在后续学习中，我将正视不足，持续深耕，努力将所学知识转化为实际能力，为人工智能领域的发展贡献自己的力量，同时也期待通过技术创新，解决更多生活和社会中的实际问题。

2025-09-17 15:33:18 1035

原创支持向量机（SVM）学习报告

有了超平面，就能判断样本类别：把样本\(\boldsymbol{x}\)代入决策函数\(y(\boldsymbol{x}) = \boldsymbol{w}^T\Phi(\boldsymbol{x}) + b\)（\(\Phi(\boldsymbol{x})\)暂时理解为特征处理），如果结果大于 0，样本就是正例（标签\(Y=+1\)）；在机器学习课程的学习中，我接触到了多种分类算法，其中支持向量机（SVM）凭借独特的 “寻找最优划分边界” 思路，在小样本分类任务中表现突出，引起了我的兴趣。

2025-09-04 19:15:21 1116

原创朴素贝叶斯算法学习报告

理解了贝叶斯定理的核心思想，通过正向概率与逆向概率的对比，明确了贝叶斯方法解决逆概问题的优势；掌握了朴素贝叶斯的 “朴素” 假设（特征独立）及其简化计算的作用，通过拼写纠正、垃圾邮件分类等实例，深化了对算法应用逻辑的理解；区分了多项式、高斯、伯努利三种朴素贝叶斯模型的适用场景与参数设置，能够根据特征数据类型选择合适的模型；基于 sklearn 实现了手写数字识别案例，熟悉了朴素贝叶斯模型的核心 API 与实践流程。朴素贝叶斯算法的优点是计算速度快、可解释性强、对小规模数据表现良好；

2025-08-25 17:27:02 1088

原创线性回归学习报告

线性回归是通过属性的线性组合进行预测的线性模型，其核心目标是找到一条直线（单变量场景）、一个平面（双变量场景）或更高维的超平面（多变量场景），使得模型的预测值与数据的真实值之间的误差最小化。例如，在房屋价格预测中，可根据房屋大小这一属性，构建线性模型来预测房屋价格，模型形式如\(f(x)=W_0 + W_1x\)（其中x为房屋大小，\(f(x)\)为预测房价，\(W_0\)、\(W_1\)为模型参数）。

2025-08-25 17:23:26 699

原创集成学习算法学习报告

集成学习并非 “单一算法”，而是一种 “提升模型性能的框架思想”。通过本次学习，不仅掌握了 Bagging、Boosting、Stacking 的核心实现，更理解了 “集体智慧” 在机器学习中的体现 —— 通过合理设计学习器的生成与融合方式，可有效弥补单一模型的不足，实现更稳健、更通用的预测效果。未来在实际项目中，需根据数据特点（如维度、样本分布）和任务需求（如精度、速度），灵活选择并优化集成算法，让 “多专家协作” 真正服务于业务目标。编辑分享。

2025-08-21 17:29:01 752

原创机器学习聚类算法学习报告

认识到在实际应用中，需根据数据特点和业务需求选择合适的聚类算法，如对于形状不规则的数据，DBSCAN 算法可能更合适；学习过程中，对部分算法（如谱聚类中涉及的图论知识、GMM 中 EM 算法的数学推导）的理解还不够深入，仅停留在算法应用层面，对其底层数学原理掌握不足。在处理大规模数据时，算法的效率和可扩展性方面的实践经验较少。尝试将聚类算法与其他机器学习技术（如深度学习）相结合，探索在更复杂场景下的应用，如在图像识别中先通过聚类算法对图像特征进行预处理，再输入深度学习模型进行分类，以提高模型性能。

2025-08-21 17:27:26 613

原创机器学习数据预处理学习报告

缺失值是数据集中常见问题，需先识别再通过删除或填充解决，核心工具包括 Pandas 内置函数与 sklearn 的。流程优先级：数据预处理需遵循 “先识别缺失值→处理缺失值→标准化→特征编码” 的顺序，确保每一步输出符合下一步输入要求。方法选择原则缺失值：数据量大用删除法，数据量小用填充法（正态分布用均值，异常值多用中位数，分类数据用众数）；标准化：线性模型用 Z 值标准化，神经网络用 MinMaxScaler；编码：名义变量用独热编码，有序变量用序号编码，目标值用 LabelEncoder。

2025-08-20 18:02:42 649

原创决策树算法学习报告2

三种算法的核心差异在于划分属性的选择标准算法核心划分准则关键特点局限性 / 改进点ID3信息增益信息增益越大，属性划分带来的 “纯度提升” 越高对可取值多的属性（如 “编号”）有偏好，易导致过拟合C4.5信息增益率通过 “信息增益 ÷ 属性自身熵” 修正 ID3 的偏好问题，更平衡计算复杂度高于 ID3，仍需处理连续值等场景CART基尼指数反映数据集纯度：\(Gini(D)=1-\sum_{k=1}^{n}p_k^2\)（\(p_k\)为类k的概率），基尼指数越小，纯度越高。

2025-08-19 17:36:30 780

原创决策树学习报告

决策树是一种直观、易理解的机器学习模型，核心在于 “以熵和信息增益为依据，筛选最优特征构建树结构”。通过本次学习，不仅掌握了基础理论与构造方法，还通过实例与练习实现了理论落地。后续计划尝试用 iris 等公开数据集，结合代码完成决策树构建，进一步提升实操能力，为学习随机森林等复杂树模型奠定基础。

2025-08-18 14:30:48 673

原创基于 KNN 算法的电影与鸢尾花分类学习报告

KNN 算法属于 “懒惰学习（Lazy Learner）”，它不提前构建复杂模型或计算参数，而是将训练集数据直接存储；当需要预测新样本时，通过计算新样本与训练集样本的 “距离”，找到最相似的 k 个邻居，最终以邻居中出现频率最高的类别作为新样本的类别。KNN 的核心优势与局限：优势在于逻辑直观、无需训练参数、易于实现，适合小样本、低维度的分类任务；局限在于对高维数据（如图片）效率低（距离计算耗时），对 “类别不平衡数据” 敏感（如某类样本占比 90%，易导致预测偏向该类）。参数选择的重要性。

2025-08-15 15:16:33 806

原创机器学习学习报告

机器学习是通过处理特定任务，以大量经验为基础，依据一定的评判标准，分析经验数据，从而使任务完成得更好的过程。

2025-08-14 13:59:45 1044

原创电商双 11 美妆数据分析学习报告

若分词中包含 “男士”“男生”，或包含 “男” 且不包含 “女” 和 “斩男”，则标记为 “是”，否则为 “否”；，将关键词与对应的大类和小类关联起来；然后计算各区间品牌的总销售额，用饼图展示各类别品牌的销售额占比，用条形图展示不同价格区间品牌的平均每个店销售额，从而分析价格与销售额的关系。函数，分别从各店铺中各大类、各店铺中各小类、各小类中各店铺三个角度，绘制销售量和销售额的条形图，通过分组展示，深入分析不同店铺在不同类别商品上的销售表现。：首先定义了商品分类的基础数据，包括大类、小类及对应的关键词；

2025-08-12 16:56:18 580

原创爬虫与数据分析结合：中国大学排名案例学习报告

通过本次中国大学排名爬取与数据分析项目，我系统掌握了从数据获取到分析可视化的完整流程，收获颇丰。在数据爬取方面，深入理解了 requests 库发送 HTTP 请求、BeautifulSoup 库解析 HTML 的原理和方法，学会了根据网页结构设计合理的解析逻辑，成功获取了目标数据。同时，也认识到在爬取过程中需要注意异常处理，确保程序的稳定性。数据预处理环节让我体会到数据清洗对于后续分析的重要性。

2025-08-11 18:09:37 1639

原创 Seaborn学习报告

Seaborn 是建立在 Matplotlib 基础之上的 Python 数据可视化库，专注于统计图形的绘制。其设计目标是简化统计数据可视化过程，通过提供高级接口和美观的默认主题，让用户用少量代码就能实现复杂图形的绘制，帮助使用者更轻松地呈现和理解数据。

2025-08-11 17:58:09 835

原创 Matplotlib 学习报告5

简介：Matplotlib 是 Python 的绘图库，支持绘制静态、动态及交互式图表，如散点图、柱形图、饼图等，能满足多样化的数据可视化需求。安装与导入安装可通过或，使用清华源能加快下载速度。导入时通常使用plt作为别名简洁方便，这是行业内的通用做法，便于代码交流和理解。

2025-08-07 16:14:50 991

原创 Pandas学习总结报告4

定义：Pandas 是一个开源的 Python 类库，专注于数据分析、数据处理和数据可视化。优势：具有高性能、易使用的数据结构和数据分析工具，能高效处理各类结构化数据。

2025-08-07 15:56:37 739

原创 NumPy 核心函数学习报告3

NumPy 是 Python 数据科学与计算的核心库，提供了大量用于数组操作、数值计算、字符串处理等功能的函数。本报告整理了 NumPy 中常用的字符串函数、数学函数、算数函数、统计函数、排序函数和搜索函数，结合代码示例进行说明，便于快速理解和应用。本报告涵盖了 NumPy 中常用的字符串处理、数值计算、统计分析、排序和搜索功能，通过代码示例直观展示了各函数的用法。NumPy 函数支持数组操作，无需循环即可批量处理数据，是高效进行数据科学计算的基础工具。

2025-08-05 16:45:26 435

原创 NumPy 学习报告（2）

NumPy 中最基础的就是数组（ndarray），我们可以用arange()创建连续数字的数组，再用reshape()修改其形状，且不改变数据本身。# 创建一维数组并修改为2行5列的二维数组print("原始一维数组：", arr)arr_2d = arr.reshape(2, 5) # 转换为2行的二维数组print("转换后的二维数组：\n", arr_2d)#运行结果原始一维数组： [0 1 2 3 4 5 6 7 8 9]转换后的二维数组：此外，flatten()和ravel()

2025-08-01 16:45:20 418

原创 NumPy学习报告

通过这段时间学习 NumPy，我深切体会到它在数据处理和科学计算方面的强大威力。从基础数组创建、索引切片，到复杂的数组运算、统计分析，NumPy 提供了一整套丰富且高效的工具。在实际应用中，它能极大提升数据处理效率与代码简洁性，比如处理大规模数据集时，用 NumPy 能让代码运行速度大幅提升。未来，我打算深入学习 NumPy 更多高级功能，像傅里叶变换、线性代数运算等，进一步拓展其在信号处理、机器学习等领域的应用。

2025-07-31 15:14:47 950

原创 BeautifulSoup数据解析

我学了用BeautifulSoup进行数据解析，这东西在爬虫里还挺好用的，简单总结一下我的学习收获。

2025-07-30 16:58:58 391

原创 PyMySQL 学习报告

今天我学习了用 PyMySQL 在 Python 里操作 MySQL 数据库，感觉还挺有用的，现在把学到的东西总结一下。

2025-07-29 18:13:14 760

原创 MySQL数据库基础学习报告（下）

最近系统学习了MySQL数据库基础相关知识，从数据的基本操纵到复杂的查询操作，收获满满。现在把学习的主要内容和心得整理一下，方便后续回顾和巩固。增删改的核心操作数据操纵是和数据库打交道最基础的部分，主要就是对数据进行插入、更新和删除这三类操作。（1）插入数据（INSERT INTO）：当需要往表中添加新记录时，就用这个命令。它的语法是`INSERT INTO 表名 (属性名1, 属性名2) VALUES (‘值1’,’值2’),…;

2025-07-28 15:11:40 911

原创 MySQL 数据库基础学习报告

数据库（DataBase）：简单说就是 “存储数据的仓库”，按一定结构存着大量数据，本质是电脑里的文件系统。比如学校的学生信息表、电商的商品列表，都可以存在数据库里。数据库管理系统（DBMS）：操作和管理数据库的软件。我们用它来建数据库、存数据、查数据，还能保证数据安全。像 MySQL、Oracle 都是常见的 DBMS，我们这次学的就是 MySQL。MySQL 是开源的关系型数据库，被 Oracle 收购后还在更新。它轻便、免费，中小项目够用，是 Web 开发的 “标配” 之一。建数据库sql。

2025-07-24 16:31:28 867

原创 requests高级用法学习报告

会拿到 “Harry Potter”；会拿到 “en”；

2025-07-23 18:07:47 649

空空如也

空空如也