Calvad0s-CSDN博客

原创离散与连续概率分布对比：PMF、PDF、CDF在数据建模中的实际应用

在前面的文章中，我们已经学习了：随机变量数学期望方差条件概率贝叶斯思想概率分布（Probability Distribution）随机结果是什么各种结果出现的可能性有多大例如：用户是否点击广告股票未来收益率房屋价格预测图像分类结果大模型下一个Token预测这些问题本质上都需要概率分布进行建模。离散概率分布连续概率分布PMF（概率质量函数）PDF（概率密度函数）CDF（累积分布函数）很多初学者经常混淆：PMF和PDF有什么区别？为什么连续变量概率为0？CDF到底有什么用。

2026-06-18 09:47:35 105 1

原创伯努利分布原理：二分类问题中的成功概率建模方法

随机事件发生的可能性随机事件对应的数值结果在机器学习、金融风控、保险精算、医疗预测、人工智能等领域中，我们经常会看到类似的问题：某用户未来违约概率是多少？某股票未来收益率是多少？某病人未来患病风险是多少？某设备未来故障概率是多少？结果具有不确定性我们需要用数学工具描述这种不确定性而随机变量正是概率论中最重要的工具之一。事实上：概率分布贝叶斯推断机器学习深度学习大语言模型都建立在随机变量理论基础之上。没有随机变量就没有现代机器学习本文将系统讲解：什么是随机变量。

2026-06-18 09:46:35 103 1

原创随机变量基础：定义、期望与方差在风险预测中的核心作用

随机事件发生的可能性随机事件对应的数值结果在机器学习、金融风控、保险精算、医疗预测、人工智能等领域中，我们经常会看到类似的问题：某用户未来违约概率是多少？某股票未来收益率是多少？某病人未来患病风险是多少？某设备未来故障概率是多少？结果具有不确定性我们需要用数学工具描述这种不确定性而随机变量正是概率论中最重要的工具之一。事实上：概率分布贝叶斯推断机器学习深度学习大语言模型都建立在随机变量理论基础之上。没有随机变量就没有现代机器学习本文将系统讲解：什么是随机变量。

2026-06-18 09:45:52 78

原创离散概率模型在机器学习分类任务中的应用解析

在机器学习领域中，我们经常会遇到各种分类任务：垃圾邮件识别用户流失预测商品类别识别新闻文本分类疾病诊断图像分类给定一封邮件判断它是否是垃圾邮件给定一张猫的图片判断它属于哪个类别给定用户的行为数据预测用户是否会购买商品分类问题（Classification）离散概率模型（Discrete Probability Model）事实上，在深度学习出现之前，大量机器学习算法都是建立在离散概率理论之上的。例如：朴素贝叶斯（Naive Bayes）

2026-06-18 09:44:59 74

原创蒙提霍尔问题及其它经典案例：概率论教你做出最优决策！

概率论到底有什么用？在学校里，我们会学习：掷骰子抛硬币摸球问题排列组合但在现实生活中：买房投资医疗诊断自动驾驶人工智能似乎很少有人拿出纸和笔计算概率。概率论只是考试工具事实上恰恰相反。帮助人类在不确定环境中做出最优决策现实世界本身充满随机性：明天是否下雨？股票是否上涨？用户是否购买商品？病人是否患病？AI是否应该执行某个动作？这些问题没有人能够百分之百确定答案。决策比预测更重要如何在不确定条件下做出最优选择的科学。本文将通过多个经典案例带大家理解：蒙提霍尔问题。

2026-06-18 09:44:09 155

原创多随机变量：联合概率、边际概率、条件概率、独立性与排他性详解

在上一篇文章《随机变量：如何用数学语言描述掷骰子的结果分布？》中，我们学习了：什么是随机变量概率分布离散随机变量连续随机变量数学期望与方差但是现实世界中的问题往往不会只涉及一个随机变量。多个事件同时发生的概率P(A ∩ B)P(X=x,Y=y)只关心某一个变量例如：P(X,Y)XP(X)边际概率对另一个变量求和即可得到边际概率。P(X=1)P(X=1,Y=1)P(X=1,Y=2)...P(X=1,Y=6)已知某事件发生后另一事件发生的概率例如：今天下雨今天堵车概率。

2026-06-18 09:42:03 178

原创随机变量：如何用数学语言描述掷骰子的结果分布？

随机变量（Random Variable）随机变量到底是什么？它和普通变量有什么区别？随机变量就是随机变化的数字事实上，这种理解并不准确。随机变量是概率论中最重要的概念之一，它的出现让人类第一次能够用数学语言描述随机现象。概率是在研究随机事件随机变量就是把随机事件数字化而机器学习中的所有特征：年龄身高收入房价点击率本质上都可以看作随机变量。本文将通过最经典的“掷骰子”案例，系统讲解：为什么需要随机变量什么是随机变量随机变量如何描述骰子结果概率分布是什么。

2026-06-18 09:41:16 159

原创为什么机器学习模型需要处理不确定性？概率论的现实意义

为什么机器学习模型给出的结果不是100%确定的？例如：天气预报说明天下雨概率80%垃圾邮件识别模型判断为垃圾邮件概率95%大语言模型回答问题时并不总是相同自动驾驶系统无法保证每次识别都绝对正确事实上，现实世界本身就是充满不确定性的。而概率论（Probability Theory）的出现，就是为了帮助人类描述和处理这种不确定性。没有概率论，就没有现代机器学习。利用历史数据估计未来事件发生概率的过程。本文将系统讲解：为什么现实世界存在不确定性概率论如何描述不确定性为什么机器学习离不开概率论。

2026-06-18 09:39:55 213

原创两种概率学派：频率派与贝叶斯派——概率世界中的两大思想流派

同样是计算概率，不同的人却给出了不同的解释。例如：这种疾病的发病概率是1%根据目前掌握的信息，这个病人患病概率是80%为什么会出现这种差异？概率并不只有一种解释方式。在统计学的发展历史中，逐渐形成了两大概率学派：频率派（Frequentist）贝叶斯派（Bayesian）这两个学派贯穿了整个统计学发展史，也深刻影响着现代机器学习和人工智能的发展。机器学习中的很多算法，本质上都是两大学派思想的体现。本文将系统讲解：什么是概率学派频率派的核心思想贝叶斯派的核心思想两者的区别与联系。

2026-06-18 09:39:29 263

原创概率的直观理解——几个最重要的概率概念详解

概率（Probability）例如：机器学习预测用户购买商品的概率垃圾邮件分类的概率大语言模型预测下一个词出现的概率天气预报中的降雨概率但是对于很多初学者来说，概率论往往是最容易让人头疼的一部分。因为各种概念层出不穷：概率事件随机变量条件概率联合概率独立事件贝叶斯概率导致很多人学到后面越来越迷糊。实际上，概率论并没有想象中的那么复杂。概率论就是研究“不确定性”的数学工具。本文将从最直观的角度出发，带大家理解概率到底是什么，以及机器学习中最常见的几个概率概念。

2026-06-18 09:39:07 179

原创掌握 Transformer 位置编码原理——为什么 Transformer 能理解词语顺序？

位置编码（Positional Encoding）是 Transformer 架构不可或缺的重要组成部分，它解决了 Self-Attention 无法感知词序的问题。本文重点掌握了：1、为什么 Transformer 需要位置编码；2、RNN 与 Transformer 的区别；3、位置编码核心思想；4、Sin-Cos位置编码公式；5、位置编码生成原理；6、Embedding与位置编码融合方式；7、固定位置编码与可学习位置编码；8、相对位置编码思想；9、RoPE旋转位置编码原理；

2026-06-16 09:13:46 206

原创掌握 ViT（Vision Transformer）模型结构——Transformer 如何征服计算机视觉领域

ViT借鉴BERT设计。[CLS]分类Token。Vision Transformer（ViT）是计算机视觉领域最具影响力的模型之一，它成功将 NLP 中的 Transformer 引入图像处理任务，并开启了视觉 Transformer 时代。本文重点掌握了：1、ViT提出背景；2、CNN存在的局限；3、ViT核心思想；4、Patch切分机制；5、Patch Embedding原理；6、CLS Token作用；7、Position Embedding原理；

2026-06-16 09:13:37 208

原创掌握 DeiT（Data-efficient Image Transformer）模型结构——让 Vision Transformer 摆脱海量数据依赖

在上一篇《掌握 ViT 模型结构》中，我们已经了解了 Vision Transformer（ViT）的基本原理。ViT 的出现让 Transformer 成功进入计算机视觉领域，并取得了超越传统 CNN 的性能表现。训练数据需求极大JFT-300M数据集。3亿张图片对于绝大多数企业和研究团队来说，这种训练成本几乎无法承受。能否在普通数据集上训练Transformer？2021年，Facebook AI Research（FAIR）提出了一篇重量级论文：DeiT数据高效视觉Transformer。

2026-06-16 09:13:26 267

原创掌握 MobileViT 等高效率模型结构——CNN 与 Transformer 融合时代的轻量化视觉网络

近年来，Transformer 在计算机视觉领域取得了巨大成功。从：ViTDeiTBEiTDINO到如今的各种视觉大模型。Transformer 几乎成为视觉领域的主流架构。Transformer性能很强但计算开销巨大例如：8600万+参数。在服务器环境中运行问题不大。但是：对于：手机平板嵌入式设备边缘计算设备自动驾驶终端而言。计算成本过高。能否让Transformer变得轻量化？与此同时：CNN虽然轻量高效。但全局建模能力不如Transformer。

2026-06-16 09:13:16 120

原创了解图像分类问题划分——从任务类型到数据组织的系统化认知

图像分类（Image Classification）是计算机视觉领域最基础、也是最重要的任务之一。无论是：CNN时代的 ResNet、VGGTransformer时代的 ViT、DeiT轻量化模型 MobileNet、MobileViT它们的第一步应用场景，几乎都是图像分类。图像分类并不是一个单一任务，而是一个“任务体系”根据数据组织方式、类别关系、标签形式以及应用场景不同，图像分类可以被清晰划分为多个子类型。

2026-06-16 09:13:05 148

原创了解多类别图像分类模型结构——从Softmax到现代视觉分类网络的完整演进

多类别图像分类（Multi-class Classification）例如：一张图片属于猫、狗、鸟中的某一类一张图片属于1000个ImageNet类别中的一个一张工业图像属于正常、划痕、裂纹中的一种每个样本只能属于一个类别（互斥关系）这类任务是计算机视觉的“基础中的基础”，也是所有视觉模型的起点。从传统机器学习到 CNN，再到 Vision Transformer，多类别分类模型经历了完整演进。本文将系统讲清：多类别分类任务本质模型结构设计Softmax分类机制CNN分类模型结构。

2026-06-16 09:11:55 140

原创了解多标签图像分类方法——从Sigmoid输出到真实世界复杂视觉理解

一张图片可以同时属于多个类别其中：C：类别数量y_i = 1 表示该类别存在y_i = 0 表示不存在多标签图像分类是比多类别分类更接近真实世界的一类视觉任务，它允许一张图片同时拥有多个语义标签，因此在复杂场景理解中具有极高价值。本文重点掌握了：1、多标签分类定义；2、与多类别分类区别；3、Sigmoid机制；4、BCE损失函数；5、CNN与Transformer结构；6、标签建模方法；7、核心挑战；8、评价指标；9、应用场景；10、发展趋势。

2026-06-16 09:11:45 244

原创【工业领域】了解目标检测基本流程——从数据到部署的完整工程化思路

在工业视觉系统中，图像分类已经无法满足复杂场景需求。这是什么它在哪里目标检测（Object Detection）目标检测广泛应用于：工业缺陷检测自动驾驶智能安防物流分拣医学影像分析它是连接“视觉理解”和“工程落地”的核心技术之一。本文将从工业视角出发，系统讲清目标检测的完整流程。在图像中找到所有目标，并给出类别 + 位置目标检测是工业视觉系统的核心技术，它不仅要求识别“是什么”，还要精确定位“在哪里”，因此在工程中具有极高价值。

2026-06-16 09:11:29 293

原创【工业领域】了解目标检测评估指标——从mAP到IoU的完整评价体系解析

在工业视觉系统中，目标检测模型不仅要“能用”，更要“可靠”。例如在产线检测中：检测漏掉一个缺陷 → 可能造成质量事故误检一个正常产品 → 降低生产效率定位偏差过大 → 影响后续自动化处理因此，仅仅看“准确率”远远不够。目标检测评估指标体系本文将系统讲清工业领域最重要的检测评估指标，包括 IoU、Precision、Recall、AP、mAP 等核心概念。目标检测评估的核心基础。Precision vs Recall 曲线AP = PR曲线面积预测框↓计算IoU↓匹配GT↓。

2026-06-16 09:11:13 288

原创【工业领域】掌握非极大值抑制（NMS）目标检测后处理方法——从重复框消除到工程落地核心技术

在目标检测系统中，模型的输出通常不是“一个框”，而是一堆候选框。猫 → 可能输出10个框只保留一个最准确的框否则会出现严重问题：重复检测结果混乱工业系统误报警非极大值抑制（Non-Maximum Suppression, NMS）NMS是工业目标检测后处理的核心技术之一。候选框↓置信度排序↓选最高框↓计算IoU↓过滤重叠框↓重复循环↓最终输出。

2026-06-16 09:11:03 582

原创掌握YOLO v1-v8的系列算法原理——从单阶段检测到工业级实时视觉系统演进

YOLO系列是目标检测领域最重要的技术路线之一，它从最初的Grid回归模型发展到如今的Anchor-free多任务统一架构，经历了工程与算法的双重进化。本文系统梳理了：1、YOLO核心思想；2、v1-v8整体演进；3、Anchor机制变化；4、多尺度检测；5、工程优化策略；6、损失函数设计；7、Backbone/Neck/Head结构；8、工业应用场景；9、发展趋势。

2026-06-15 14:25:53 20

原创掌握基于YOLO v5实现车牌目标检测任务的完整流程——从数据到部署的工业级实践

在图像中定位出车牌所在位置（Bounding Box）相比普通目标检测任务，车牌检测具有一些典型特点：目标尺寸较小受光照影响大存在倾斜、模糊、遮挡背景复杂（城市道路）因此，YOLO v5成为工业界最常用的解决方案之一。如何基于YOLO v5实现车牌目标检测涵盖从数据准备到模型训练，再到推理部署的全流程。基于YOLO v5实现车牌检测是一个典型的工业级目标检测应用，它涵盖了数据工程、模型训练、优化部署等完整流程。本文系统讲解了：1、任务定义与目标；2、数据采集与标注；

2026-06-15 14:25:41 134

原创【医疗与直播领域】了解图像分割问题划分——从像素级理解到应用场景解析

每一个像素属于什么这使得图像分割成为最精细、最接近“人类视觉理解方式”的视觉任务之一。在医疗与直播两个看似完全不同的领域中，图像分割都扮演着核心角色：医疗：精准定位病灶、器官边界直播：人物抠图、背景替换、美颜分割本文将系统讲清图像分割的任务划分与核心思想。为每一个像素分配类别标签图像分割是一类极其重要的视觉任务，它从像素级别理解图像结构，在医疗与直播两大领域都有着不可替代的作用。本文系统讲解了：1、图像分割定义；2、三大任务划分；3、语义/实例/全景分割区别；4、医疗应用场景；

2026-06-15 14:25:25 80

原创掌握语义分割经典模型 FCN——从像素分类到端到端分割的奠基之作

在深度学习视觉任务中，语义分割是最具“像素级理解能力”的任务之一。如果说：分类是在判断“是什么”检测是在判断“在哪里”每一个像素是什么FCN（Fully Convolutional Network，全卷积网络）深度学习首次实现端到端语义分割本文将系统讲解 FCN 的核心思想、结构演进与工程意义。将CNN用于像素级分类的端到端分割模型输入图像↓卷积特征提取（Encoder）↓降采样↓上采样恢复↓像素分类↓输出Mask。

2026-06-15 14:25:15 121

原创掌握语义分割经典模型 U-Net——医疗影像分割的黄金标准与工程实践核心

在语义分割领域，如果说 FCN 是“开创者”，那么 U-Net 就是“工业化最成功的经典模型”。U-Net = 医疗分割的标准答案之一它被广泛应用于：肿瘤分割器官分割病灶检测细胞分割甚至在数据极少的情况下依然表现稳定。本文将系统讲清 U-Net 的核心结构与设计思想。基于Encoder-Decoder结构的语义分割模型输入图像↓Encoder（特征提取）↓Bottleneck（语义压缩）↓Decoder（特征恢复）↓Skip Connection融合↓输出Mask。

2026-06-15 14:25:06 134

原创掌握膨胀卷积原理——从感受野扩展到语义分割核心算子

感受野（Receptive Field）感受野决定了模型“看到的范围”。但在很多任务中，比如：语义分割（FCN / U-Net / DeepLab）目标检测（小目标 + 大场景）医疗影像（大范围上下文）单纯堆叠卷积层会带来两个问题：计算量变大分辨率下降（信息损失）膨胀卷积（Dilated Convolution / Atrous Convolution）它可以在不增加参数的情况下扩大感受野。

2026-06-15 14:24:55 181

原创掌握语义分割经典模型系列 DeepLab——从空洞卷积到多尺度分割的工业级标准

在语义分割领域，如果说：FCN 是“开创者”U-Net 是“医疗标杆”工业级语义分割的性能天花板之一在不降低分辨率的情况下提升分割精度本文将系统讲解 DeepLab 系列的核心思想与演进路径。v1：空洞卷积v2：ASPPv3：强化ASPP1. 不降采样（空洞卷积）2. 多尺度融合（ASPP）3. 编码解码结构（v3+）DeepLab系列是语义分割领域最具影响力的模型之一，它通过空洞卷积与多尺度特征融合机制，解决了传统分割模型中“分辨率损失与上下文不足”的核心问题。

2026-06-15 14:24:40 159

原创掌握从零搭建图像分割模型并实现训练与测试的完整流程——从数据到部署的工程化实践

对每一个像素进行分类相比分类和检测任务，分割任务更复杂，因为它同时要求：像素级精度空间结构理解多尺度语义融合只懂模型，不懂完整工程流程本文将带你从零构建一个完整图像分割系统，包括：数据准备模型构建训练流程验证评估推理测试形成一条完整闭环。从零搭建一个图像分割系统，本质上是一个完整的工程闭环过程，它不仅仅是训练模型，更重要的是理解：数据如何组织模型如何构建损失如何设计如何评估模型如何部署上线本文系统讲解了：1、数据准备；2、Dataset设计；3、模型构建；

2026-06-15 14:23:18 214

原创了解3D卷积原理——从空间感知到时空建模的深度学习核心算子

在经典卷积神经网络中，我们最熟悉的是二维卷积（2D Convolution），它主要用于图像处理任务，例如：图像分类目标检测语义分割但当数据不再只是“平面图像”，而是变成：视频（时间 + 空间）医学CT / MRI（三维体数据）点云 / 体素数据此时，2D卷积就不够用了。3D卷积（3D Convolution）空间维度 + 时间维度（或深度维度）卷积核在三个维度上滑动：宽、高、深（时间）↓↓↓↓Task Head2D卷积：3D卷积：CT分割MRI分析。

2026-06-15 14:23:00 376

原创掌握3D CNN模型结构——从时空特征建模到视频理解与医学影像核心架构

在传统计算机视觉中，2D卷积网络（2D CNN）已经非常成熟，广泛用于：图像分类目标检测语义分割但当输入数据从“单张图像”扩展到：视频序列（时间维度）医学体数据（CT/MRI）体素数据（Voxel）无法建模时间或深度维度的连续变化于是，3D CNN（3D Convolutional Neural Network）应运而生。在空间 + 时间（或深度）维度上同时进行卷积的神经网络↓↓3D Pooling↓↓↓。

2026-06-15 14:22:46 225

原创掌握 C(2+1)D 模型结构——用“拆解3D卷积”实现高效视频理解的经典思路

空间（H, W） + 时间（T）但3D卷积有一个非常明显的问题：计算量大参数多训练困难把3D卷积拆成“2D空间卷积 + 1D时间卷积”但效果却接近甚至优于3D卷积。将3D卷积分解为“空间卷积 + 时间卷积”的时空建模方法参数少计算快↓↓↓↓↓将复杂的3D时空建模拆解为“空间理解 + 时间理解”先理解“是什么”，再理解“怎么动”C(2+1)D是一种非常经典且高效的视频建模方法，它通过将3D卷积拆解为2D空间卷积与1D时间卷积，不仅降低了计算复杂度，还提升了模型的表达能力与训练稳定性。

2026-06-12 09:10:47 27

原创了解视频分类任务与数据集——从数据组织到时空建模的完整认知

在计算机视觉中，视频理解是比图像理解更进一步的任务。识别“这一张图是什么”识别“一段视频在做什么”视频不再是静态信息，而是：空间信息（每一帧画面）时间信息（帧与帧之间变化）时空联合建模问题对一段视频整体进行类别预测的任务最经典的视频动作识别数据集之一Google推出的大规模视频数据集↓↓↓↓↓视频分类任务是计算机视觉中从“图像理解”迈向“时空理解”的重要一步，它需要模型同时理解空间结构与时间变化，因此比图像分类复杂得多。本文系统讲解了：1、视频分类任务定义；2、与图像分类区别；

2026-06-12 09:10:10 78

原创【自动驾驶领域】学习 Cityscapes 数据集——城市街景语义理解的标准基准

Cityscapes它几乎是语义分割任务中“城市道路场景”的标准基准之一，被广泛用于：自动驾驶感知系统语义分割模型评估（U-Net / DeepLab / SegFormer）城市环境理解研究Cityscapes 就是城市街景语义分割的标杆数据集用于城市街景语义理解的高质量像素级标注数据集Cityscapes是自动驾驶领域最重要的语义分割数据集之一，它以高分辨率城市街景为核心，提供了精细的像素级标注，是评估语义分割模型能力的重要基准。本文系统讲解了：1、Cityscapes基本概念；

2026-06-12 09:09:42 130

原创使用语义分割经典模型 HRNet 训练道路分割模型并测试使用——从高分辨率特征到工程落地实践

下采样提语义 → 上采样恢复分辨率高分辨率细节在下采样过程中容易丢失尤其是在道路分割任务中，这种细节非常关键，例如：车道线路沿小型障碍物行人边界为了解决这个问题，HRNet（High-Resolution Network）被提出。始终保持高分辨率特征的语义分割网络HRNet是一种非常重要的语义分割模型，它通过“始终保持高分辨率特征 + 多尺度融合”的方式，有效解决了传统编码器-解码器结构中细节丢失的问题，尤其适用于道路分割这类需要高精度边界的任务。本文系统讲解了：1、HRNet基本原理；

2026-06-12 09:09:32 103

原创学习 LPRNet 框架——轻量级车牌识别网络从结构到工程落地

在智能交通与自动驾驶的感知系统中，车牌识别（License Plate Recognition，简称 LPR）是一个非常典型的落地任务。车牌检测 + 车牌识别其中“车牌识别”是核心难点之一，因为它要求：高精度字符识别强抗干扰能力（光照、模糊、遮挡）实时性（嵌入式部署）在这一背景下，LPRNet 被提出。LPRNet = 专门为车牌识别设计的轻量级端到端网络无需字符切割，直接进行端到端车牌识别的深度学习模型强调“轻量 + 实时”↓↓↓CTC Layer↓。

2026-06-12 09:09:21 159

原创掌握生成对抗网络（GAN）原理——从零理解“对抗学习”的核心思想与生成机制

在深度学习的发展过程中，有一类模型改变了“数据只能被动学习”的传统认知，它就是：不仅能理解数据，还能“创造数据”例如：生成逼真的人脸生成艺术图像图像修复数据增强风格迁移深度学习中最“有创造力”的模型之一通过“生成器 + 判别器”相互博弈进行训练的生成模型“对抗式学习框架”z(随机噪声)↓↓Fake Data↓↓GAN是深度学习中极具代表性的生成模型，它通过生成器与判别器之间的对抗训练机制，实现了从“数据理解”到“数据创造”的跨越。本文系统讲解了：1、GAN基本概念。

2026-06-12 09:09:11 255

原创掌握生成对抗网络（GAN）的优化目标与评估指标——从博弈函数到生成质量衡量体系

min-max博弈问题D：提升判别能力G：提升欺骗能力方法优化思想GANJS散度WGANWasserstein距离LSGAN最小二乘生成图像的清晰度 + 多样性GAN的核心不仅是生成能力，更重要的是其独特的优化目标与评估体系。本文系统讲解了：1、GAN优化目标（min-max博弈）2、生成器与判别器目标3、WGAN/LSGAN改进4、训练不稳定问题5、评估指标体系（IS/FID/KID/LPIPS）6、指标之间关系7、训练策略优化8、实际评估流程。

2026-06-12 09:09:01 229

原创掌握条件生成对抗网络（Conditional GAN）模型结构——从无条件生成到可控生成的进阶

在GAN基础上引入“条件信息”的生成模型(z, y)↓↓G(z,y)↓↓Conditional GAN是在传统GAN基础上的重要扩展，它通过引入条件变量y，使生成过程变得“可控”，从而将生成模型从“随机创造”提升到“按需生成”。

2026-06-12 09:08:51 259

原创掌握扩散模型原理——从噪声逐步生成到现代生成式AI的核心范式

在生成式模型的发展历程中，Denoising Diffusion Probabilistic Model的出现标志着生成方式的一次重要转变。通过对抗训练“逼近真实数据分布”通过“逐步去噪”还原真实数据它目前已经成为图像生成领域的主流方法之一，例如：DALL·E 2（部分模块）Imagen通过逐步向数据添加噪声，再学习反向去噪生成数据的概率生成模型Noise xT↓↓x_{t-1}↓...↓x0 (Image)学习“从噪声中逐步恢复数据分布”先破坏数据，再学会重建数据。

2026-06-12 09:08:39 217

原创掌握稳定扩散模型（Stable Diffusion）原理——从扩散过程到潜空间生成的完整解析

在生成式AI领域，Stable Diffusion几乎已经成为“文生图”的代名词。不再直接在像素空间生成，而是在潜空间（Latent Space）生成这使得它具备：更快的生成速度更低的计算成本更高的可扩展性基于潜空间扩散模型的文本条件图像生成模型↓↓↓↓ImageStable Diffusion通过“潜空间扩散 + 文本条件控制 + U-Net去噪 + VAE解码”的组合，实现了高效且高质量的文本生成图像能力，是当前生成式AI最重要的基础模型之一。

2026-06-12 09:08:26 230

openlayers加载瓦片地图并手动标记坐标点

宿舍资源管理源码

空空如也