- 博客(203)
- 收藏
- 关注
原创 【卷积神经网络】卷积层、池化层、全连接层
卷积神经网络通过三维输入数据(h×w×c)直接提取特征,相比传统神经网络能更好地保留空间信息。其核心架构包含卷积层、池化层和全连接层,其中只有带权重参数的层(如卷积层和全连接层)计入网络深度。卷积层通过滑动窗口、步长调节、边缘填充和多核设计实现多层次特征提取,小卷积核堆叠既能扩大感受野又能减少参数量。感受野随网络深度递推增长,计算公式为RF_new = RF_prev + (k-1)×S_prev,这种层级结构使浅层提取局部特征,深层捕获全局特征。
2025-11-29 23:33:06
1884
10
原创 【机器学习】无监督学习 —— K-Means 聚类、DBSCAN 聚类
本文介绍了两种常用聚类算法,K-Means和DBSCAN。K-Means通过最小化簇内平方误差将数据划分为k个球状簇,需预先指定簇数,常用肘部法则和轮廓系数评估效果。DBSCAN基于密度,能发现任意形状簇并识别噪声点,核心参数为邻域半径eps和最小点数MinPts,通过连接核心点形成簇。
2025-10-08 21:43:10
2024
2
原创 【Python LeetCode 专题】热题 100,重在思路
包含 普通数组、矩阵、链表、子串、栈、堆、哈希表、双指针、滑动窗口、链表、回溯、贪心、图论
2025-07-17 14:38:21
790
1
原创 LaTeX 常见符号
Latex 是一种用于的语言,它可以用特殊的命令来表示数学公式、符号、图形等。具有高效、灵活、易扩展等特点,在计算机科学的各个领域都有广泛的应用。
2023-12-19 09:49:15
36328
2
原创 【神经网络】模型训练中的相关概念:Epoch,Batch,Batch size,Iteration
神经网络模型训练中的相关概念:Epoch,Batch,Batch size,Iteration
2023-12-06 11:31:40
23571
3
原创 【卷积神经网络】卷积的理解,卷积与通道的关系
卷积核通道个数 = 输入通道个数卷积核的内核个数 = 卷积核通道个数,一个通道对应一个内核输出通道个数 = 卷积核个数
2023-11-30 11:29:46
3641
5
原创 2025 年,论文与求职夹击下的一年:我与博客共同成长
2025 年,我同时面对毕业论文与求职的双重压力。在持续学习与创作的过程中,我逐渐意识到,博客并不是额外的负担,而是帮助我完成知识沉淀、认知升级与自我成长的重要工具。本文回顾了我在高压环境下的创作选择、成长转变与反思。
2026-01-03 11:28:01
286
原创 Q-learning 算法 —— 无模型(model-free)强化学习
从已知模型到 Model-free 的强化学习转变:Q-Learning 算法,通过详细示例来讲解,理解 Q-table 的更新和贪婪策略
2025-12-25 18:18:50
1804
原创 深度强化学习 Deep Q-learning:把深度学习引入强化学习
(例如向左或向右、向上或向下)。Atari 的《Breakout》展示了一个具有离散动作空间的环境。AI 代理可以向左或向右移动;每个方向的移动都有一定的速度。如果智能体能够确定。
2025-12-25 18:05:24
670
原创 【读论文】Back to Basics: Let Denoising Generative Models Denoise
无需 UNet 风格的 encoder-decoder、skip connection,作者构建了纯 Transformer 驱动、与任务解耦、对任意像素分辨率都可扩展的通用扩散模型 JiT,核心思想是:把时间步 t 的信息插入到 Transformer 的 input token 中,而不是额外分支或调制网络。
2025-12-08 14:42:59
1091
3
原创 Flow Matching 的直观理解
本文介绍了Flow Matching的基本概念,这是一种通过向量场将初始分布转化为目标数据分布的方法。Flow Matching利用神经网络学习向量场$u_t^\theta$,指导样本点从初始分布$p_{init}$运动到真实数据分布$p_{data}$。文中阐述了三个核心概念:轨迹(记录点在不同时刻的位置)、向量场(定义空间各点的运动速度)和流(由向量场确定的轨迹集合)。通过常微分方程描述了流与向量场的关系:$\frac{d\psi_t(x_0)}{dt}=u_t(\psi_t(x_0))$。
2025-11-26 16:38:58
955
原创 Unet1d:专为时间序列任务设计的标准 U-Net 架构
本文实现了一个1D版本的Unet模型,主要用于扩散模型的降噪任务。代码包含核心组件:1)残差块(ResnetBlock)和基础块(Block)实现,支持时间嵌入;2)上采样(Upsample)和下采样(Downsample)模块;3)两种归一化层(RMSNorm和LayerNorm);4)正弦位置编码(SinusoidalPosEmb)及其随机变体。模型架构参考了lucidrains的1D扩散模型实现,采用类似UNet的编码器-解码器结构,包含残差连接和注意力机制。代码结构清晰,提供了完整的卷积神经网络组件
2025-11-26 16:38:05
1138
原创 【代码】TorchCFM(Conditional Flow Matching library)代码入门
本文介绍了 TrochCFM 代码库,该论文提出了一种改进的基于流的生成模型,通过引入小批量最优传输(minibatch optimal transport)来增强条件流匹配(Conditional Flow Matching)方法。代码库包含核心模型架构、条件流匹配损失实现以及最优传输采样模块。
2025-11-12 20:00:23
1040
原创 【读论文】Neural Ordinary Differential Equations
本文提出了一种创新的连续深度神经网络模型,通过神经网络参数化隐藏状态的导数,利用ODE求解器计算输出。该模型具有三大优势:1) 恒定内存开销,突破深度训练瓶颈;2) 自适应计算策略,可平衡精度与速度;3) 支持构建连续正规化流和潜变量模型。关键贡献包括:实现不依赖求解器内部操作的梯度反向传播,推导连续的变量替换公式,以及处理连续时间序列数据的能力。这种方法为大规模端到端微分方程训练开辟了新途径。
2025-11-04 17:10:59
783
原创 【MATLBA】使用教程
本文介绍了MATLAB中的启动文件设置和绘图功能。主要内容包括:1) 通过软链接和环境变量配置startup.m文件,实现在MATLAB启动时自动运行脚本并设置工作目录;2) 二维和三维图形绘制方法,包括plot、surf等函数的参数设置和样式控制;3) 常用的字符串匹配(strmatch)和存在性检查(exist)函数的使用方法,用于处理字符串和变量/文件检查。文章提供了详细的代码示例和参数说明,涵盖了MATLAB基础操作中的文件配置、可视化表示和常用函数应用。
2025-11-04 16:56:43
1586
原创 【深度神经网络】优化深度神经网络
机器学习的应用是一个 高度依赖经验 的过程,伴随着大量迭代的过程,需要训练诸多模型,才能找到合适的那一个,优化算法能够帮助快速训练模型。
2025-11-02 17:23:39
820
3
原创 【深度学习】超参数调整(Hyperparameter Tuning)
机器学习模型参数分为两类:模型参数(内部可学习数值,如权重/偏置)和超参数(人为预设控制变量)。超参数包括网络参数(层数/激活函数等)、优化参数(学习率/batch size等)和正则化参数(dropout/权重衰减等)。调参需权衡多个因素,如batch size增大可提升训练速度但可能降低泛化能力,而学习率是最关键的超参数之一。常见调参方法包括随机搜索、网格搜索和贝叶斯优化,目标是找到最优超参数组合以获得最佳模型表现。
2025-11-02 13:26:33
1318
1
原创 【Microsoft Learn】Microsoft Azure 服务
本文介绍了如何在Azure平台上创建和使用虚拟网络(VNet)及相关服务。主要内容包括: 通过Azure门户创建虚拟网络,并配置子网、网络安全组(NSG)等组件。 使用Azure Bastion服务实现安全的虚拟机远程访问,避免直接暴露公共IP。 创建并配置公共IP地址,说明其支持的入站和出站通信场景。 演示在虚拟网络中创建多个虚拟机,并通过Bastion进行连接测试内部通信。 文章提供了详细的操作步骤和图示,帮助用户理解Azure网络架构和安全最佳实践,如使用Bastion替代直接RDP/SSH访问来增强
2025-11-01 14:55:27
1133
原创 【Dataset】如何高效处理海量数据并从中智能筛选出有代表性的样本?
本文要谈论的:从海量未标注数据中高效提取特征、发现结构,并基于多目标价值评估进行有策略的样本采样,服务于主动学习、异常检测、数据压缩或高质量数据集构建等任务。
2025-10-24 15:37:30
1257
原创 【科研绘图】PGF/TikZ 生成矢量图
TikZ 是 LaTeX 中强大的矢量绘图工具包,基于 PGF 底层语言开发。它通过几何/代数描述生成精确的矢量图形,支持绘制点、线、圆、多边形等基本图形,并能创建复杂的技术图表和神经网络示意图。入门教程展示了如何绘制直线、矩形、圆和椭圆等基本图形,并介绍了坐标系统、箭头控制等核心功能。TikZ 采用数学坐标系,x 轴向右、y 轴向上,通过简单的代码即可实现高质量的图形输出。推荐使用 standalone 文档类来单独编译每个图形,便于模块化管理和导出高精度图像。基本语法为 \draw[option]...
2025-10-16 22:25:40
1132
原创 深入理解 RAG 系统
构建RAG系统的核心挑战在于确保检索内容的相关性、完整性和准确性。关键在于两大部分:数据工程(文档切分、元数据标注、更新机制)和检索策略(混合搜索、重排模型、查询重写)。实际应用中,PDF解析、语义分块、权限管理等问题常导致检索质量下降,而评估体系缺失使得优化效果难以量化。最终,RAG系统的成功取决于数据处理与检索流程的精细打磨,而非单纯依赖大模型能力。
2025-10-12 13:35:16
663
原创 Python 代码实现“Attention is all you need”
本文介绍了如何用Python实现Transformer架构,包括多头注意力机制、编码器-解码器结构、位置编码等核心组件。Transformer由编码器和解码器组成,各包含6个相同块。编码器层包含自注意力和前馈网络,解码器层增加了掩码自注意力和编码器-解码器注意力。多头注意力通过并行处理提高模型灵活性,核心是计算查询、键、值的注意力权重。位置编码通过正弦函数注入位置信息。在训练阶段采用右移策略实现自回归建模,推理时逐步生成输出。文章详细说明了各模块实现原理和Transformer在序列任务中的工作流程。
2025-10-10 16:15:46
1009
原创 Transformer 内部数据是如何流动和变换的
本文介绍了Transformer模型内部的数据流动过程。首先,输入文本通过词嵌入和位置编码转换为向量矩阵。核心环节是自注意力机制,通过计算Query、Key、Value矩阵,形成上下文相关的词表示。多头注意力机制让模型从多个角度理解语义。Encoder通过多层处理提炼语义信息,Decoder则使用掩码自注意力和Encoder-Decoder注意力逐步生成输出。最终,Decoder输出通过softmax转换为词概率,实现序列到序列的转换。整个过程展示了Transformer如何有效处理并转换序列数据。
2025-10-10 00:11:43
1023
原创 【神经网络】从逻辑回归到神经网络
本文以具体例子表明,神经网络可以看做是由多个逻辑回归模型经过组合构成的。让神经网络自己去学习抽象什么高级特征,我们提供的只有原始特征和最终结果,中间模型如何抽取高级特征对我们来说是黑盒。并从前向传播过程的逆向视角证明,在将数据通过所有隐藏层进行转换,并且在即将到达输出层之前,神经网络是在不断努力将数据投影到一个使其某种程度上线性可分的空间。
2025-10-09 23:37:25
663
原创 【神经网络】理解神经网络并使用神经网络实现多分类
本文探讨了神经网络与人脑神经系统的类比关系,解析了神经网络的基本结构和计算原理。神经元结构类比:生物神经元与人工神经网络的对应关系,将树突、胞体和轴突分别类比为输入、计算和输出部分。 神经网络层级:详细介绍了输入层、隐藏层和输出层的构成,解释了全连接层的概念及其矩阵运算特性。 激活函数作用:强调激活函数在引入非线性方面的重要性,使神经网络能够处理复杂问题。
2025-09-30 14:08:09
730
原创 【机器学习】监督学习 —— 决策树(Decision Tree)
决策树是一种基于树形结构的监督学习方法,用于分类和回归任务。它通过递归划分数据,利用信息熵或基尼不纯度等准则选择最优特征进行节点分裂,最终生成易于解读的决策规则。
2025-09-28 22:25:53
1037
原创 【机器学习】监督学习 —— 逻辑回归
逻辑回归是监督学习中重要的分类算法,其核心在于使用Sigmoid激活函数将线性回归结果映射到[0,1]区间实现概率预测。
2025-09-28 00:17:53
857
1
原创 【Python 语法】面试手撕代码必备的 Python 语法指南
本文总结了Python面试/笔试中常见的输入输出处理方式。针对不同输入场景提供了多种模板:对于小规模数据可直接使用input().split()读取;大规模数据建议用sys.stdin.buffer.read()提高效率。
2025-09-26 15:59:09
84
原创 工具箱和学习地图
本文汇总了多领域实用工具与学习平台:1. 效率工具包括打字练习Keybr、图片处理iLoveIMG、GIF制作及文字提取工具;2. 学术科研提供论文检索(Connected Papers/Google Scholar)、顶会动态(NeurIPS/ICLR)资源;3. 语言学习推荐词汇平台(Vocabulary.com)、听力素材(BBC/VOA)及剑桥词典;4. 编程进阶涵盖LeetCode刷题、面试题库CodeTop和算法笔记;5. 财经资讯华尔街日报入口。
2025-09-18 15:35:47
316
原创 【Python】秋招机考 —— 2025/8/27 华为 AI 方向
2025 华为 AI 秋招机考题目包含15道单选题、5道多选题和2道机器学习编程题,涵盖核心算法与数学知识。单选题考察了Softmax激活、Transformer位置编码、Jacobi迭代、大模型幻觉现象、特征向量、K-means聚类、矩阵秩、实对称矩阵性质、SVD分解、概率论等知识点。多选题涉及高斯-赛德尔迭代和朴素贝叶斯分类器。
2025-08-31 20:30:12
590
原创 【机器学习】监督学习 —— 支持向量机(SVM)
支持向量机(SVM)是一种监督学习算法,通过寻找最优超平面实现分类和回归任务。其核心思想是最大化两个类别之间的间隔边界,提高模型泛化能力。
2025-08-31 16:51:00
1142
原创 【机器学习】监督学习 —— 线性回归
训练过程就是调节函数内部的 参数(Parameter),也可以叫做 权重(weight),来让预测值尽可能的接近 lablel。
2025-08-29 17:01:08
1109
原创 将大量参数统一放到 YAML 的最佳实践(含示例代码与用法)
本文提出了一种清晰的YAML配置文件管理方法,将项目参数按功能模块分类(data/train/model等),通过CLI加载和覆盖配置。
2025-08-17 20:34:26
855
ST-GCN 论文原文及解读
2023-12-19
ResNet 论文理解含视频
2023-12-19
ResNet 原论文及原作者讲解
2023-12-19
计算机专业基础知识汇总
2023-12-19
MDETR 论文翻译及理解
2023-12-19
吉林大学数据结构PTA上机题
2023-11-17
吉林大学程序设计 C 语言上机题目
2023-11-15
吉林大学数据结构 PTA 上机作业
2023-11-17
华为云垃圾分类大赛-垃圾 40 分类
2023-05-12
垃圾分类(可回收、有害、厨余、不可回收)
2023-05-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅