数学 ===========================
文章平均质量分 96
数学
云端FFF
not because they are easy, but because they are hard
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
LLM-RL 的探索困境
策略梯度RL算法作为一种可微代理优化方法,其天然倾向于 “在无法探索时缩小探索范围”,这导致将 RL 用于 LLM post training 时难以从本质上提升性能原创 2025-12-20 19:32:31 · 893 阅读 · 0 评论 -
Wasserstein 距离简介
Wasserstein距离是一种基于最优传输思想的概率分布度量方法,本文介绍了其定义、一维情况下基于CDF的计算方法和与CRPS损失的关系原创 2025-10-26 23:45:21 · 1199 阅读 · 0 评论 -
小目标检测的尺寸极限
本文从统计检测理论出发,建立了小目标检测问题的数学模型。通过将检测问题形式化为二元假设检验,推导出基于KL散度的可检测性度量,为小目标检测限提供了量化依据。原创 2025-09-17 21:05:02 · 812 阅读 · 0 评论 -
多维高斯分布的信息熵和KL散度计算
很多现实问题的原始特征分布都可以看作多维高斯分布,本文以数据特征服从多维高斯分布的多分类任务这一理想场景为例,从理论层面分析数据特征和分类问题难度的关系原创 2024-11-24 18:35:39 · 1669 阅读 · 4 评论 -
从费舍尔信息矩阵(Fisher Information Matrix, FIM)到自然梯度法
本文以自然梯度法的推导为脉络,贯穿黎曼空间、黎曼流形、黎曼度量、费舍尔信息矩阵、KL 散度和自然梯度法等概念。这是 TRPO 算法理论的重要基础原创 2024-01-18 09:01:19 · 11245 阅读 · 4 评论 -
函数空间一览:从线性空间到再生核希尔伯特空间
介绍线性空间、度量空间、赋范向量空间、内积空间、巴拿赫空间、希尔伯特空间和再生核希尔伯特空间原创 2022-10-08 11:49:44 · 1489 阅读 · 0 评论 -
玻尔兹曼分布详细推导、softmax 及 Energy Based Model
从推导和理解玻尔兹曼分布开始,推出 softmax 函数,最后介绍基于能量的模型原创 2022-09-19 18:24:37 · 8972 阅读 · 0 评论 -
一文看懂拉格朗日乘子法、KKT条件和对偶问题
拉格朗日乘子法是解约束优化问题的常用方法,它和 KKT 条件、Slater 条件、拉格朗日对偶性等概念常常一起出现,本文梳理说明相关概念,并从几何与代数两个角度加以解释原创 2022-07-27 16:53:38 · 8567 阅读 · 17 评论 -
详解勒让德变换与共轭函数
从代数和几何角度对勒让德变换和共轭函数进行详细说明原创 2022-07-22 15:55:16 · 4728 阅读 · 4 评论 -
信息论概念详细梳理:信息量、信息熵、条件熵、互信息、交叉熵、KL散度、JS散度
梳理几个信息论相关概念信息量、信息熵、条件熵、互信息、交叉熵、KL散度、JS散度原创 2022-01-10 16:43:53 · 8911 阅读 · 3 评论 -
一文看懂最小二乘法
详细说明最小二乘法的应用场景、原理、求解方法、局限性等内容,并从三个角度阐释了最小二乘法的本质原创 2022-02-10 08:22:26 · 8700 阅读 · 2 评论 -
多元函数泰勒展开与黑塞矩阵
文章目录1. 引入:函数展开2. 泰勒展开2.1 一元函数泰勒展开2.2 二元函数泰勒展开2.3 n元函数泰勒展开3. 黑塞矩阵(海森矩阵)1. 引入:函数展开设函数 y=f(x)y = f(x)y=f(x) 在点 x0x_0x0 处可导,则在点 x0x_0x0 的某邻域内,可以用下式表示原函数值f(x)=f(x0)+f′(x0)(x−x0)+o(x−x0), x→x0f(x) = f(x_0)+f'(x_0)(x - x_0) + o(x - x_0),\sp原创 2021-08-26 02:02:04 · 3098 阅读 · 0 评论 -
Jensen 不等式
参考:《数值最优化方法》—— 高立Jensen不等式初步理解及证明Jensen不等式讲解与证明文章目录1. 凸集与凸函数1.1 凸集1.2 凸函数2. Jensen不等式2.1 Jensen不等式2.2 证明2.3 扩展1. 凸集与凸函数1.1 凸集定义:设集合 C⊂RnC \subset \mathbb{R}^nC⊂Rn,若对 ∀x,y∈C\forall x,y \in C∀x,y∈C,有θx+(1−θ)y∈C,θ∈[0,1] \theta x + (1-\theta)y.原创 2021-03-28 02:48:45 · 9128 阅读 · 3 评论
分享