duoyasong5907
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
强化学习(1.2) TRPO
TRPO解决了此前策略在更新过程中,为了模型稳定收敛而受限于更新步长的问题。此前的策略梯度法,如REINFORCE、Actor-Critic,依赖固定步长(学习率)的更新策略。若步长过大,单次更新可能导致策略性能剧烈下降(即策略崩溃),且难以恢复。若步长过小,则收敛速度极慢,样本效率低下。原创 2025-07-14 01:04:20 · 40 阅读 · 0 评论 -
PCA主成分分析(1) 当降维到d维时,d个坐标轴的选取与方差和
【小旭学长】用最直观的方式告诉你:什么是主成分分析PCA原创 2024-02-16 23:51:26 · 23 阅读 · 0 评论 -
PCA主成分分析(3) 其它数学基础证明
如果要映射到d维,但特征向量不足d个,剩下的坐标轴怎么办?原创 2025-06-23 01:15:34 · 26 阅读 · 0 评论 -
PCA主成分分析(2) 为什么当d小于n时,方差的和不超过最大的d个特征值之和?
设每个向量有n维,现在要降维到d维。首先,根据的推导,可知数据点x在坐标轴u上的映射坐标k,等于向量点乘⟨xu⟩。所有数据点在坐标轴u上映射后的无偏估计方差和是n−11∑i1N⟨xiu1⟩2,省略pdf的中间步骤,化为u1Tn−11XXTu1u1TCu1。其中,协方差矩阵Cn−11XXT。协方差矩阵Cn−11XXT的推导过程可以上网搜索。原创 2025-07-04 00:51:04 · 24 阅读 · 0 评论 -
线代往事(1.2)为什么说如果AB=I,则BA=I?
第二句的证明可以参考。原创 2025-02-26 16:50:56 · 75 阅读 · 0 评论 -
线代往事(一)如何从几何角度理解“行列式等于零,则矩阵不可逆“?
行列式为零->矩阵满秩->矩阵可逆。原创 2024-02-17 10:48:00 · 40 阅读 · 0 评论 -
高数往事(1.3) 推导柯西不等式的向量形式
参考,原创 2025-03-04 15:05:39 · 208 阅读 · 0 评论 -
高数往事(1.2) 二维、高维空间下余弦定理、点乘公式的证明与相互推导
参考《线性代数 原书第七版 中文 利昂著》第211页。证明余弦定理需要使用向量点乘公式。原创 2025-03-04 14:55:00 · 128 阅读 · 0 评论 -
高数往事(1.1) 高斯分布的特征函数、独立高斯分布的可加性
Characteristic function (probability theory)原创 2024-10-06 14:49:16 · 774 阅读 · 0 评论 -
高数往事(2) 欧拉公式的理解和证明。
如何理解简洁的欧拉公式?原创 2024-10-06 14:33:15 · 1133 阅读 · 0 评论 -
高数往事(1) 正太分布的均值方差计算
Proof: The derivative of 𝑒ˣ is 𝑒ˣ原创 2024-09-30 10:47:34 · 941 阅读 · 0 评论