Matrix Derivative矩阵求导

最新推荐文章于 2024-09-03 10:11:56 发布

littlehaes

最新推荐文章于 2024-09-03 10:11:56 发布

阅读量1.6k

点赞数 2

分类专栏：数学文章标签：矩阵求导

本文链接：https://blog.csdn.net/littlehaes/article/details/79832602

版权

本文主要介绍了矩阵求导的基础知识，包括求导类型、布局约定（numerator layout 和 denominator layout）以及常见求导结果，如vector-by-vector、scalar-by-vector和vector-by-scalar的情况。内容特别强调了矩阵求导在机器学习中的应用，并提供了相关求导结果的表格以供查阅。

摘要由CSDN通过智能技术生成

Welcome To My Blog
学习机器学习算法时总碰见矩阵求导,现学习一波,主要总结下
注意:这里只涉及实数的求导,研究通信的人可能接触的往往是负数求导
矩阵可以写成列向量(column vectors)或行向量(row vectors)的形式,这两种不同的形式把矩阵求导分成了两种不同的情况

求导类型

表格列举了六种不同的矩阵求导类型,粗体代表向量或者矩阵(其实标量和向量也可以看作矩阵).
表格中还有三个空格没写出,实际上也是存在,但暂时先不讨论,因为这三种情况的求导结果大部分都是高于二阶的张量(tensor)形式,与常见的二维矩阵形式不同.

布局约定Layout conventions

机器学习中,以线性回归为例,每个输入都有多个属性,在表示属性时可以采用列向量或者行向量的形式,这两种形式会造成求导结果形式的不同.
注意是形式上的不同,因为本质上形式的不同不会影响求导结果,只不过将结果按照不同的方式组织起来,方便进一步运算
布局决定(Layout conventions)就是为了将不同形式的求导分类.分为两种布局:分子布局(numerator layout)和分母布局(denominator layout)
通俗解释,现规定向量或者矩阵分为原始形式和转置形式两种,比如在线性回归中我们把列向量作为属性值的原始形式,其转置形式就是行向量
+ 对于分子布局(numerator layout),求导结果中分子保持原始形式,分母为转置形式