向量和矩阵乘法表示_已知xy均为三维列向量xty求ytx-CSDN博客

本文链接：https://blog.csdn.net/weixin_40548136/article/details/121664379

CS229-LinearAlgebra

向量-向量乘法

给定两个向量 $\in \mathbb{R}^{n}$ , $x^T y$ 通常称为向量内积或者点积，结果是个实数。
$x^{T} y \in \mathbb{R}=\left[\begin{array}{llll}{x_{1}} & {x_{2}} & {\cdots} & {x_{n}}\end{array}\right]\left[\begin{array}{c}{y_{1}} \\ {y_{2}} \\ {\vdots} \\ {y_{n}}\end{array}\right]=\sum_{i=1}^{n} x_{i} y_{i}$
注意： $x^T y = y^Tx$ 始终成立。

给定向量 $\in \mathbb{R}^{m}$ , $\in \mathbb{R}^{n}$ (他们的维度是否相同都没关系)， $xy^T \in \mathbb{R}^{m \times n}$ 叫做**向量外积 ** , 当 $xy^T)_{ij} = x_iy_j$ 的时候，它是一个矩阵。

$y^{T} \in \mathbb{R}^{m \times n}=\left[\begin{array}{c}{x_{1}} \\ {x_{2}} \\ {\vdots} \\ {x_{m}}\end{array}\right]\left[\begin{array}{llll}{y_{1}} & {y_{2}} & {\cdots} & {y_{n}}\end{array}\right]=\left[\begin{array}{cccc}{x_{1} y_{1}} & {x_{1} y_{2}} & {\cdots} & {x_{1} y_{n}} \\ {x_{2} y_{1}} & {x_{2} y_{2}} & {\cdots} & {x_{2} y_{n}} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {x_{m} y_{1}} & {x_{m} y_{2}} & {\cdots} & {x_{m} y_{n}}\end{array}\right]$
举一个外积如何使用的一个例子：让 $1\in R^{n}$ 表示一个 $n$ 维向量，其元素都等于1，此外，考虑矩阵 $\in R^{m \times n}$ ，其列全部等于某个向量 $\in R^{m}$ 。我们可以使用外积紧凑地表示矩阵 $A$ :

$A=\left[\begin{array}{llll}{ |} & { |} & {} & { |} \\ {x} & {x} & {\cdots} & {x} \\ { |} & { |} & {} & { |}\end{array}\right] =\left[\begin{array}{cccc}{x_{1}} & {x_{1}} & {\cdots} & {x_{1}} \\ {x_{2}} & {x_{2}} & {\cdots} & {x_{2}} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {x_{m}} & {x_{m}} & {\cdots} & {x_{m}}\end{array}\right]=\left[\begin{array}{c}{x_{1}} \\ {x_{2}} \\ {\vdots} \\ {x_{m}}\end{array}\right]\left[\begin{array}{lll}{1} & {1} & {\cdots} & {1}\end{array}\right]=x \mathbf{1}^{T}$

矩阵-向量乘法

给定矩阵 $\in \mathbb{R}^{m \times n}$ ，向量 $\in \mathbb{R}^{n}$ , 它们的积是一个向量 $\in R^{m}$ 。有几种方法可以查看矩阵向量乘法，我们将依次查看它们中的每一种。

如果我们按行写 $A$ ，那么我们可以表示 $A x$ 为：
$x=\left[\begin{array}{ccc}{-} & {a_{1}^{T}} & {-} \\ {-} & {a_{2}^{T}} & {-} \\ {} & {\vdots} & {} \\ {-} & {a_{m}^{T}} & {-}\end{array}\right] x=\left[\begin{array}{c}{a_{1}^{T} x} \\ {a_{2}^{T} x} \\ {\vdots} \\ {a_{m}^{T} x}\end{array}\right]$

换句话说，第 $i$ 个 $y$ 是 $A$ 的第 $i$ 行和 $x$ 的内积，即： $y_i = y_{i}=a_{i}^{T} x$ 。
同样的，可以把 $A$ 写成列的方式，则公式如下：
$x=\left[\begin{array}{cccc} | & | & & | \\ a^{1} & a^{2} & {\cdots} & a^{n} \\ | & | & & { |}\end{array}\right]\left[\begin{array}{c}{x_{1}} \\ {x_{2}} \\ {\vdots} \\ {x_{n}}\end{array}\right]= a^1 x_{1}+a^2x_{2}+{\cdots} +a^nx_{n}$

换句话说， $y$ 是 $A$ 的列的线性组合，其中线性组合的系数由 $x$ 的元素给出。

到目前为止，我们一直在右侧乘以列向量，但也可以在左侧乘以行向量。
$y^T = x^TA$ 表示 $\in \mathbb{R}^{m \times n}$ ， $\in \mathbb{R}^{m}$ ， $\in \mathbb{R}^{n}$ 。和以前一样，我们可以用两种可行的方式表达 $y^T$ ，这取决于我们是否根据行或列表达 $A$ .

第一种情况，我们把 $A$ 用列表示：

$y^{T}=x^{T} A=x^{T}\left[\begin{array}{cccc}{ |} & { |} & {} & { |} \\ {a^{1}} & {a^{2}} & {\cdots} & {a^{n}} \\ { |} & { |} & {} & { |}\end{array}\right]=\left[\begin{array}{cccc}{x^{T} a^{1}} & {x^{T} a^{2}} & {\dots} & {x^{T} a^{n}}\end{array}\right]$

这表明 $y^T$ 的第 $i$ 个元素等于 $x$ 和 $A$ 的第 $i$ 列的内积。

最后，根据行表示 $A$ ，我们得到了向量-矩阵乘积的最终表示:

$y^T=x^TA =\left[\begin{array}{llll}{x_{1}} & {x_{2}} & {\cdots} & {x_{n}}\end{array}\right]\left[\begin{array}{c}{-a_{1}^{T}-} \\ {-a_{2}^{T}-} \\ {\vdots} \\ {-a_{m}^{T}-}\end{array}\right] =x_{1}\left[-a_{1}^{T}-\right]+x_{2}\left[-a_{2}^{T}-\right]+\ldots+x_{n}\left[-a_{n}^{T}-\right]$
所以我们看到 $y^T$ 是 $A$ 的行的线性组合，其中线性组合的系数由 $x$ 的元素给出。

矩阵-矩阵乘法

$\begin{aligned} A_{m\times n} B_{n\times m}&= \left[\begin{array}{cccc} \sum_{i=1}^n a_{1i}b_{i1} & \sum_{i=1}^n a_{1i}b_{i2} & \cdots & \sum_{i=1}^n a_{1i}b_{im} \\ \sum_{i=1}^n a_{2i}b_{i1} & \sum_{i=1}^n a_{2i}b_{i2} & \cdots & \sum_{i=1}^n a_{2i}b_{im} \\ \vdots & \vdots & \ddots & \vdots \\ \sum_{i=1}^n a_{mi} b_{i1} & \sum_{i=1}^n a_{mi} b_{i2} & \cdots & a_{mi} b_{im} \end{array}\right] =\left[\begin{array}{cccc} a_{1}^Tb_{1} & a_{1}^Tb_{2} & \cdots & a_{1}^Tb_{m} \\ a_{2}^Tb_{1} & a_{2}^Tb_{2} & \cdots & a_{2}^Tb_{m} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m}^Tb_{1} & a_{m}^Tb_{2} & \cdots & a_{m}^Tb_{m} \end{array}\right]\\ &=\sum_{i=1}^n\left[\begin{array}{cccc} a_{1i}b_{i1} & a_{1i}b_{i2} & \cdots & a_{1i}b_{im} \\ a_{2i}b_{i1} & a_{2i}b_{i2} & \cdots & a_{2i}b_{im} \\ \vdots & \vdots & \ddots & \vdots \\ a_{mi}b_{i1} & a_{mi}b_{i2} & \cdots & a_{mi}b_{im} \\ \end{array}\right] =\sum_{i=1}^na_ib_i^T \end{aligned}$
将A矩阵分块为列列向量，B矩阵分块为行向量
$B=\left[\begin{array}{cccc}{ |} & { |} & {} & { |} \\ {a_{1}} & {a_{2}} & {\cdots} & {a_{n}} \\ { |} & { |} & {} & { |}\end{array}\right]\left[\begin{array}{c}{-}& {b_{1}^{T}}&{-} \\ {-}& {b_{2}^{T}}&{-} \\ {\vdots} \\{-}& {b_{n}^{T}}&{-}\end{array}\right]=\sum_{i=1}^{n} a_{i} b_{i}^{T}$
将A矩阵分块为行向量
$B=\left[\begin{array}{ccc}{-} & {a_{1}^{T}} & {-} \\ {-} & {a_{2}^{T}} & {-} \\ {} & {\vdots} & {} \\ {-} & {a_{m}^{T}} & {-}\end{array}\right] B=\left[\begin{array}{c} {-} & {a_{1}^{T} B} & {-}\\ {-} & {a_{2}^{T} B} & {-} \\ {\vdots} \\ {-} & {a_{m}^{T} B}& {-}\end{array}\right]$