线性算法及应用(4)

最新推荐文章于 2024-08-30 20:59:12 发布

山登绝顶我为峰 3(^v^)3

最新推荐文章于 2024-08-30 20:59:12 发布

阅读量152

点赞数

分类专栏：数学文章标签：数学线性代数算法

本文链接：https://blog.csdn.net/weixin_44885334/article/details/121376969

版权

数学专栏收录该内容

33 篇文章 5 订阅

订阅专栏

正交

内积映射： $\in V \times V \mapsto <u,v> \in R$ ，满足
- 对称性： $< u, v > = < v, u >$
- 非负性： $\ge 0$
- 正定性： $\iff u=0$
- 线性： $c_1u+c_2v,w>=c_1<u,w>+c_2<v,w>$
- 如果空间 $V$ 中定义了内积，叫做内积空间
在向量空间里，一般定义 $u,v>:=u^tv$ ，也记做 $\cdot v$
正交：内积为零， $\cdot v=0$ ；在 $R^2,R^3$ 中， $\cdot v=\Vert u \Vert \cdot \Vert v \Vert \cos{\theta}$ ，其中距离 $\Vert u \Vert := \sqrt{<u,u>}$
正交于空间 $V$ 的所有向量组成子空间，叫做 $V$ 的正交补空间，记做 $V^{\perp}$
令 $\in R^{m \times n}$ ，定义零空间： $\{x|Ax=0,\,x \in R^n\}$
令 $\in R^{m \times n}$ ，由它的行向量张成的空间叫做行空间 $R o w (A)$ ，由它的列向量张成的空间叫做列空间 $C o l (A)$
$Row(A)^{\perp}=Nul(A)$ ， $Col(A)^{\perp}=Nul(A^T)$
正交投影： $y$ 在 $u$ 上的正交投影为， $\hat y = proj_u(y) = \dfrac{y \cdot u}{u \cdot u}u$ ，且 $y=\hat y+z$ ，这里的 $\perp u$ 叫做 $y$ 正交于 $u$ 的分量。
正交集合 $S=\{u_1,\cdots,u_p\}$ ，各向量相互正交。它张成空间 $W$ ，并且 $S$ 是一组正交基。对于 $\in W$ ，那么有： $y=c_1u_1+\cdots+c_pu_p$ ，其中 $c_j = \dfrac{y \cdot u_j}{u_j \cdot u_j}$ ( $c_ju_j$ 就是 $y$ 在 $u_j$ 上的正交投影)
矩阵 $\in R^{m \times n}$ 的列向量都有单位长度； $U$ 的列向量相互正交 $\iff U^TU=I$

对于 $\in R^n$ ，
- $\Vert Ux \Vert = \Vert x \Vert$
- $Ux \cdot (Uy)=x \cdot y$
- $Ux \cdot (Uy)=0 \iff x \cdot y=0$
正交分解定理： $\sube R^n$ ，对于每个 $\in R^n$ ，可以唯一地写作 $y=\hat y+z$ ，其中 $\hat y \in W,\,z \in W^\perp$ ；当 $\{u_1,\cdots,u_p\}$ 是 $W$ 的一组正交基，那么 $\hat y = c_1u_1+\cdots+c_pu_p,\,c_j = \dfrac{y \cdot u_j}{u_j \cdot u_j}$ ，且 $z=y-\hat y$ ；这里的 $\hat y$ 叫做 $y$ 在 $W$ 上的正交投影，记为 $proj_W(y)$
$\{u_1,\cdots,u_p\}$ 是 $\sube R^n$ 的单位正交基，令 $U=[u_1\,\,u_2\,\,\cdots\,\,u_p]$ ，那么： $proj_W(y) = (y \cdot u_1)u_1+\cdots+(y \cdot u_p)u_p = UU^Ty$
如果 $\in W$ ，那么 $proj_W(y)=y$
最佳近似定理： $\sube R^n$ ，对于每个 $\in R^n$ ，令 $\hat y=proj_W(y)$ ，那么 $\hat y$ 是 $W$ 里靠近 $y$ 的最近点： $\Vert y-\hat y \Vert < \Vert y-v \Vert,\,\hat y \not = v \in W$
Cauchy-Schwarz Inequality： $\forall u,v \in V,\,|<u,v>| \le \Vert u \Vert \cdot \vert v \Vert$
Triangle Inequality： $\forall u,v \in V,\,\Vert u+v \Vert \le \Vert u \Vert + \vert v \Vert$

算法

Gram-Schmidt Process：产生正交基的算法
- 给定 $\sube R^n$ 的任意一组基 $\{x_1,\cdots,x_p\}$
- 计算 $v_1=x_1$ ，令 $W_1 = Span\{v_1\}$
- 计算 $v_{k}=x_k - proj_{W_{k-1}}x_{k}$ ，它与 $v_j,\,j \le k-1$ 都正交，令 $W_{k}=Span\{v_1,\cdots,v_k\}$
- 那么 $\{v_1,\cdots,v_p\}$ 是 $W$ 的一组正交基，且 $Span\{v_1,\cdots,\,v_k\} = Span\{x_1,\cdots,x_k\},\, 1 \le k \le p$
- 易知， $v_k = x_k - \sum_{j=1}^k \dfrac{x_k \cdot v_j}{v_j \cdot v_j}v_j$
单位正交基可以由正交基得到： $u_i=\dfrac{v_i}{\Vert v_i \Vert}$
QR分解：对于各列向量线性无关的矩阵 $\in R^{m \times n}$ (列满秩，必定 $\ge n$ )，那么有分解： $A = Q R$ ，其中 $\in R^{m \times n}$ 是 $C o l (A)$ 的单位正交基，而 $\in R^{n \times n}$ 是上三角可逆方阵，且 $R_{ii}>0$
- 令 $A$ 的列向量是 $\{x_1,\cdots,x_n\}$ ，它是 $C o l (A)$ 的一组基。
- 用Gram-Schmidt Process算法，计算 $C o l (A)$ 的单位正交基 $\{u_1,\cdots,u_n\}$ ，令 $Q=[u_1\,\cdots\,u_n]$
- 由于 $Span\{v_1,\cdots,\,v_k\} = Span\{x_1,\cdots,x_k\}$ ，因此 $x_k = r_{1k}u_1+\cdots+r_{kk}u_k+ \overrightarrow 0$ ，令 $r_k = [r_{1k}\,\,\cdots\,r_{kk}\,\,0\,\cdots\,0]^t$ ，则 $x_k=Q\cdot r_k$ ；令 $R=[r_1\,\cdots\,r_n]$
- 易知， $A=[x_1\,\cdots\,x_n]=[Q\,r_1\,\cdots\,Q\,r_n]=QR$
在计算机上，Gram-Schmidt Process计算每个 $v_k$ 时会有小的误差，并会随着计算累积误差，往往使得 $u_j^Tu_k$ 并不接近0；这可以通过重新排列计算来减少误差。为了计算QR分解，我们往往对 $A$ 左乘一系列正交矩阵 (类似LU分解)，使得它变成上三角矩阵。
最小二乘法： $\in R^{m \times n}$ 且 $\in R^m$ ，那么方程 $A x = b$ 不一定有解，它的最小二乘解定义为： $\hat x$ ，使得 $\Vert b-A\hat x \Vert \le \Vert b-Ax \Vert,\,\forall x \in R^n$
- 令 $\hat b = proj_{Col(A)}(b)$ ，那么 $A\hat x=\hat b$ ，即 $\hat x = [\hat b]_{A}$
- $b=\hat b+z=A\hat x +z$ ，那么 $\perp Col(A)$ ，从而 $\in Nul(A^T)$ ，即 $A^T(b-A\hat x)=0$
- $A x = b$ 的最小二乘解 $\hat x$ 满足方程： $A^TAx=A^Tb$ ，后者叫做normal equations
- 当 $A^TA$ 可逆 (等价于 $A$ 列满秩，也等价于 $Ax=b,\,\forall b \in R^m$ 都有唯一最小二乘解)，那么最小二乘解是： $\hat x=(A^TA)^{-1}A^Tb$
- 如果 $A$ 不是列满秩，那么虽然投影 $\hat b$ 唯一，但 $A\hat x=\hat b$ 的解 $\hat x=[\hat b]_A$ 不唯一
对于列满秩长矩阵 $\in R^{m \times n}$ ，它可以分解为 $A = Q R$ ；那么，对于任意的 $\in R^m$ ，方程 $A x = b$ 的最小二乘解是： $\hat x=R^{-1} Q^T b$
$\hat x$ 是 $Rx=Q^Tb$ 的解，并且求解这个方程 (利用 $R\,|\,Q^Tb]$ 的行约减) 比计算与逆矩阵的乘法要快得多。
一般线性模型： $\beta + \epsilon$ ；给定 $X, y$ ，求最小二乘解 $\hat \beta$
其他曲线模型： $y=\beta_0f_0(x)+\cdots+\beta_kf_k(x)+\epsilon$ ；已知函数 $f_j$ ，对于固定的参数 $\beta_j$ ，根据点集 $x_i,y_i)$ ，确定出 $\hat \beta_j$
- 它其实也是线性模型，因为点集 $x_i,y_i)$ 给定后， $f_j(x_i)$ 是固定值。
- 例如， $y=\beta_0+\beta_1 x+\beta_2 x^2+\epsilon$ ，可以写作
  $\begin{bmatrix} 1 & x_1 & x_1^2\\ & \vdots \\ 1 & x_n & x_n^2\\ \end{bmatrix} \begin{bmatrix} \beta_0\\ \beta_1\\ \beta_2\\ \end{bmatrix} + \begin{bmatrix} \epsilon_0\\ \epsilon_1\\ \epsilon_2\\ \end{bmatrix} = X\beta+\epsilon$
对于多变元曲线，举例，二变元曲线，可写作： $y=\beta_0f_0(u,v)+\cdots+\beta_kf_k(u,v)$ ，其中 $f_j$ 是已知函数， $\beta_j$ 是固定的未知参数；给定点集 $u_i,v_i),y_i)$ ，它还是 $y=X\beta+\epsilon$ 形式。例如 $y=\beta_0+\beta_1 u+\beta_2 v$ ，可以写作 $y=\beta_0+(\beta_1 u+\beta_2 v) + (\beta_3u^2+\beta_4uv+\beta_5v^2)$ ；更多变元的类似，略。
一元整系数多项式空间 $P_n$ 上的内积函数：对于 $\in P_n$ ，给定离散实数 $t_0,\cdots,t_n$ ，定义为
$<p,q>=p(t_0)q(t_0)+p(t_1)q(t_1)+\cdots+p(t_n)q(t_n)$
易证，它满足内积的要求，因此它是内积函数。
利用上述的内积，可以对 $P_n$ 利用Gram-Schmidt Process计算一组正交基 $\{p_0(x),p_1(x),\cdots,p_{n+1}(x)\}$ ；例如，取定离散点 ${-2,-1,0,1,2\}$ ，那么 ${p_0(x)=1,\,p_1(x)=x,\,p_2(x)=t^2-2\}$ 是 $P_2$ 的一组正交基。
利用上述的 $P_n$ 的正交基，给定点集 $x_i,y_i)$ ，那么我们也可以用至多n度的一元多项式做拟合，计算最小二乘解 $\hat p(x)$
连续一元多项式空间上，取值自 $C [a, b]$ 的任意两个多项式 $f (x), g (x)$ ，可以定义内积函数： $\dfrac{1}{b-a}\int_a^b f(t)g(t) dt$
在 $C[0,2\pi]$ 上， $\forall n \ge 1,\, \{ 1,\cos{t},\sin{t},\cdots,\cos{nt},\sin{nt} \}$ 相互正交。应用：傅里叶级数、傅里叶变换。

山登绝顶我为峰 3(^v^)3

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
线性算法及应用(4)

正交内积映射：(u,v)∈V×V↦<u,v>∈R(u,v) \in V \times V \mapsto <u,v> \in R(u,v)∈V×V↦<u,v>∈R，满足对称性：<u,v>=<v,u><u,v>=<v,u><u,v>=<v,u>非负性：<u,u>≥0<u,u> \ge 0<u,u>≥0正定性：<u,u>=0 ⟺ u=0&l
复制链接

扫一扫

专栏目录