Introduction to Linear Algebra, Chapter-1, Introductionto Vectors, Key Notes
本人在阅读MIT数学教授Gilbert Strang所著线性代数教材"Introduction to Linear Algebra(Fifth Edition)"过程中敲下的笔记
我是用的教学视频是BV1uK4y187ep
课后习题答案即其相关资料可参照math.mit.edu/linearalgebra
1.1 Vectors and Linear Combinations
Column Vector(列向量)
v
→
=
[
v
1
v
2
]
\overrightarrow{v} = \begin{bmatrix} v_1 \\ v_2 \end{bmatrix}
v=[v1v2]
Vector Addition(向量加法)
v
→
=
[
v
1
v
2
]
,
w
→
=
[
w
1
w
2
]
,
v
→
+
w
→
=
[
v
1
+
w
1
v
2
+
w
2
]
\overrightarrow{v} = \begin{bmatrix} v_1 \\ v_2 \end{bmatrix} \quad,\quad \overrightarrow{w} = \begin{bmatrix} w_1 \\ w_2 \end{bmatrix} \quad,\quad \overrightarrow{v} + \overrightarrow{w} = \begin{bmatrix} v_1 + w_1 \\ v_2 + w_2 \end{bmatrix}
v=[v1v2],w=[w1w2],v+w=[v1+w1v2+w2]
Scalar Multiplication(标量乘法)
c
v
→
=
[
c
v
1
c
v
2
]
c \overrightarrow{v} = \begin{bmatrix} c v_1 \\ c v_2 \end{bmatrix}
cv=[cv1cv2]
Linear Combination(线性组合)
c
v
→
+
d
w
→
=
[
c
v
1
+
d
w
1
c
v
2
+
d
w
2
]
c \overrightarrow{v} + d \overrightarrow{w} = \begin{bmatrix} c v_1 + d w_1 \\ c v_2 + d w_2 \end{bmatrix}
cv+dw=[cv1+dw1cv2+dw2]
1.2 Length and Dot Products
Dot Product/Inner Product(向量的点积/内积)
v
→
⋅
w
→
=
v
1
w
1
+
v
2
w
2
\overrightarrow{v} \cdot \overrightarrow{w} = v_1w_1 + v_2w_2
v⋅w=v1w1+v2w2
当两个向量的点积为0时,这两个向量相互垂直(perpendicular)
DEFINITION: Length of Vecter
∣
∣
v
→
∣
∣
||\overrightarrow{v}||
∣∣v∣∣ if the squre root of
v
→
⋅
v
→
\overrightarrow{v} \cdot \overrightarrow{v}
v⋅v
定义:一个向量的模(长度)是它自己和自己的点积的平方根。
l e n g t h = ∣ ∣ v → ∣ ∣ = v → ⋅ v → = ( v 1 2 + v 2 2 + ⋯ + v n 2 ) 1 / 2 \bold{length} = ||\overrightarrow{v}|| = \sqrt{\overrightarrow{v} \cdot \overrightarrow{v}} = (v_1^2 + v_2^2 + \cdots + v_n^2)^{1/2} length=∣∣v∣∣=v⋅v=(v12+v22+⋯+vn2)1/2
DEFINITION: A unit vector is a vector whose length is 1
定义:模长为1的向量叫做单位向量
U
n
i
t
V
e
c
t
o
r
s
:
u
→
⋅
u
→
=
1
\bold{Unit \; Vectors}: \quad \overrightarrow{u} \cdot \overrightarrow{u} = 1
UnitVectors:u⋅u=1
produce a unit vector in the same direction as
v
→
\overrightarrow{v}
v from
v
→
\overrightarrow{v}
v
u
→
=
v
→
/
∣
∣
v
→
∣
∣
\overrightarrow{u} = \overrightarrow{v} / ||\overrightarrow{v}||
u=v/∣∣v∣∣
COSINE FORMULA
if
v
→
\overrightarrow{v}
v and
w
→
\overrightarrow{w}
w are nonzeoro vectors, then
cos
θ
=
v
→
⋅
w
→
∣
∣
v
→
∣
∣
∣
∣
w
→
∣
∣
\cos \theta = \frac{\overrightarrow{v} \cdot \overrightarrow{w}}{||\overrightarrow{v}|| \; ||\overrightarrow{w}||}
cosθ=∣∣v∣∣∣∣w∣∣v⋅w
θ
\theta
θ is the angle from
v
→
\overrightarrow{v}
v to
w
→
\overrightarrow{w}
w
SCHWARZ INEQUALITY(施瓦尔兹不等式)
v
→
⋅
w
→
≤
∣
∣
v
→
∣
∣
∣
∣
w
→
∣
∣
\overrightarrow{v} \cdot \overrightarrow{w} \le ||\overrightarrow{v}|| \; ||\overrightarrow{w}||
v⋅w≤∣∣v∣∣∣∣w∣∣
as
cos
≤
1
\cos \le 1
cos≤1
TRIANGLE INEQUALITY(三角不等式)
∣
∣
v
→
+
w
→
∣
∣
≤
∣
∣
v
→
∣
∣
+
∣
∣
w
→
∣
∣
||\overrightarrow{v} + \overrightarrow{w}|| \le ||\overrightarrow{v}|| + ||\overrightarrow{w}||
∣∣v+w∣∣≤∣∣v∣∣+∣∣w∣∣
几何平均与算数平均
x
y
≤
1
2
(
x
+
y
)
\sqrt{xy} \le \frac{1}{2}(x + y)
xy≤21(x+y)
can be proved if we let
x
=
a
2
x = a^2
x=a2 and
y
=
b
2
y = b^2
y=b2
1.3 Matrices
矩阵与向量相乘,得到的结果是原矩阵的各个列的线性组合
A
x
→
A\overrightarrow{x}
Ax outputs a combination of the columns of
A
A
A
逆矩阵
A
x
→
=
b
→
x
→
=
A
−
1
b
→
A\overrightarrow{x} = \overrightarrow{b} \quad \overrightarrow{x} = A^{-1}\overrightarrow{b}
Ax=bx=A−1b
书本这里使用一个特殊的例子把矩阵求逆和微积分做了类比,挺精彩的,建议看网课或者教材。
Independence and Dependence(线性相关和线性无关)
令 A = [ u → , v → , w → ] , A x → = b → A = \begin{bmatrix} \overrightarrow{u}, \overrightarrow{v}, \overrightarrow{w} \end{bmatrix}, A\overrightarrow{x} = \overrightarrow{b} A=[u,v,w],Ax=b
如果这三个向量线性相关(dependent),则 w → \overrightarrow{w} w在 v → \overrightarrow{v} v和 n → \overrightarrow{n} n组成的平面上,如果这三个向量线性无关(inpedendent),则 w → \overrightarrow{w} w不在 u → \overrightarrow{u} u和 v → \overrightarrow{v} v组成的平面上。
如果 u → , v → , w → \overrightarrow{u}, \overrightarrow{v}, \overrightarrow{w} u,v,w线性无关,只有 0 u → + 0 v → + 0 w → 0\overrightarrow{u}+0\overrightarrow{v}+0\overrightarrow{w} 0u+0v+0w才能让 b → = 0 \overrightarrow{b}=0 b=0,如果 u → , v → , w → \overrightarrow{u}, \overrightarrow{v}, \overrightarrow{w} u,v,w线性相关,一定存在其他组和可以让 b → = 0 \overrightarrow{b}=0 b=0
如果 u → , v → , w → \overrightarrow{u}, \overrightarrow{v}, \overrightarrow{w} u,v,w线性无关,则 A x → = 0 → A\overrightarrow{x}=\overrightarrow{0} Ax=0只有一个解且 A A A可逆,如果 u → , v → , w → \overrightarrow{u}, \overrightarrow{v}, \overrightarrow{w} u,v,w线性相关则 A x → = 0 → A\overrightarrow{x} = \overrightarrow{0} Ax=0有无穷多的解且矩阵 A A A不可逆(奇异矩阵)
有趣的习题
1.2.32 证明对于三个元素证明几何平均 ≤ \le ≤算术平均
证明:
x
y
z
≤
1
3
(
x
+
y
+
z
)
\sqrt{xyz} \le \frac{1}{3}(x + y + z)
xyz≤31(x+y+z)
显然,当
x
=
y
=
z
x=y=z
x=y=z是,原不等式成立,其他情况下设
z
≤
x
≤
y
z \le x \le y
z≤x≤y,并令
A
=
1
3
(
x
+
y
+
z
)
A = \frac{1}{3}(x+y+z)
A=31(x+y+z),则
z
<
A
<
y
z < A < y
z<A<y
对于
x
x
x和
y
+
z
−
A
y+z-A
y+z−A两个数,使用对于两个数字的几何平均
≤
\le
≤算术平均不等式,有
x
(
y
+
z
−
A
)
≤
1
2
(
x
+
y
+
z
−
A
)
=
A
\sqrt{x(y+z-A)} \le \frac{1}{2}(x + y + z - A) = A
x(y+z−A)≤21(x+y+z−A)=A
∴
x
(
y
+
z
−
A
)
A
≤
A
3
\therefore x(y+z-A)A \le A^3
∴x(y+z−A)A≤A3
∴
x
[
(
y
−
A
)
(
A
−
z
)
+
y
z
]
≤
A
3
\therefore x[(y-A)(A-z) + yz] \le A^3
∴x[(y−A)(A−z)+yz]≤A3
∵
(
y
−
A
)
(
A
−
z
)
>
0
\because (y-A)(A-z) \gt 0
∵(y−A)(A−z)>0
∴
x
y
z
≤
A
3
\therefore xyz \le A^3
∴xyz≤A3
∴
3
x
y
z
<
A
=
1
3
(
x
+
y
+
z
)
\therefore ^3\sqrt{xyz} \lt A = \frac{1}{3}(x+y+z)
∴3xyz<A=31(x+y+z)
综上,
3
x
y
z
≤
1
3
(
x
+
y
+
z
)
^3\sqrt{xyz} \le \frac{1}{3}(x+y+z)
3xyz≤31(x+y+z)得证
1.2.34(这道题目有点小错误啊)
题面:
首先,我们随机生成一个三维单位向量
u
→
\overrightarrow{u}
u,然后,我们随机生成一组三维单位向量
U
U
U,然后,对于每一个
U
i
→
\overrightarrow{U_i}
Ui,计算
∣
u
→
⋅
U
i
→
∣
|\overrightarrow{u} \cdot \overrightarrow{U_i}|
∣u⋅Ui∣,即
∣
cos
(
θ
)
∣
|\cos(\theta)|
∣cos(θ)∣,然后计算所有内积的平均值
a
=
1
n
∑
i
=
1
i
=
n
∣
u
→
⋅
U
i
→
∣
a = \frac{1}{n} \sum_{i=1}^{i=n}|\overrightarrow{u} \cdot \overrightarrow{U_i}|
a=n1∑i=1i=n∣u⋅Ui∣,从微积分的角度来讲,
a
a
a的值应该接近
1
π
∫
0
π
∣
cos
θ
∣
δ
θ
=
2
π
\frac{1}{\pi} \int_0^{\pi}|\cos \theta| \delta \theta = \frac{2}{\pi}
π1∫0π∣cosθ∣δθ=π2。
解题过程:
一开始,我严格按照题目要求计算了这个平均值,发现
a
≈
.
5
a\approx.5
a≈.5,而
2
π
≈
0.637
\frac{2}{\pi} \approx 0.637
π2≈0.637,这个差距就有点大了。
我最开始怀疑,是不是因为用randn函数随机生成向量,导致生成的单位向量在三维球面上不能均匀分布,于是我(不怎么严谨的)通过可视化数据的方式查看了一下随机生成的数据,发现分布的很均匀,问题不在这里。
然后,我重新看了几遍体面,发现体面给的这个定积分 1 π ∫ 0 π ∣ cos θ ∣ δ θ = 2 π \frac{1}{\pi} \int_0^{\pi}|\cos \theta| \delta \theta = \frac{2}{\pi} π1∫0π∣cosθ∣δθ=π2的隐含假设是 θ \theta θ在 [ 0 , π ] [0, \pi] [0,π]上均匀分布,对于随机生成的二维单位向量,向量的“终点”均匀分布在单位圆上,所以 θ \theta θ也是均匀分布的,但如果是对于三维单位向量,虽然其终点在单位球上均匀分布,但是 θ \theta θ未必是均匀分布了。
我用Python验证了一下我的猜想,结果如下:
这是针对二维单位向量的结果,可以看到测试样本均匀分布在单位圆上,
θ
\theta
θ也基本呈现均匀分布,所以计算出的均值和理论值
2
/
π
2/\pi
2/π基本接近。
这是针对三维单位向量的结果,可以看到测试样本均匀分布在单位球上,但是
θ
\theta
θ就不是均匀分布的了,这也导致使用三维向量计算出的
a
=
1
n
∑
i
=
1
i
=
n
∣
u
→
⋅
U
i
→
∣
≈
0.5
a = \frac{1}{n} \sum_{i=1}^{i=n}|\overrightarrow{u} \cdot \overrightarrow{U_i}| \approx 0.5
a=n1∑i=1i=n∣u⋅Ui∣≈0.5,与定积分
1
π
∫
0
π
∣
cos
θ
∣
δ
θ
=
2
π
\frac{1}{\pi} \int_0^{\pi}|\cos \theta| \delta \theta = \frac{2}{\pi}
π1∫0π∣cosθ∣δθ=π2相去甚远。
我承认,MIT教材中引入微积分进行类比的操作让我眼前一亮,但是这一道思考题明显出了一点小差错(难不成是故意的?)
这是网站上这道题目的官方答案:
我的代码:
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from mpl_toolkits import mplot3d
dim = 3
size = 2000
sns.set()
u = np.random.randn(dim)
u = u / np.linalg.norm(u)
sample = np.random.randn(dim, size)
s = 0
theta = []
for i in range(size):
v = sample[:, i]
v = v / np.linalg.norm(v)
s = s + abs(u.dot(v))
theta.append(np.arccos(u.dot(v)))
sample[:, i] = v
s = s / size
if dim == 2:
plt.figure(figsize=(5, 5))
plt.scatter(sample[0], sample[1], s=0.1)
plt.title(f'dim={dim}, ave={s:.3f}, {2 / np.pi=:.3f}, {size=}')
plt.show()
plt.figure(figsize=(5, 5))
plt.hist(theta, bins=30)
plt.title(f'dim={dim}, ave={s:.3f}, {2 / np.pi=:.3f}, {size=}')
plt.show()
if dim == 3:
fig, ax = plt.figure(), plt.axes(projection='3d')
ax.scatter3D(sample[0], sample[1], sample[2], s=0.5)
ax.set_title(f'dim={dim}, ave={s:.3f}, {2 / np.pi=:.3f}, {size=}')
fig.show()
plt.figure(figsize=(5, 5))
plt.hist(theta, bins=30)
plt.title(f'dim={dim}, ave={s:.3f}, {2 / np.pi=:.3f}, {size=}')
plt.show()