本文中,用
R
表示实数,
符号
A
既可以表示
(在表示向量的符号中,*不进行任何操作;考虑到矩阵乘法,所有向量都看做列向量。我们不断的使用向量符号是为了让大家熟悉它的二元性,也就说说,既可以将向量看做点,也可以将向量看成线性函数的
n
元系数)所有证明过程都会用符号
如果
x,y
是
Rn
中不同的点,那么形如下面的点集就叫做通过
x,y
的直线
M
是
空集 ∅ 和空间 Rn 本身就是仿射集的极端例子,另外 M 仅有一个孤立点的情况也满足定义。一般来讲,仿射集必须包含通过任意两个点的整条直线,直观印象是不存在弯曲的部分,就像空间中的一条直线或者一个平面。
仿射集正式的几何意义可能是从线性代数中
定理1.1 Rn 的子空间是包含原点的仿射集。
证明:每个子空间包含0并且对于加法和标量乘法封闭,所以它是一个仿射集。
反过来,假设
M
是一个包含0的仿射集。对于所有的
所以
M
对标量乘法封闭。接下来,如果
因此
所以
M
也对加法封闭,故它是一个子空间。
对于
M⊂Rn,a∈Rn
,将
M
平移
仿射集平移后依然是仿射集,很容易验证这个结论。
对于仿射集
M
,如果对于某个
定理1.2 每个非空仿射集
M
平行于唯一的子空间
证明:我们首先说明
M
不能与两个不同的子空间平行。平行于
我们将非空仿射集的维数定义为与它平行的子空间的维数,(按照惯例,将空集 ∅ 的维数定义为-1)那么维数为0,1 和2的仿射集自然就称为点,线和面。 Rn 中 (n−1) 维的仿射集叫做超平面,超平面非常重要,因为他们不仅表示 n 维几何中的点,还具有其他含义。
超平面和其他仿射集也许能用线性函数和线性方程表示,我们可以从
L⊥
的正交补
(L⊥)⊥
是
L
。如果
其中 β=⟨a,b⟩ ,由此得到超平面的一个特征,即定理1.3。
定理1.3 给定
β∈R
和一个非零向量
b∈Rn
,集合
是 Rn 中的一个超平面,而且每个超平面可能用这种方式表示。
在定理1.3中,向量
b
叫做超平面
下一个定理将 Rn 的仿射子集表示为含有 n 个变量的联立线性方程组的解集。
定理1.4 给定
是 Rn 中的仿射集,而且每个仿射集可能用这种方式表示。
证明:如果
x∈M,y∈M,λ∈R
,那么对
z=(1−λ)x+λy
,我们有
所以 z∈M ,因此给定的 M 是仿射集。
另一方面,考虑任意一个非空仿射集
其中
B
是
其中
b=Ba
。(仿射集
Rn
和
∅
可以用定理中的形式表示,都令
B
是
观察定理1.4我们还可以得出
其中
bi
是
B
的第
每个 Hi 都是一个超平面( bi≠0 ),或者空集( bi=0,βi≠0 ),或者 Rn ( bi=0,βi=0 )。 空集本身可能是两个不同平行超平面的交集,而 Rn 可能是 Rn 中空个超平面的交集,因此:
推论1.4.1 Rn 中每个仿射子集是有限个超平面的交集。
定理1.4中的仿射集
M
可以用向量
很明显,任意个仿射集的交集依然是仿射集,因此,给定任意
S⊂Rn
,存在一个唯一的包含
S
的最小仿射集(即,仿射集
对于
m+1
个点
b0,b1,…,bm
的集合,如果aff
{b0,b1,…,bm}
是
m
维的,那么这些点就是仿射无关(affinely independent)。当然
其中
利用定理1.1,
L
与包含
所有关于线性无关的事实都可以应用到仿射无关上。例如,
Rn
中
m+1
个点仿射无关可以扩充到
n+1
个点,一个
m
维仿射集
注意,如果
即
上面的表达式中,当且仅当
b0,b1,…,bm
仿射无关时,
x
的系数是唯一的。这时候,作为参数的
从
那么这个映射就称为仿射变换。
定理1.5 从
Rn
到
Rm
的仿射变换就是形如
Tx=Ax+a
的映射
T
,其中
证明:如果
T
是仿射的,令
反过来,如果
因此
T
是仿射的。
仿射变换的逆(如果存在的话)还是仿射的。
如果从
Rn
到
Rm
的映射
T
是一个仿射变换,那么对于
定理1.6 令
{b0,b1,…,bm}
和
{b′0,b′1,…,b′m}
是
Rn
中仿射无关集,那么存在一个
Rn
到自身的一一对应仿射变换
T
,使得对于
证明:如果需要的话,扩展给定的仿射无关集,我们可以将问题简化为
推论 1.6.1 令
M1,M2
是
Rn
中任意两个维数相同的仿射集,那么存在一个
Rn
到自身的一一对应的仿射变换
T
,使得
证明:任何
m
维仿射集可以表示成
从
Rn
到
Rm
的仿射变换
T
的图像是
特别地,从
Rn
到
Rm
的仿射变换
x→Ax
图像时包含
Rn+m
原点的仿射集,因此它是
Rn+m
的某个子空间
L
(定理1.1),
即
L⊥
是
−A∗
的图像。事实上,当且仅当对每个
z=(x,y),y=Ax
,下式
成立,那么
z∗=(x∗,y∗)
属于
L⊥
。换句话说,当且仅当对于每个
x∈Rn
,下式
成立, (x∗,y∗)∈L⊥ 。这就意味着 x∗+A∗y∗=0 ,即 x∗=−A∗y∗
任何非平凡仿射集可以用多种方式表示成仿射变换的图像,令
M
是
根据定理1.4可知,这总是可能的。
M
的维度为
再次给出了向量
x=(ξ1,…,ξN)
属于
M
的充分必要条件,这个方程组称为给定仿射集的Tucker表示。它将
涉及到仿射集的定理通常可以解释成线性方程的定理,这时候,可能给出仿射集的一个Tucker表示,这种表示非常重要,例如线性不等式中的某些结论(定理22.6,22.7)和Fenchel’s对偶定理的某些应用(推论31.4.2)
当然,子空间
给定
L
的这种表示作为线性变换的图像,那么正如上面提到的,
时, x∗=(ξ∗1,…,ξ∗N) 属于 L⊥ 。这就给出了 L⊥ 的Tucker表示,因此给定一个子空间,它的Tucker表示与其正交补的Tucker表示之间有一个简单且有用的一一对应关系。