一.幂等矩阵的定义
若对于方阵A存在如下关系: A A = A AA=A AA=A,则称A为一个幂等矩阵
二.一些常见的幂等矩阵
1.单位矩阵 I I I
2.某一行全为1,其余行全为0的矩阵
A
A
A
(证明:设
A
A
A的第
m
m
m行全为1,其余行全为0。
B
=
A
∗
A
B=A*A
B=A∗A,可知
b
i
j
=
∑
k
=
1
n
a
i
k
a
k
j
b_{ij}={\textstyle\sum_{k=1}^n}a_{ik}a_{kj}
bij=∑k=1naikakj,只有当
i
=
m
i=m
i=m时,
∑
k
=
1
n
a
i
k
a
k
j
=
1
{\textstyle\sum_{k=1}^n}a_{ik}a_{kj}=1
∑k=1naikakj=1,则
b
m
j
=
1
b_{mj}=1
bmj=1,否则为0,所以
B
B
B矩阵第
m
m
m行全为1,其余行全为0。所以
B
=
A
∗
A
=
A
B=A*A=A
B=A∗A=A)
3.用于计算离差的矩阵
M
0
=
(
I
−
1
n
i
i
′
)
M_{0}=(I-\frac1nii')
M0=(I−n1ii′).
其中
I
I
I为单位阵,
i
i
i为元素全为1的列向量,
i
′
i'
i′为元素全为1的行向量,
M
0
x
M_{0}x
M0x为向量
x
x
x的离差形式。
(证明:
M
0
∗
M
0
∗
=
(
I
−
1
n
i
i
′
)
∗
(
I
−
1
n
i
i
′
)
=
I
−
2
1
n
i
i
′
+
1
n
2
i
(
i
′
i
)
i
′
M_{0}*M_{0}*=(I-\frac1nii')*(I-\frac1nii')=I-2\frac1nii'+\frac1{n^2}i(i'i)i'
M0∗M0∗=(I−n1ii′)∗(I−n1ii′)=I−2n1ii′+n21i(i′i)i′,因为
i
′
i
=
n
i'i=n
i′i=n,所以
M
0
∗
M
0
M_{0}*M_{0}
M0∗M0=
(
I
−
1
n
i
i
′
)
∗
(
I
−
1
n
i
i
′
)
=
I
−
2
1
n
i
i
′
+
1
n
i
i
′
=
M
0
(I-\frac1nii')*(I-\frac1nii')=I-2\frac1nii'+\frac1nii'=M_{0}
(I−n1ii′)∗(I−n1ii′)=I−2n1ii′+n1ii′=M0)
三.幂等矩阵性质
1.幂等矩阵的特征值只能为0和1。
(证明思路:因为为幂等矩阵所以推出
λ
k
=
λ
\lambda^k=\lambda
λk=λ,所以
λ
\lambda
λ只能为0,1)
2.幂等矩阵可对角化。
(证明思路:
A
A
A为幂等矩阵,
C
C
C为其特征向量矩阵,
Λ
\Lambda
Λ为对角线为特征值的矩阵,则
A
A
A的对角化为
C
′
A
C
=
C
′
C
Λ
=
Λ
C'AC=C'C\Lambda=\Lambda
C′AC=C′CΛ=Λ)
3.幂等矩阵的迹等于幂等矩阵的秩,即
t
r
(
A
)
tr(A)
tr(A)=
r
a
n
k
(
A
)
rank(A)
rank(A)。
(证明思路:将
A
A
A对角化为
Λ
\Lambda
Λ,因为
λ
\lambda
λ只能为0,1,所以对于
A
A
A有:
t
r
(
A
)
=
t
r
(
Λ
)
=
tr(A)=tr(\Lambda)=
tr(A)=tr(Λ)=对角线为1的元素和=不全为0的行
=
r
a
n
k
(
Λ
)
=
r
a
n
k
(
A
)
=rank(\Lambda)=rank(A)
=rank(Λ)=rank(A))
4.可逆的幂等矩阵为
I
I
I
(证明思路,可逆一定满秩,满秩说明所有特征值为1,此时为单位阵
I
I
I)
5.方阵零矩阵和单位矩阵都是幂等矩阵
。。。
四.关于幂等矩阵的理解
幂等的思想在数学和工程中都是经常使用的思想。
将矩阵
A
A
A作用于向量
x
x
x上,相当于对
x
x
x进行了一次变换。可以记为
A
x
=
f
(
x
)
Ax=f(x)
Ax=f(x)。此时所A为幂等矩阵,则
A
A
x
=
A
x
AAx=Ax
AAx=Ax,进一步有
f
(
f
(
x
)
)
=
f
(
x
)
f(f(x))=f(x)
f(f(x))=f(x),说明此时对
x
x
x进行多次变换与进行一次变换的效果是一样的。
这样的思想在开发工程中也经常使用,工程中的幂等,说的是对用户的输入进行重复多次计算,仍与计算一次的结果是相同的,这避免了数据重复计算时带来的弊端,确保了工程的正确性与稳定性。