# 矩阵乘法与初等变换的联系
将矩阵 A=(ai,j)m×n 与 B=(bi,j)n×p 相乘,可以将矩阵 B 的每一行作为一块,写成分块形式:
B=B1B2⋮Bn
A 的每个元作为一块,进行分块运算得:
AB=a1,1a2,1⋮am,1a1,2a2,2⋮am,2⋯⋯⋱⋯a1,ma2,m⋮am,nB1B2⋮Bn=a1,1B1+a1,2B2+⋯+a1,nBna2,1B1+a2,2B2+⋯+a2,nBn⋮am,1B1+am,2B2+⋯+am,nBn
这说明:AB 的每一行都是 B 的行的线性组合,组合系数由 A 的相应的行提供。
经过初等行变换 B↦B1 后的矩阵 B1 的行都是变换前的矩阵 B 的行的线性组合,从 B 到 B1 的变换可以通过在 B 的左边乘以适当的矩阵 A 来实现:
B↦B1=AB
因此我们可以 设计适当的 A,分别满足下面的条件:
-
将 B 的前两行交换得到 AB;
-
将 B 的第 1 行乘 λ 得到 AB;
-
将 B 的第 1 行的 λ 倍加到第 2 行得到 AB。
设 B 的各行依次为 B1,B2,⋯,Bn。
(1) AB 的各项为 B2,B1,B3,⋯,Bn。由于
B2=0B1+1B2+0B3+⋯+0BnB1=1B1+0B2+0B3+⋯+0BnBi=0B1+⋯+0Bi−1+1Bi+0Bi+1+⋯+0Bn(3≤i≤n)
则矩阵
A=01101⋱1
符合要求。
(2) AB 的各行依次为 λB1,B2,⋯,Bn,因此
A=λ1⋱1
符合要求。
(3) AB 的各行依次为 B1,λB1+B2,B3,⋯,Bn,因此
A=1λ1⋱1
符合要求。
# 初等矩阵
定义 1:如下方阵称为 初等矩阵(elementary matrix):
-
对 1≤i<j≤n,将 n 阶单位矩阵 I(n) 的第 i,j 两行互换得到的方阵:
Pi,j=I(i−1)01I(j−i−1)10I(n−j)
-
对 1≤i≤n,λ=0,将 n 阶单位矩阵 I(n) 的第 i 行乘 λ 得到的方阵:
Di(λ)=I(i−1)λI(n−i)
-
对 1≤i,j≤n,i=j,λ=0,将 n 阶单位矩阵 I(n) 的第 j 行的 λ 倍加到第 i 行得到的方阵:
Ti,j(λ)=I(i−1)1⋱λ1I(n−j)
对任意的 i,j 记 Ei,j 为第 (i,j) 元为 1、其余为 0 的矩阵,则得到 Pi,j,Di(λ) 和 Ti,j(λ) 的运算性质:
-
Pi,j=I−Ei,i−Ej,j+Ei,j+Ej,i;
-
Di(λ)=I+(λ−1)Ei,i;
-
Ti,j(λ)=I+λEi,j。
定理 1:对矩阵 B 做初等行变换,效果相当于对 B 左乘相应的初等方阵:
-
将 B 的第 i,j 行互换:B↦Pi,jB;
-
将 B 的第 i 行乘 λ=0:B↦Di(λ)B;
-
将 B 的第 j 行的 λ 倍加到第 i 行:B↦Ti,j(λ)B。
由此可得:
-
初等方阵可逆,其逆方阵仍是初等方阵;
-
Pi,j2=I,进而 Pi,j−1=Pi,j;
-
Di(λ)−1=Di(λ−1);
-
Ti,j(λ)−1=Ti,j(−λ)。
下面考虑 BA 与 B 的关系。将 B 的每一列作为一块,写成分块形式
B=(β1,⋯,βm)
A 的每个元作为一块,进行分块运算得:
BA=(β1,⋯,βm)a1,1a2,1⋮am,1a1,2a2,2⋮am,2⋯⋯⋱⋯a1,ma2,m⋮am,n=(β1a1,1+β2a2,1+⋯+βmam,1,⋯,β1a1,n+β2a2,n+⋯+βmam,n)
这说明:BA 的每一列都是 B 的列的线性组合,组合系数由 A 的相应的列提供。
用矩阵消元法解线性方程组,对任一矩阵 A 作初等行变换,可以将 A 化为阶梯形。如果同时使用初等行变换和初等列变换,可以将任一矩阵 A 化到更简单的形式。而对 A 进行初等行变换和初等列变换,相当于对 A 左乘和右乘一系列初等方阵。
定理 2:任意的 m×n 矩阵 A 都可以通过有限次初等行变换和初等列变换化为:
(I(r)OOO)(1)
其中 r=rankA。
证明:如果 A=O,则 A 是所求。
设 A=(ai,j)m×n=O。其中必有元 ak,l=0。
如果 a1,1=0,当 k=1 时将 A 的第 1 行与第 k 行互换,可将非零元 ak,l 换到第 1 行;
如果 l=1,再将第 1 列和第 l 列互换,将非零元换到第 (1,1) 位置。经过这样的初等行变换和初等列变换,一定可以将 A=(ai,j)m×n 化为 B=(bi,j)m×n,使 a1,1=0。
对 2≤i≤m,2≤j≤n,将 B=(bi,j)m×n 第 1 行的 −b1,1bi,1 倍加到第 i 行,第 1 列的 −1,1b1,j 倍加到第 j 列,可以将 B 中第 2 至第 m 行的第 1 列元化为 0,第 2 至第 n 列的第 1 行化为 0。
再将第 1 行乘 b1,11 可以将第 (1,1) 元化为 1。这样就将 B 化为了如下形式的矩阵:
C=(1A1)
其中 A1 是 (m−1)×(n−1) 矩阵。
如果 A1=O,则 A1 已经是所需的形状。
设 A1=O,重复以上步骤,对 A1 作初等行变换和初等列变换可以将 A1 化为:
A2=(1A1)
其中 A2 是 (m−2)×(n−2) 矩阵。这也就是对 C 的第 2 行至第 m 行作初等行变换,对 C 的第 2 至第 n 列作初等列变换,将 C 进一步化为:
C=11A2
重复这个过程,最后可以得到形如 (1) 的矩阵:
(I(r)OOO)
这个矩阵的 r 个非零行线性无关,组成行向量的极大线性无关组,因此秩为 r。而对矩阵进行初等行变换和初等列变换不改变矩阵的秩,因此 A 的秩也是 r,也就是:
r=rankA
推论 1:对任意 m×n 矩阵 A,用一系列的 m 阶初等方阵 P1,P2,⋯,Ps 左乘 A,以及一系列初等方阵 Q1,Q2,⋯,Qt 右乘 A,将 A 化为:
(I(r)OOO)
其中 r=rankA。存在 m 阶可逆方阵 P 和 n 阶可逆方阵 Q 使 PAQ 具有上述形式。
定理 3:如果 A 是可逆方阵,则 A 可以表示为若干个初等方阵的乘积。
证明:由于 A 可逆,rankA=n,由 定理 2 知道 A 可以左乘一系列初等方阵 P1,P2,⋯,Ps,右乘一系列初等方阵 Q1,Q2,⋯,Qt 化为 I(n):
Ps⋯P2P1AQ1Q2⋯Qt=IA=P1−1P2−1⋯Ps−1Qt−1⋯Q2−1Q1−1
由于初等方阵 P1,P2,⋯,Ps,Q1,Q2,⋯,Qt 的逆仍是初等方阵,上式表明 A 是初等矩阵的乘积。
推论 2:可逆方阵 A 可以经过有限次初等行变换化为单位矩阵。
例 1. 设 A∈Fn×n,B∈Fn×n,如果以 A,B 为块组成的 A,B 可以经过一系列的初等行变换变成 (I,X) 的形式,则其中的块为 X=A−1B。
证明:矩阵的每个初等行变换可以通过左乘一个初等方阵来实现。(A,B) 可以经过一系列初等行变换变成 (I,X),也就是左乘一系列初等方阵 P1,P2,⋯,Ps 变成 (I,X):
P1P2⋯Ps(A,B)=(I,X)
记 P=P1P2⋯Ps,则 P(A,B)=(I,X),
(PA,PB)=(I,X),PA=I,PB=X
由 PA=I,知 P=A−1,从而
X=PB=A−1B
考虑将分块矩阵
S=(ACBD)
看成两 “行” 两 “列”。如果 A 是可逆矩阵,则可以将第一 “行” 左乘 −CA−1 加到第二行消去 C,再将第一 “列” 右乘 −A−1B 加到第二 “列” 得到:
(ACBD)→(AOBD−CA−1B)→(AOOD−CA−1B)
于是所说的行变换和列变换就可以通过左乘和右乘这两个 “初等方阵” 来实现:
(I−CA−1OI)(ACBD)(IO−A−1BI)=(AOOD−CA−1B)(2)
等式 (2) 称为 Schur 公式。
# 矩阵乘法与行列式
# 同阶方阵乘积的行列式
设 B 是 n 阶方阵,P 是 n 阶初等方阵。B 通过适当的初等行变换变到 PB,行列式 ∣B∣ 乘上了适当的倍数 μ 变成 ∣PB∣。我们研究这个倍数 μ 与 P 的关系。
-
P=Pi,j。此时的初等行变换 B↦Pi,jB 是将 B 的第 i,j 两行互换,因此:
∣Pi,jB∣=−∣B∣=(−1)∣B∣
然而 Pi,j 是由单位阵 I 的两行互换得来的,因此 ∣Pi,j∣=−∣I∣,可见
∣Pi,jB∣=∣P∣∣B∣
-
P=Di(λ)。此时的初等行变换是将 B 的第 i 行乘 λ,因此
∣Di(λ)B∣=λ∣B∣
由单位阵 I 经过同样的初等变换得到 Di(λ),∣Di(λ)∣=λ,因此
∣Di(λ)B∣=∣Di(λ)∣∣B∣
-
P=Ti,j(λ)。将 B 的第 j 行的 λ 倍加到第 i 行得到 Ti,j(λ)B,
∣Ti,j(λ)B∣=∣B∣
由单位阵 I 经过同样的初等变换得到 Ti,j(λ),∣Ti,j(λ)∣=1
∣Ti,j(λ)B∣=∣Ti,j(λ)∣∣B∣
定理 4:设 B 是 n 阶方阵,A 是 n 阶方阵,则:
∣AB∣=∣A∣⋅∣B∣
例 2. 已知 A∈Fn×m,B∈Fm×n,求证:
∣I(n)−AB∣=∣I(m)−BA∣(3)
证明:
∣I(n)−AB∣=I(m)OBI(n)−AB(I(m)AOI(n))(I(m)OBI(n)−AB)(I(m)−AOI(n))=(I(m)−BAOBI(n))I(m)AOI(n)=I(m)−AOI(n)=1I(m)OBI(n)−AB=I(m)−BAOBI(n)=∣I(m)−BA∣∣I(n)−AB∣=∣I(m)−BA∣
注:(3) 可以作为公式来计算行列式。
# 矩阵相抵
定义 2:设 A,B∈Fm×n,如果 A 可以通过一系列初等行变换和初等列变换变成 B,就称 A 与 B 相抵,也称 A 与 B 等价(equivalent)。
引理 1:A 与 B 相抵 ⇔ 存在可逆矩阵 P,Q 使 B=PAQ。
证明:设 A 与 B 相抵,A 可以通过一系列初等行变换和初等列变换变成 B。每个初等行变换可以通过左乘某个初等方阵实现,每个初等列变换可以通过右乘某个初等方阵实现,因此存在一系列初等方阵 P1,P2,⋯,Ps,Q1,Q2,⋯,Qt 使:
Ps⋯P2P2AQ1Q2⋯Qt=B
取 P=Ps⋯P2P1,Q=Q1Q2⋯Qt,则 P,Q 是可逆方阵且 PAQ=B。
反过来设存在可逆矩阵 P,Q 使 B=PAQ,由推论 1,可逆方阵都可以表示成有限个初等方阵的乘积:
P=Ps⋯P2P1,Q=Q1Q2⋯Qt
因此,B=Ps⋯P2P1AQ1Q2⋯Qt。由此可知 A 经过一系列初等行变换和初等列变换变成 B。
引理 2:矩阵的相抵关系具有如下性质:
-
反身性:A 相抵于自己;
-
对称性:如果 A 相抵于 B,则 B 相抵于 A;
-
传递性:如果 A 相抵于 B,B 相抵于 C,则 A 相抵于 C。
由于相抵关系的以上性质,可以将 Fm×n 按相抵关系划分成两两没有公共元素的类 RA,每一类称为一个 相抵等价类(equivalent class),对于每个元素 A,必属于唯一的一类。
由于每个 A 都可以通过有限次初等变换变成
S=(I(r)OOO)
也就是 A 相抵于 S。选取 S 作为 A 所在的相抵等价类 RA 的代表,称为 S 是 相抵标准型(canonical form of equivalent matrices)。
定理 5:设 A,B∈Fm×n,则 A 与 B 相抵当且仅当 rankA=rankB。
证明:A 与 B 相抵 ⇒ 存在可逆矩阵 P,Q
B=PAQ⇒rankB=rank(PAQ)=rankA
Fm×n 中的每个矩阵 A 相抵于它的标准形:
S=(I(r)OOO)
其中 r=rankA。如果 B∈Fm×n 的秩与 A 相同,则 B 也相抵于 S,由相抵的传递性,B 相抵于 A。
事实上,对于 Fm×n,记 d=min{m,n} 则可以按矩阵的秩将 Fm×n 分成 d+1 类,并且每一类中所有的矩阵有一个标准形:
Cr=(I(r)OOO),r∈{0,1,⋯,d}
例 2. 设 A∈Fn×n,rankA=r,则存在 B∈Fn×n 满足条件:rankB=n−r,且 AB=BA=O。
证明:存在可逆方阵 P,Q∈Fn×n,使:
A=P(I(r)OOO)Q
取
B=Q−1(O(r)OOI(n−r))P−1
即满足条件。
# 习题
-
已知:λ=0,
A=(λ00λ−1),B=(1−101)(101−λ1)(1λ−101)(λ00λ−1)
(1) 将 A 经过一系列初等行变换得到 B;
(2) 将 A 写成第三类初等方阵的乘积。
(1) 解:由 B 的定义可知:
A=(λ00λ−1)→(λ10λ−1)→(11λ−1−1λ−1)→(10λ−1−11)
(2) 解:注意到 B 也是第三类初等方阵,则:
A=(1λ−101)−1(101−λ1)−1(1−101)−1B=(1−λ−101)(10λ−11)(1101)(λ00λ−1)
-
试将方阵 A=(0−110) 写成第三类初等方阵的乘积。
解:考虑如下初等行变换过程:
A=(0−110)→(1−110)→(1011)
将该行变换的逆过程转换为初等方阵,可得:
A=(1011)(1−101)(10−11)
-
已知 a 是常数,且矩阵
A=112237a0−a
可经过初等列变换化为矩阵:
B=10−1a11211
(1) 求 a;
(2) 求满足 AP=B 的可逆阵 P。
(1) 解:可将 A 进行如下初等列变换:
A=112237a0−a→10−1237112→10−1013112→10−1211112→10−1211211
由此可得:a=2。
(2) 解:将上述过程写作初等方阵的乘积,可得:
P=001010100210001000110001−2001100210001100010101
此即对矩阵进行如下初等列变换:
001010100→0021010100→0021−210100→0021−211100→0021−2111021
即 P=0021−2111021。
-
设
X=00⋮00ana10⋮0000a2⋮000⋯⋯⋱⋯⋯⋯00⋮an−20000⋮0an−10
其中 ai=0(i=1,2,⋯,n),求 X−1。
解:由初等方阵的乘积,可以通过如下方式将 X 转化成单位方阵:
XP1,2P2,3⋯Pn−1,nD1(a11)D2(a21)⋯Dn(an1)=I(n)
则
X−1=P1,2P2,3⋯Pn−1,nD1(a11)D2(a21)⋯Dn(an1)
即对矩阵进行如下初等列变换:
010⋮0100⋮0001⋮0⋯⋯⋯⋱⋯000⋮1→010⋮0001⋮0⋯⋯⋯⋱⋯000⋮1100⋮0→0a110⋮000a21⋮0⋯⋯⋯⋱⋯000⋮an−11an100⋮0
因此有:
X−1=0a110⋮000a21⋮0⋯⋯⋯⋱⋯000⋮an−11an100⋮0