3. 矩阵的标准型

joker ... 2022-4-7 大约 21 分钟

# 3. 矩阵的标准型

# 3.0 考试重点+例子讲解

重点内容

  • 求约当标准型

  • 求约当标准型对应的P矩阵(P1AP=JP^{-1}AP=J中的P,J为约当标准型)

  • 求矩阵的多项式的值(哈密顿-开莱定理的运用)

  • 求最小多项式

  • 求史密斯标准型

  • 求SVD(奇异值分解)

# 3.0.1 求不变因子,行列式因子,初等因子

# 3.0.2 求Jordan 标准形和相似矩阵P

image-20211226201451055

image-20211226201552018

image-20211226201614234

# 3.0.3 三个分解

LU分解--待定分解

[111101211]=[100110211][111010001]\begin{bmatrix} 1&1&1 \\ 1&0&1 \\ 2&1&1 \end{bmatrix}= \begin{bmatrix}1&0&0 \\ 1&1&0 \\ 2&1&1 \end{bmatrix} \begin{bmatrix}1&1&1 \\ 0&-1&0 \\ 0&0&-1 \end{bmatrix}

QR分解

A=[121120120]α1=[111]α2=[222]α3=[100]Smithβ1=[111]β2=[011]β3=[211]Q=[13026131216131216]R=QHA=Q=[13131301212261616][121120120]=[323130000026]A=\begin{bmatrix}1&2&1 \\1&2&0 \\1&2&0\end{bmatrix} \\ \alpha_1=\begin{bmatrix}1 \\ 1\\ 1 \end{bmatrix} \alpha_2=\begin{bmatrix}2\\ 2 \\2 \end{bmatrix} \alpha_3=\begin{bmatrix}1\\ 0 \\0 \end{bmatrix} \\ Smith\to \beta_1=\begin{bmatrix}1 \\ 1\\ 1 \end{bmatrix} \beta_2=\begin{bmatrix}0\\ 1\\ -1\end{bmatrix} \beta_3=\begin{bmatrix}2\\ -1\\ -1\end{bmatrix} \\ Q=\begin{bmatrix}\frac{1}{\sqrt{3}}&0&\frac{2}{\sqrt{6}} \\ \frac{1}{\sqrt{3}}&\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{6}} \\ \frac{1}{\sqrt{3}}&-\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{6}} \end{bmatrix} \\ R=Q^HA=Q=\begin{bmatrix}\frac{1}{\sqrt{3}}&\frac{1}{\sqrt{3}}&\frac{1}{\sqrt{3}} \\ 0&\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}} \\ \frac{2}{\sqrt{6}}&-\frac{1}{\sqrt{6}}&-\frac{1}{\sqrt{6}} \end{bmatrix}\begin{bmatrix}1&2&1 \\1&2&0 \\1&2&0\end{bmatrix} =\begin{bmatrix}\sqrt{3}&2\sqrt{3}&\frac{1}{\sqrt{3}}\\ 0&0&0 \\ 0&0&\frac{2}{\sqrt{6}}\end{bmatrix}

奇异值分解

image-20220108114055305

image-20220108114130626

# 3.1 λ\lambda 矩阵(多项式矩阵)

# 3.1.1 多项式矩阵概念

aij(λ)(i=1,2,,m;j=1,2,,m)a_{ij}(\lambda)(i=1,2,\cdots,m;j=1,2,\cdots,m)为数域FF上的多项式,则称

A(λ)=[a11(λ)a12(λ)a1n(λ)a21(λ)a22(λ)a2n(λ)am1(λ)am2(λ)amm(λ)]A(\lambda)=\begin{bmatrix} a_{11}(\lambda)&a_{12}(\lambda)&\cdots&a_{1n}(\lambda) \\ a_{21}(\lambda)&a_{22}(\lambda)&\cdots&a_{2n}(\lambda) \\ \cdots&\cdots&\cdots&\cdots \\ a_{m1}(\lambda)&a_{m2}(\lambda)&\cdots&a_{mm}(\lambda) \end{bmatrix}

多项式矩阵,或λ\lambda矩阵

所谓λ\lambda - 矩阵,简单说来就是矩阵中的每个元素都是关于λ\lambda的多项式。

aij(λ)(i=1,2,,m;j=1,2,,m)a_{ij}(\lambda)(i=1,2,\cdots,m;j=1,2,\cdots,m)中最高的次数为A(λ)A(\lambda)的次数

例子:数字矩阵,特征矩阵λEA\lambda E-A

# 3.1.2 多项式矩阵性质

多项式矩阵秩

如果λ\lambda-矩阵A(λ)A(\lambda)中有一个r阶(r1r\ge 1)子式不为0,而所有r+1r+1阶子式(如果有的话)全为0,

则称A(λ)A(\lambda)的秩为r.记为rankA(λ)=rrank\ A(\lambda)=r,零矩阵的秩为0.

多项式矩阵等价

如果A(λ)A(\lambda)经过有限次的初等变换之后变成B(λ)B(\lambda),则称A(λ)A(\lambda)B(λ)B(\lambda)等价,记为A(λ)B(λ)A(\lambda)\simeq B(\lambda)

λ\lambda-矩阵的等价关系

  • 自反性:A(λ)A(λ)A(\lambda)\simeq A(\lambda)
  • 对称性A(λ)B(λ)A(\lambda)\simeq B(\lambda),则B(λ)A(λ)B(\lambda)\simeq A(\lambda)
  • 传递性,若A(λ)B(λ)A(\lambda)\simeq B(\lambda)B(λ)C(λ)B(\lambda)\simeq C(\lambda),则A(λ)C(λ)A(\lambda)\simeq C(\lambda)

相抵矩阵

如果矩阵A可以经过一系列初等行变换和初等列变换变成矩阵B,则称A与B是相抵,又称A与B等价。

img

# 3.1.3 多项式矩阵初等变换

可以进行的相关操作

ACn×n,λInAA\in C^{n\times n},\lambda I_n-AAA的特征矩阵,其初等变换操作

  • 变换λInA\lambda I_n-A的两行(列)
  • λInA\lambda I_n-A的某一行(列)同乘以一个非零常数
  • λInA\lambda I_n-A的某一行(列)同乘以多项式ϕ(λ)\phi(\lambda)加到另一行(列)

# 3.1.4 多项式矩阵的运算

# 1) 一元多项式的乘法

(1+x+x2)(1+2x)=[111][12](1+x+x^2)(1+2x)=\begin{bmatrix}1\\ 1\\ 1\end{bmatrix}\otimes\begin{bmatrix}1\\ 2\end{bmatrix}

我们将多项式以降幂方式排列,然后用各次幂项的系数做成向量。显然,这样的表示是一一对应的。好了,我要开始骚操作了:

[111][120]=[120120120]\begin{bmatrix}1\\ 1\\ 1\end{bmatrix}\begin{bmatrix}1&2&0\end{bmatrix}= \begin{bmatrix} 1&2&0 \\ 1&2&0 \\ 1&2&0 \end{bmatrix}

img

没错,结果的确是——

(1+x+x2)(1+2x)=1+3x+3x2+2x3(1+x+x^2)(1+2x)=1+3x+3x^2+2x^3

如上图,我们记沿着方阵次对角线方向求和的运算为ϕ=R×RR\phi=\mathbb{R}^\infty\times \mathbb{R}^\infty\to \mathbb{R}^\infty,于是一元多项式乘积可以表示为

定理fg=ϕ(fgT)f\otimes g=\phi(fg^T)

# 2) 二元多项式乘法

例子一

1+2x+3y=[1320]1+2x+3y=\begin{bmatrix}1&3\\ 2&0\end{bmatrix}

这样的表示原理其实和例 1 是一致的,我们可以看作:

(1+2x)+3y=[12][03]=[1020]+[0300](1+2x)+3y=\begin{bmatrix}1\\ 2\end{bmatrix}\otimes \begin{bmatrix}0&3\end{bmatrix}=\begin{bmatrix}1&0\\ 2&0\end{bmatrix}+\begin{bmatrix}0&3\\ 0&0\end{bmatrix}

交叉项那该如何表示?

例子二

(1+2x+3y+4xy)=[1324](1+2x+3y+4xy)=\begin{bmatrix}1&3\\ 2&4\end{bmatrix}

我们将这个矩阵记为AA,接下来还会用它举例。看了下图相信你就明白了

img

例子三

(1+2x+3y+4xy)xmyn=xmyn+2xm+1yn+3xmyn+1+4xm+1yn+1(1+2x+3y+4xy)x^my^n=x^my^n+2x^{m+1}y^n+3x^my^{n+1}+4x^{m+1}y^{n+1}

我们将此运算结果表示为矩阵

[O(m1)×(n1)1324]\begin{bmatrix}O_{(m-1)\times(n-1)}&&\\ &1&3\\ &2&4\end{bmatrix}

实际上它是下面矩阵乘法的运算结果——

[O(m1)×2E]A[O2×(n1)E]=[O(m1)×(n1)1324]\begin{bmatrix}O_{(m-1)\times 2}&E\end{bmatrix}A\begin{bmatrix}O_{2\times(n-1)}&E\end{bmatrix}=\begin{bmatrix}O_{(m-1)\times(n-1)}&&\\ &1&3\\ &2&4\end{bmatrix}

ϕ(A)=λQmAQn\phi(A)=\lambda Q_mAQ_n

特就是说,将矩阵AA分别向左,下方向移动n,mn,m个单位,其余元素以零补充,

另外,考虑所乘单项式的系数λ\lambda,只要把λ\lambda提到矩阵前面就可以了。

定理

fg=fgk=λkΦk(f)f\cdot g=f\sum g_k=\sum\lambda_k \Phi_k(f)

其中gkg_k是单项式

# 3.2 Smith标准型⭐️

# 3.2.1 Smith标准型基本概念⭐️

概念

任意一个非零的m×nm\times n型的λ\lambda-矩阵A(λ)A(\lambda)都等价于一个"对角矩阵"。

A(λ)=[d1(λ)d2(λ)dr(λ)00]A(\lambda)= \begin{bmatrix} d_1(\lambda)&&&&&& \\ &d_2(\lambda)&&&&& \\ &&\ddots&&&& \\ &&&d_r(\lambda)&&& \\ &&&&0&& \\ &&&&&\ddots& \\ &&&&&&0 \end{bmatrix}

其中r1r\ge 1,di(λ)d_i(\lambda)首项系数为1的多项式且di(λ)di+1(λ)(i=1,2,,r1)d_i(\lambda)|d_{i+1}(\lambda)(i=1,2,\cdots,r-1)

称这种形式的λ\lambda-矩阵为A(λ)A(\lambda)Smith标准型

d1(λ),d2(λ),,dr(λ)d_1(\lambda),d_2(\lambda),\cdots,d_r(\lambda)称为A(λ)A(\lambda)不变因子

计算

例子一

image-20211219222858697

image-20211219222912242

image-20211219223123281

例子二

image-20211219223244704

例子三

image-20211220094541062

我们在求n-1阶矩阵时,有一个矩阵非常重要,就是去掉第一列,和最后一行。结果就是

c100λac20000λacn1=c1c2cn10\begin{vmatrix} c_1&0&\cdots&0 \\ \lambda-a&c_2&\cdots&0 \\ 0&\ddots&\cdots&0 \\ 0&\cdots&\lambda-a&c_{n-1} \end{vmatrix} =c_1c_2\cdots c_{n-1}\ne0

image-20211220095010997

image-20211220095949695

# 3.2.2 不变因子⭐️

概念

A(λ)A(\lambda)矩61的秩为rr,对于正整数kk,1kr1\le k\le r,A(λ)A(\lambda)中必定有非零的kk级子式,

A(λ)A(\lambda)中全部kk级子式的首项系数为1的最大公因式Dk(λ)D_k(\lambda)称为A(λ)A(\lambda)k阶行列式因子

D1(λ)=d1(λ)D_1(\lambda)=d_1(\lambda)

D2(λ)=d1(λ)d2(λ)D_2(\lambda)=d_1(\lambda)d_2(\lambda)

D3(λ)=d1(λ)d2(λ)d3(λ)D_3(\lambda)=d_1(\lambda)d_2(\lambda)d_3(\lambda)

\vdots

Dk(λ)=d1(λ)d2(λ)dk(λ),k=1,2,,rD_k(\lambda)=d_1(\lambda)d_2(\lambda)\cdots d_k(\lambda),k=1,2,\cdots,r

不变因子dk(λ)=Dk(λ)Dk1(λ)d_k(\lambda)=\frac{D_k(\lambda)}{D_{k-1}(\lambda)}

A(λ)A(\lambda)所有不变因子称为A(λ)A(\lambda)不变因子组

定理

经过初等变换不改变多项式矩阵的秩和行列式因子,有相同的行列式因子或不变因子是A(λ)A(\lambda)B(λ)B(\lambda)相似的充要条件

计算

image-20211220092911335

image-20211220092951725

image-20211219221950353

计算不变因子组

image-20211219222607230

# 3.2.3 初等因子⭐️

概念

设矩阵A(λ)A(\lambda)的不变因子是d1(λ),,di(λ)d_1(\lambda),\cdots,d_i(\lambda).标准分解式是

d1(λ)=(λλ1)k11(λλ2)k12(λλj)k1jd2(λ)=(λλ1)k21(λλ2)k22(λλj)k2jdi(λ)=(λλ1)ki1(λλ2)ki2(λλj)kijd_1(\lambda)=(\lambda-\lambda_1)^{k_{11}}(\lambda-\lambda_2)^{k_{12}}\cdots (\lambda-\lambda_j)^{k_{1j}}\\ d_2(\lambda)=(\lambda-\lambda_1)^{k_{21}}(\lambda-\lambda_2)^{k_{22}}\cdots (\lambda-\lambda_j)^{k_{2j}}\\ \dots\\ d_i(\lambda)=(\lambda-\lambda_1)^{k_{i1}}(\lambda-\lambda_2)^{k_{i2}}\cdots (\lambda-\lambda_j)^{k_{ij}}

其中λ1,,λs\lambda_1,\cdots,\lambda_s是互异的复数。kijk_{ij}是非负整数,

则称di(λ)d_i(\lambda)的标准分解式中的一次因式的方幂(λλj)kij(kij>0)(\lambda-\lambda_j)^{k_{ij}}(k_{ij}>0)AA初等因子

AA的所有初等因子(重复方按重数计算)。称为AA初等因子组

由定义知道,初等因子是被不变因子确定的

因为di(λ)di+1(λ),i=1,2,,r1d_i(\lambda)|d_{i+1}(\lambda),i=1,2,\cdots,r-1,所以有指数如下关系

0e11e21er10\le e_{11}\le e_{21}\le \cdots \le e_{r1}

0e12e22er20\le e_{12}\le e_{22}\le \cdots \le e_{r2}

\vdots

0e1se2sers0\le e_{1s}\le e_{2s}\le \cdots \le e_{rs}

定理

m×nm\times n型的λ\lambda-矩阵A(λ)A(\lambda)B(λ)B(\lambda)等价的充要条件是他们有相同的秩和相同的初等因子

计算

例子一

image-20211220102934912

例子二

image-20211220103257806

image-20211220103431347

# 3.2.4 分块矩阵的初等因子

λ\lambda-矩阵

A(λ)=[A1(λ)A2(λ)At(λ)]A(\lambda)= \begin{bmatrix} A_1(\lambda)&&& \\ &A_2(\lambda)&& \\ &&\ddots& \\ &&& A_t(\lambda) \end{bmatrix}

A1(λ),A2(λ),,At(λ)A_1(\lambda),A_2(\lambda),\cdots,A_t(\lambda)各个初等因子的全体就是A(λ)A(\lambda)的全部初等因子

第二种

λ\lambda-矩阵

A(λ)=[f1(λ)f2(λ)ft(λ)00]A(\lambda)= \begin{bmatrix} f_1(\lambda)&&&&&& \\ &f_2(\lambda)&&&&& \\ &&\ddots&&&& \\ &&& f_t(\lambda)&&& \\ &&&&0&& \\ &&&&&\ddots& \\ &&&&&& 0 \end{bmatrix}

f1(λ),f2(λ),,ft(λ)f_1(\lambda),f_2(\lambda),\cdots,f_t(\lambda)所有一次因式幂的全体就是A(λ)A(\lambda)的全部初等因子

举个例子

A(λ)=[λ00λ+1][100λ(λ+1)]A(\lambda)=\begin{bmatrix}\lambda &0\\ 0&\lambda+1\end{bmatrix} \to \begin{bmatrix}1 &0\\ 0&\lambda(\lambda+1)\end{bmatrix}

初等因子为λ,λ+1\lambda,\lambda+1

# 3.3 矩阵的相似对角形

# 3.3.1 矩阵相似

# 1) 矩阵相似概念

ϕ\phiVV的线性变换,α1,α2,,αn\alpha_1,\alpha_2,\cdots,\alpha_nβ1,β2,,βn\beta_1,\beta_2,\cdots,\beta_nVV的两组基,由αi\alpha_iβi\beta_i的过度矩阵为PP,ϕ\phi在基α1,α2,,αn\alpha_1,\alpha_2,\cdots,\alpha_n下的矩阵为AA.在β1,β2,,βn\beta_1,\beta_2,\cdots,\beta_n下的矩阵为BB,

B=P1APB=P^{-1}AP

定义A,BFm×nA,B\in F^{m\times n},若存在PFnm×nP\in F^{m\times n}_n,满足B=P1APB=P^{-1}AP,则称AABB相似。即为BAB\sim A

换一种说法

A,BA,B都是nn阶矩阵,若存在可逆矩阵P,P,使得P1AP=BP^{-1}AP=B,则称AA相似BB,记为ABA\sim B

AΛA\sim \Lambda,其中Λ\Lambda 是对角阵,称AA可相似对角化,Λ\LambdaAA的相似标准型

# 2) 矩阵相似相关性质

相似矩阵有相同的特征多项式,有相同的特征值,有相同的行列式值,有相同的秩,有相同的迹,有相同的谱。

  • λEA=λEB\mid \lambda E-A\mid=\mid \lambda E-B\mid

    A+kE=B+kE\mid A+kE\mid =\mid B+kE\mid

  • r(A)=r(B)r(A)=r(B)

  • A,BA,B 有着相同的特征值

  • A=B=i=1nλi\mid A\mid=\mid B\mid =\prod_{i=1}^n\lambda_i

  • aii=bii\sum a_{ii}=\sum b_{ii}

  • ABA \sim B

    A+kEB+kEA+kE\sim B+kE

    λA+kE=λB+kE\lambda_{A+kE}=\lambda_{B+kE}

  • 传递性:AB,BC,ACA\sim B,B\sim C,\Leftrightarrow A\sim C

  • AB,AnBnA\sim B,A^n\sim B^n

  • AΛA\sim \Lambda \Leftrightarrow A有n个特征向量

# 3) 矩阵相似的充分必要条件

数字矩阵的相似与λ\lambda-矩阵的等价

定理:

设A,B是两个nn阶数字矩阵,那么AABB相似的充分必要条件为它们的特征矩阵入λIA\lambda I-A与入λIB\lambda I-B等价.

定义:

对于数字矩阵AA,我们称λIA\lambda I-A的不变因子为AA的不变因子,称入λIA\lambda I -A 的初等因子为AA的初等因子.

image-20211220105403999

# 3.3.2 对角矩阵

# 1) 对角矩阵概念

对角矩阵(diagonal matrix)是一个主对角线之外的元素皆为0的矩阵

形如

[λ1λ1λn]\begin{bmatrix} \lambda_1&&& \\ &\lambda_1&& \\ &&\ddots& \\ &&&\lambda_n \end{bmatrix}

# 2) 矩阵的可对角化条件

nn阶矩阵AA可对角化的充要条件是有nn个线性无关的特征向量

或者nn阶矩阵AA可对角化的充要条件的AA的每一个特征值的几何重复度等于代数重复度

image-20211219161843051

image-20211219161936163

# 3) 同时对角化

ACm×n,BCm×mA\in C^{m\times n},B\in C^{m\times m},且C=[A00B]C=\begin{bmatrix}A&0\\ 0&B\end{bmatrix},则CC可以对角化的充要条件是A,BA,B都可以对角化

# 3.4 Jordan标准形⭐️⭐️

在矩阵A中相似的所有矩阵中,那个相似矩阵最简单?,这就是矩阵的Jordan标准形问题

# 3.4.1 Jordan标准形概念

# 1) Jordan块

nin_i阶矩阵

Ji=[ai1ai11ai]J_i= \begin{bmatrix} a_i&1&&& \\ &a_i&1&& \\ &&\ddots&\ddots& \\ &&&\ddots&1 \\ &&&&a_i \end{bmatrix}

为Jordan块

(λIJi)(\lambda I-J_i)的行列式因子Dni(λ)=(λai)ni,Dni1==D1(λ)=1D_{n_i}(\lambda)=(\lambda-a_i)^{n_i},D_{n_i-1}=\cdots=D_1(\lambda)=1

所以JiJ_i的初等因子为(λai)ni(\lambda-a_i)^{n_i}

# 2) Jordan标准形

J1,J2,,JsJ_1,J_2,\cdots,J_s为Jordan块,称准对角形矩阵

J=[J1J2Js]J= \begin{bmatrix} J_1&&& \\ &J_2&& \\ &&\ddots& \\ &&&J_s \end{bmatrix}

为Jordan标准形

(λIJ)(\lambda I-J)的初等因子是(λIJi),i=1,,s(\lambda I-J_i),i=1,\cdots,s初等因子的全体

所以JJ的初等因子为(λa1)n1,(λa2)n2,,(λas)ns(\lambda-a_1)^{n_1},(\lambda-a_2)^{n_2},\dots,(\lambda-a_s)^{n_s}

定理,设ACn×n,AA\in C^{n\times n},A的初等因子为(λa1)n1,(λa2)n2,,(λas)ns(\lambda-a_1)^{n_1},(\lambda-a_2)^{n_2},\dots,(\lambda-a_s)^{n_s}

AJ=diag(J1,J2,,Js)A\sim J=diag(J_1,J_2,\cdots,J_s),其中

Ji=[ai1ai11ai],(i=1,2,,s)J_i= \begin{bmatrix} a_i&1&&&& \\ &a_i&1&&& \\ &&\ddots&\ddots&& \\ &&&\ddots&1 \\ &&&&a_i \end{bmatrix},(i=1,2,\cdots,s)

注:如果不考虑Jordan块的排列顺序,方阵AA的Jordan标准型是本质唯一的

n阶矩阵AA可以对角化的充分必要条件是AA的初等因子都是一次因式

例子一

image-20211220113649249

λIA=[λ+1104λ3010λ2][11(λ1)2(λ2)]\lambda I-A=\begin{bmatrix} \lambda+1&-1 &0 \\ 4 &\lambda-3&0 \\ -1&0&\lambda-2 \end{bmatrix}\simeq \begin{bmatrix} 1&& \\ &1& \\ &&&(\lambda-1)^2(\lambda-2) \end{bmatrix}

image-20211220113932996

例子二

image-20211221093913970

image-20211221094029679

image-20211221094053447

# 3) Jordan标准形的幂

定理

对于rir_i阶Jordan块

Ji=[ai1ai11ai]J_i= \begin{bmatrix} a_i&1&&&& \\ &a_i&1&&& \\ &&\ddots&\ddots&& \\ &&&\ddots&1 \\ &&&&a_i \end{bmatrix}

Jordan块的n次幂

Jik=[λiCk1λik1Ck2λik2Ckri1λikri+1λiCk1λikCkri2λikri+2Ck1λik1λik]Cki=k!i!(ki)!J_i^k= \begin{bmatrix} \lambda_i&C_k^1\lambda_i^{k-1}&C_k^2\lambda_i^{k-2}&\cdots&C_k^{r_i-1}\lambda_i^{k-r_i+1} \\ &\lambda_i&C_k^1\lambda_i^k&\cdots &C_k^{r_i-2}\lambda_i^{k-r_i+2} \\ &&\ddots&\ddots&\vdots \\ &&&\ddots&C_k^1\lambda_i^{k-1} \\ &&&&\lambda_i^k \end{bmatrix} \\ C_k^i=\frac{k!}{i!(k-i)!}

或者换种形式--导数的形式

Jik=[λi11!(λk)12!(λk)1(ri1)!(λk)(ri1)λi11!(λk)1(ri2)!(λk)(ri2)11!(λk)λik]J_i^k= \begin{bmatrix} \lambda_i&\frac{1}{1!}(\lambda^k)^{\prime}&\frac{1}{2!}(\lambda^k)^{\prime\prime}&\cdots&\frac{1}{(r_i-1)!}(\lambda^k)^{(r_i-1)} \\ &\lambda_i&\frac{1}{1!}(\lambda^k)^{\prime}&\cdots &\frac{1}{(r_i-2)!}(\lambda^k)^{(r_i-2)} \\ &&\ddots&\ddots&\vdots \\ &&&\ddots&\frac{1}{1!}(\lambda^k)^{\prime} \\ &&&&\lambda_i^k \end{bmatrix}

# 4) 矩阵的Jordan分解定理

ACn×nA\in C^{n\times n},则AA与一个Jordan矩阵JJ相似,即存在可逆矩阵PCnn×nP\in C_n^{n\times n}使得

P1AP=JP^{-1}AP=J

这个JordanJordan矩阵JJJordanJordan块的排序次序外有AA唯一确定,并且称JJAAJordanJordan标准形

# 3.4.2 Jordan 标准形求法⭐️

# 1) 由Smith标准形求矩阵A的Jordan标准型方法

  • 用初等变换特征矩阵λInA\lambda I_n-A为Smith标准型,求出AA的不变因子d1(λ),d2(λ),,dn(λ)d_1(\lambda),d_2(\lambda),\cdots,d_n(\lambda)

  • AA的每个次数大于零的不变因子di(λ)d_i(\lambda)分解为互不相同的一次因式方幂的成绩,这些一次因式的方幂称为AA的初等因子

    AA的全部初等因子为

    (λλ1)r1,(λλ2)r2,,(λλ1)rs(\lambda-\lambda_1)^{r_1},(\lambda-\lambda_2)^{r_2},\cdots,(\lambda-\lambda_1)^{r_s}

    其中λ1,λ2,,λs\lambda_1,\lambda_2,\cdots,\lambda_s可能有相同的,且r1+r2++rs=nr_1+r_2+\cdots+r_s=n

  • 写出每个初等因子(λλi)ri(\lambda-\lambda_i)^{r_i}对应的Jordan块Ji=[ai1ai11ai]J_i=\begin{bmatrix}a_i&1&&& \\ &a_i&1&&\\ &&\ddots&\ddots&\\ &&&\ddots&1\\ &&&&a_i\end{bmatrix}

    以这些Jordan块构成的Jordan矩阵

    J=[J1J2Js]J=\begin{bmatrix}J_1&&&\\ &J_2&&\\ &&\ddots&\\ &&&J_s\end{bmatrix}

例子

image-20211226201351527

# 2) 利用秩

方法如下

  • 计算rank(AλiE)lrank(A-\lambda_iE)^l得出

    rank(JλiE)l=rank(AλiE)l,l=1,2,rank(J-\lambda_iE)^l=rank(A-\lambda_iE)^l,l=1,2,\cdots

  • 通过分析rank(JλiE)l,l=1,2,rank(J-\lambda_iE)^l,l=1,2,\cdots,得出对应于特征值λi\lambda_i的Jordan块的个数,阶数

求出如下的矩阵的Jordan

[110430102]\begin{bmatrix}-1&1&0 \\ -4&3&0 \\ 1&0&2\end{bmatrix}

解法如下

1.λEA=[λ+1104λ3010λ2]=(λ2)(λ1)22.number=3rank(EA)=3r([210420101])=1J1=[1011]J=[2111]1. |\lambda E-A|=\begin{bmatrix}\lambda+1 &-1&0 \\ 4&\lambda-3&0 \\ -1&0&\lambda-2\end{bmatrix}=(\lambda-2)(\lambda-1)^2 \\ 2. number=3-rank(E-A)=3-r(\begin{bmatrix}2&-1&0 \\ 4&-2&0 \\ -1&0&-1\end{bmatrix})=1 \\ J_1=\begin{bmatrix}1&0 \\ 1&1\end{bmatrix} \\ \to J=\begin{bmatrix}2&& \\ &1& \\ &1&1\end{bmatrix}

首先讲一下

Jordan 标准型的几个基本性质

  • 每一个Jordan块JiJ_i对应属于λi\lambda_i的一个特征向量

    J=[21212313]P1AP=JA[P1P2P3P4P5]=[P1P2P3P4P5]AP1=2P1AP4=3P4A+2=P1+2P2,AP3=P2+2P3,AP5=P4+3P5J= \begin{bmatrix} 2&1&&& \\ &2&1&& \\ &&2&& \\ &&&3&1 \\ &&&&3 \end{bmatrix} \\ P^{-1}AP=J \\ A\begin{bmatrix}P_1&P_2&P_3&P_4&P_5\end{bmatrix}=\begin{bmatrix}P_1&P_2&P_3&P_4&P_5\end{bmatrix} \\ AP_1=2P_1\ AP_4=3P_4 \\ A+2=P_1+2P_2,AP_3=P_2+2P_3,AP_5=P_4+3P_5

  • 对于给定的λi\lambda_i,其对应的Jordan块的个数等于λi\lambda_i的几何重复度

    rank(λiEA)=nqrank(\lambda_iE-A)=n-q

  • 特征值λi\lambda_i所对应的全体Jordan块的阶数之和λi\lambda_i的代数重复度

  • nn阶方阵AA相似于Jordan标准型JJ,且P1AP=JP^{-1}AP=J,则

    rank(λiEA)l=rankP1(λiEA)lP=[P1(λiEA)P]l=rank(λiEJ)lrank(\lambda_iE-A)^l=rank P^{-1}(\lambda_i E-A)^lP=[P^{-1}(\lambda_iE-A)P]^l=rank(\lambda_iE-J)^l

  • 对于nin_i阶的Jordan块Ji,(JiλiE)lJ_i,(J_i-\lambda_iE)^l的秩变化如下

    image-20211221124751366

image-20211221124922103

# 3.4.2 相似变换矩阵P⭐️

nn阶方阵AA的Jordan标准型为JJ,则存在可逆矩阵PP使得

P1AP=JP^{-1}AP=J

PP为相似变换矩阵

image-20211221121018621

image-20211221121052707

image-20211221121132896

image-20211221121229847

image-20211221121704531

image-20211221121815526

# 3.5 舒尔定理

# 3.5.1 舒尔定理(schur)

A,BCn×nA,B\in C^{n\times n},若存在酉矩阵UUn×nU\in U^{n\times n}使得UHAU=U1AU=BU^HAU=U^{-1}AU=B

这里BB为上三角矩阵,TT的主对角线上的元素都是AA的特征值。

则称AA酉相似于BB

换句话讲

任一复数方阵都可以酉相似于上三角矩阵

性质

ACn×nA\in C^{n\times n},则有可逆矩阵P,可得

P1AP=[λ1b12b1nλ20λn]P^{-1}AP=\begin{bmatrix} \lambda_1&b_{12}&\cdots&b_{1n} \\ &\lambda_2&& \\ &&\ddots&\vdots \\ 0&&&\lambda_n \end{bmatrix}

i,j=1nbij<ξ\sum_{i,j=1}^n|b_{ij}|< \xi,其中ξ\xi是预先给定的任一正数

# 3.6 矩阵分解⭐️

# 3.6.1 QR分解(正交三角分解)

# 1) QR分解概念

Am×nA_{m\times n}的秩为nn,则AA可以唯一地分解为

Am×n=Qm×nRn×nA_{m\times n}=Q_{m\times n}R_{n\times n}

其中Qm×nQ_{m\times n}是标准正交向量组矩阵,Rn×nR_{n\times n}是正线上三角阵

# 2) QR分解证明

https://zhuanlan.zhihu.com/p/362248020
1

# 3) QRf分解求法

  • 对矩阵Am×nA_{m\times n}进行施密特标准正交化,得出矩阵Qm×nQ_{m\times n}
  • 通过Rn×n=Qm×nTAm×nR_{n \times n}=Q_{m\times n}^TA_{m\times n}得出矩阵Rn×nR_{n\times n}

image-20211227222157025

image-20211227222208170

# 3.6.2 满秩分解

参考文章

https://zhuanlan.zhihu.com/p/344306107
1

# 1) 满秩分解概念

Am×nA_{m\times n}的秩为rr,则存在秩为rr的矩阵Bm×rB_{m\times r},秩为rr的矩阵Cr×nC_{r\times n},满足

Am×n=Bm×rCr×nA_{m\times n}=B_{m\times r}C_{r\times n}

其中,Bm×rB_{m\times r}称为列满秩矩阵(因为列数等于秩),Cr×nC_{r\times n}称为行满秩矩阵(因为行数等于秩)

这样的分解不是唯一的

# 2) 满秩分解的证明

# 3) 满秩分解的求法-2种方法

[公式]

那么,该如何寻找这样的一个满秩分解呢?

[公式]

[公式]

红色的部分是矩阵B4×5B_{4\times 5}的极大线性无关组,所以,红色部分的列数为3,就等于矩阵B4×5B_{4\times 5}的秩r=3r=3,

而蓝色部分是行最简形矩阵的前r=3r=3行,行数也是矩阵B[4×5]B_[4\times 5]的秩r=3r=3

方法步骤如下

  • 首先对矩阵Am×nA_{m\times n}进行初等行变换,变成行最简形矩阵A1A_1,得到Am×nA_{m\times n}的秩为rr
  • 找出矩阵Am×nA_{m\times n}的列向量组的极大线性无关组组成的矩阵,这个矩阵就是满秩分解的Bm×rB_{m\times r}
  • 取行最简形矩阵A1A_1的前rr行构成的矩阵,这个矩阵就是满秩分解的Cr×nC_{r\times n}
  • 写出Bm×rCr×nB_{m\times r}C_{r\times n}

例子

image-20211227221504006

image-20211227221517559

法二

image-20220110150545746

image-20220110150627018

# 3.6.3 奇异值分解(SVD分解)⭐️

https://zhuanlan.zhihu.com/p/399547902
1

# 1) 奇异值分解定义

# 前期数学准备

引理1

对于任何一个矩阵AA都有

rank(AAH)=rank(AHA)=rank(A)rank(AA^H)=rank(A^HA)=rank(A)

引理2

对于任何一个矩阵AA都有AAHAA^HAHAA^HA都是半正定的HermiteHermite矩阵

xHAAHx=(AHA)HAHx0,xCmx^H A A^H x=(A^HA)^H\quad A^H x\ge 0,x\in C^m\to半正定

定理

ACrm×n,λiA\in C^{m\times n}_r,\lambda_iAAHAA^H的特征值,μi\mu_iAHAA^HA的特征值,他们都是实数。

λ1λ2λr>λr+1==λm=0μ1μ2μrμr+1=μr+2==0\lambda_1\ge \lambda_2\ge \cdots\ge \lambda_r>\lambda_{r+1}=\cdots=\lambda_m=0 \\ \mu_1\ge\mu_2\ge \cdots\ge\mu_r\ge\mu_{r+1}=\mu_{r+2}=\cdots=0

那么λi=μi>0,i=1,2,3,,r\lambda_i=\mu_i>0,i=1,2,3,\cdots,r

此时,我们称ai=λi=μi>0a_i=\sqrt{\lambda_i}=\sqrt{\mu_i}>0为矩阵AA的正奇异值,简称奇异值

AAH,AHAAA^H,A^HA的非零特征值相同

image-20211226212154825

image-20211226212235767

正规矩阵的奇异值为其非零特征值的模长

# 概念

ACm×nA\in C^{m\times n},则存在酉矩阵P,QP,Q,使得

PHAQ=[D000]P^HAQ=\begin{bmatrix}D&0 \\ 0&0\end{bmatrix}

这里D=diag{d1,d2,,dr}D=diag\{d_1,d_2,\cdots,d_r\},且d1d2dr>0d_1\ge d_2\ge \cdots\ge d_r>0

did_i称为AA的奇异值,而

A=P[D000]QHA=P\begin{bmatrix}D&0 \\0&0\end{bmatrix}Q^H

称为矩阵AA的奇异值分解式

例子

image-20211226212957071

image-20211226213057928

# 2) 奇异值分解证明

# 3) 奇异值分解求法

第一步

求出ATAA^TA的n个特征值λ1,λ2,,λr,λr+1=0,,λn=0\lambda_1,\lambda_2,\cdots,\lambda_r,\lambda_{r+1}=0,\cdots,\lambda_n=0(并按照从大到小排列)和对应的标准正交的特征向量v1,v2,,vr,vr+1,vnv_1,v_2,\cdots ,v_r,v_{r+1},v_n

第二步

取标准正交的特征向量构成正交矩阵

Vn×n=(v1,v2,,vr,vr+1,,vn)n×nV_{n\times n}=(v_1,v_2,\cdots,v_r,v_{r+1},\cdots,v_n)_{n\times n}

取正奇异值,即前rr个奇异值,即非零特征值开根号λ1,λ2,,λr\sqrt{\lambda_1},\sqrt{\lambda_2},\cdots,\sqrt{\lambda_r},构成对角矩阵

Dr×r=[λ1λ2λr]D_{r\times r}=\begin{bmatrix}\sqrt{\lambda_1}&&&\\ &\sqrt{\lambda_2}&&\\ &&\ddots&\\ &&&\sqrt{\lambda_r}\end{bmatrix}

添加格外的0组成m×nm\times n矩阵

m×n=[Dr×rOOO]\sum_{m\times n}=\begin{bmatrix}D_{r\times r}&O \\ O&O\end{bmatrix}

第三步

构成前rr个标准正交向量u1,u2,,uru_1,u_2,\cdots,u_r,其中

ui=1λiAvi,i=1,2,,ru_i=\frac{1}{\sqrt{\lambda_i}}Av_i,i=1,2,\cdots,r

第四步

按照标准正交基扩充的方法,将u1,u2,,unu_1,u_2,\cdots,u_n扩充为mm维向量空间RmR^m的标准正交基u1,u2,,ur,b1,,bmru_1,u_2,\cdots,u_r,b_1,\cdots,b_{m-r}组成正交矩阵

Um×m=(u1,u2,,ur,b1,,bmr)m×mU_{m\times m}=(u_1,u_2,\cdots,u_r,b_1,\cdots,b_{m-r})_{m\times m}

第五步

A=U[Dr×rOOO]VTA=U\begin{bmatrix}D_{r\times r}&O \\ O&O\end{bmatrix}V^T

例子

image-20211229213112221

image-20211229213135040

image-20211229213152242

# 3.6.4 LU分解

# 3.7 总结应用

总结

  • λ\lambda-矩阵换成Smith矩阵后,矩阵对角线上的值就是不变因子

  • 初等因子是被不变因子确定的

应用

  • 矩阵理论在计算机方面的应用,如矩阵的奇异值分解的应用,QR分解在网络方面的应用,还有在三维图形图像方面的应用。
  • 多项式矩阵理论在网络分析中的应用,基于回路矩阵B、基本割集矩阵Q和支路伏安特矩阵[Y(s)Z(s)]列写出线性时不变有源网络的网络矩阵P(s),借助多项式矩阵理论中有关解耦零点的概念和理论,研究网络的复杂度和稳定性。
  • 多项式矩阵理论知识,在建立和完善线性控制系统理论过程中具有基础作用,应用广泛。