5. 特征值的估计和广义逆矩阵

joker ... 2022-4-7 大约 14 分钟

# 5. 特征值的估计和广义逆矩阵

https://www.bilibili.com/read/cv4109469
1

# 5.0 考试重点+例子

重点内容

  • 特征值的估计
  • 谱半径的估计
  • 求广义逆(A-,A+(极小最小二乘解),1-2广义逆,1-3广义逆(最小范数解),1-4广义逆(最小二乘解))

# 5.0.1 求广义逆AA^-

A=[121012]A=\begin{bmatrix}1&-2&-1 \\ 0&-1&2\end{bmatrix}

AA的所有减号逆

求线性方程组Ax=bAx=b的最小范数解,其中b=(1,1)Tb=(1,1)^T

image-20211230175850256

image-20211230175903906

# 5.0.2 求最小范数求解,最小二乘解

image-20211230180045226

image-20211230180102802

# 5.0.3 求广义逆A+A^+

image-20211230180245886

image-20211230180301004

image-20211230180331260

# 5.0.4 圆盘定理

求一些简单的

# 5.1 广义逆矩阵

有很多广义逆矩阵

1.AA+A=A,2.A+AA+=A+,3.(AA+)H=AA+,4.(A+A)H=A+A1.AA^+A=A,\\ 2.A^+AA^+=A^+,\\ 3.(AA^+)H=AA^+,\\ 4.(A^+A)^H=A^+A

上面有四条性质

  • 满足第一条性质就是AA^-(广义逆)
  • 满足第一条和第四条就是AlA_l^-自反广义逆
  • 满足四条性质就是A+A^+伪逆矩阵

所以5.1 讲的就是三种广义逆的概念和性质

# 5.1.1 广义逆AA^-

# 1) AA^-定义

AA是数域FF上的一个s×ns\times n矩阵,则矩阵方程AXA=AAXA=A

总是有解,如果rank(A)=rrank(A)=r,并且存在可逆矩阵P,QP,Q使得A=P[Ir000]QA=P\begin{bmatrix}I_r&0\\ 0&0\end{bmatrix}Q

则矩阵方程的通解为X=Q1[IrBCD]P1X=Q^{-1}\begin{bmatrix}I_r&B \\ C&D\end{bmatrix}P^{-1}

其中B,C,DB,C,D分别是任意r×(sr),(nr)×r,(nr)×(sr)r\times (s-r),(n-r)\times r,(n-r)\times (s-r)矩阵

定义

AA是一个s×ns\times n矩阵,矩阵方程AXA=AAXA=A的通解称为AA的广义逆矩阵,

简称为AA的广义逆,我们用记号AA^-表示AA的广义逆

# 2) 广义逆矩阵计算⭐️

image-20211226145016325

image-20211226145119364

image-20211226145154961

广义逆的另一种求解方式

任给AA,有奇异值分解,A=U[Δ000]VHA=U\begin{bmatrix}\Delta&0 \\ 0&0\end{bmatrix}V^H,其中UU是酉矩阵,Δ\Delta是对角矩阵

AXA=U[Δ000]VHXU[Δ000]VH=U[Δ000]VHAXA=U\begin{bmatrix}\Delta&0 \\ 0&0\end{bmatrix}V^H XU\begin{bmatrix}\Delta&0 \\ 0&0\end{bmatrix}V^H=U\begin{bmatrix}\Delta&0 \\ 0&0\end{bmatrix}V^H

通解为V[Δ1BCD]UH,B,C,DV\begin{bmatrix}\Delta^{-1} &B \\ C&D\end{bmatrix}U^H,B,C,D任取

# 3) 广义逆矩阵性质

  • rankArankA1rank A\le rankA^{-1}
  • A1AA^{-1}AAA1AA^{-1}是幂等矩阵,且rankA=rankA1ArankAA1rankA=rankA^{-1}A-rankAA^{-1}
  • (AT)1=(A1)T,(AH)=(A)H(A^T)^{-1}=(A^{-1})^T,(A^{H})^-=(A^-)^H
  • ACnn×nA\in C^{n\times n}_n,则A=A1A^-=A^{-1},且A1A^{-1}唯一
  • (λA)=1λA,λ0(\lambda A)^{-}=\frac{1}{\lambda}A^-,\lambda\ne 0
  • SCmm×m,TCnn×nS\in C^{m\times m}_m,T\in C^{n\times n}_n,且B=SATB=SAT,则B=(SAT)=T1AS1B^-=(SAT)^-=T^{-1}A^{-}S^{-1}

特殊的广义逆

ACm×nA\in C^{m\times n},若存在矩阵AL1Cn×mA^{-1}_L\in C^{n\times m}AR1Cn×mA^{-1}_R C^{n\times m}使得

AL1A=InA^{-1}_LA=I_nAAR1=ImAA^{-1}_R=I_m

称为AL1A_L^{-1}AR1A_R^{-1}AA的左逆(或右逆)

注意点:若AA有左逆,则AA列满秩,若AA有右逆,则AA行满秩

m=nm=n,且AA是满秩的,则A1=AL1=AR1A^{-1}=A_L^{-1}=A_R^{-1}

定理

ACm×nA\in C^{m\times n},则

ACm×nA\in C^{m\times n}的充要条件是AA=InA^-A=I_n

ACm×nA\in C^{m\times n}的充要条件是AA=ImAA^-=I_m

推论

  • 如果AA列满秩,则左逆存在,且跟AA的广义逆相同
  • 如果AA行满秩,则右逆存在,且跟AA的广义逆相同

# 5.1.2 自反广义逆

# 1) 自反广义逆概念

ACm×nA\in C^{m\times n},使得AAA=A,AAA=AAA^-A=A,A^-AA^-=A^-

成立的ACn×nA^-\in C^{n\times n}称为AA的自反广义逆,记作ArA^-_r

例子

X,YCn×mX,Y \in C^{n\times m}都是ACm×nA\in C^{m\times n}的广义逆矩阵,则Z=XAYZ=XAY

AA的自反广义逆矩阵

证明

AZA=AXAYA=AYA=AAZA=AXAYA=AYA=A

ZAZ=(XAY)A(XAY)=XAXAY=XAY=ZZAZ=(XAY)A(XAY)=XAXAY=XAY=Z


充要条件

ACn×mA^-\in C^{n\times m}ACm×nA\in C^{m\times n}的广义逆矩阵,则AA^-AA的自反广义逆矩阵的充要条件是rankA=rankArankA=rankA^-


# 2) 自反广义逆计算

求解自反广义逆矩阵

任给AA,有奇异值分解,A=U[Δ000]VHA=U\begin{bmatrix}\Delta&0 \\ 0&0\end{bmatrix}V^H,其中U,VU,V是酉矩阵,Δ\Delta是对角矩阵

AA的自反广义逆矩阵的一般解为

通解为X=V[Δ1BDDΔB]UH,BCr×(mr),DC(nr)×rX=V\begin{bmatrix}\Delta^{-1} &B \\ D&D\Delta B\end{bmatrix}U^H,B\in C^{r\times (m-r)},D\in C^{(n-r)\times r}任意

--

# 5.1.3 伪逆矩阵A+A^+⭐️

M-P矩阵(穆尔-彭罗斯广义逆矩阵)

# 1) 伪逆矩阵A+A^+概念

伪逆矩阵是逆矩阵的广义形式

奇异矩阵(行列式等于零的方阵)和非方阵没有逆矩阵,但是可以有伪逆矩阵

ACm×nA\in C^{m\times n},若A+Cn×mA^+\in C^{n\times m},且A+A^+同时满足

AA+A=A,A+AA+=A+,(AA+)H=AA+,(A+A)H=A+AAA^+A=A,A^+AA^+=A^+,(AA^+)H=AA^+,(A^+A)^H=A^+A

则称A+A^+AA的伪逆矩阵,上述条件称为Penrose-Moore方程

定理

AA的伪逆矩阵A+A^+是唯一的。

推论

ACnm×nA\in C^{m\times n}_n,则A+=A1A^+=A^{-1}

例子

image-20211226154823381

一般来说(AB)+B+A+(AB)^+\ne B^+A^+,比如

A=[01],B=[11]A=\begin{bmatrix}0&1 \end{bmatrix},B=\begin{bmatrix}1\\ 1 \end{bmatrix}

显然(AB)+=1+=1(AB)^+=1^+=1

但是(B+A+)=[1212][01]=12(B^+A^+)=\begin{bmatrix}\frac{1}{2}&\frac{1}{2} \end{bmatrix}\begin{bmatrix}0\\ 1 \end{bmatrix}=\frac{1}{2}

# 2) 伪逆矩阵的性质

  • (A+)+=A,(AH)+=(A+)H(A^+)^+=A,(A^H)^+=(A^+)^H

  • (AAH)+=(AH)+A+=(A+)HA+(AA^H)^+=(A^H)^+A^+=(A^+)^HA^+

    (AHA)+=A=(AH)+=A+(A+)H(A^HA)^+=A^=(A^H)^+=A^+(A^+)^H

  • A+=AH(AAH)=(AHA)+AHA^+=A^H(AA^H)=(A^HA)^+A^H

# 3) 伪逆矩阵的意义

从线性方程组AX=BAX=B的解来对伪逆矩阵进一步的认知和了解

对于nn元线性方程组AX=BAX=B其解有三种情况,解唯一,无穷解,其中Am×n,Bm×1A_{m\times n},B_{m\times 1}。解唯一不讨论

(1) 线性方程有无穷解时,必有R(A)=R(AB)<nR(A)=R(AB)<n,AA行满秩。线性方程的个数小于等于变量的个数,因此有无穷解,但是要找到一个到原点最近距离的点则是唯一的,即最小范数解

(2) 线性方程组无解时,必有R(A)R(AB)R(A)\ne R(AB)。因为BB不在AA的空间中,此时只能在AA的列空间找到唯一一个BB之间的欧式距离最小的B,B=AX0B^\prime,B^\prime=AX^0,X0X^0可以使得范数AXB||AX-B||最小化的解。

可以看出,欧式空间的范数在伪逆的求解中起到度量误差和度量长度的限制作用,伪逆矩阵是在满足几何约束的的条件下的最优解,这也是伪逆矩阵的意义所在。例如在最小能量系统中,可使用伪逆可求得问题的最优解。

# 5.1.4 伪逆矩阵求法⭐️

# 1) 求法1-奇异值求解

如果ACrm×nA\in C^{m\times n}_r,有奇异值分解,

A=U[Δ000]VHA=U\begin{bmatrix}\Delta&0 \\ 0&0\end{bmatrix}V^H,其中U,VU,V是酉矩阵,Δ\Delta是对角矩阵

AA的伪广义逆矩阵的一般解为

通解为A=V[Δ1000]UHA^{-}=V\begin{bmatrix}\Delta^{-1} &0 \\ 0&0\end{bmatrix}U^H任意

# 2) 求法2满秩分解

ACm×n,A=BCA\in C^{m\times n},A=BCAA的一个满秩分解,则

X=CH(CCH)1(BHB)1BHX=C^H(CC^H)^{-1}(B^HB)^{-1}B^HAA的伪逆矩阵

例子

image-20211226155558964

image-20211226155626770

# 3) 求法3-低阶矩阵求法(行满秩,列满秩)-直接求

满足AlA=EA^lA=E,但不满足AAL=EAA^L=E的矩阵ALA^L称为AA的左逆矩阵

同理,AAR=EAA^R=E,但是不满足ARA=EA^RA=E的矩阵ARA^R称为AA的右逆矩阵

推论

mnm\ge n时,列满秩,矩阵Am×nA_{m\times n},有左逆矩阵AL=(AHA)1AHA^L=(A^HA)^{-1}A^H

nmn\ge m时,行满秩,矩阵Am×nA_{m\times n}有右逆矩阵AR=AH(AHA)1A^R=A^H(A^HA)^{-1}

n=mn=m,Am×nA_{m\times n}的秩为rm=nr\le m=n时,对AA的奇异值分级A=UDVHA=UDV^HAA的伪逆矩阵A+=VD+UTA^+=VD^+U^T

换一种说法

  • ACrm×rA\in C^{m\times r}_r,则A+=(AHA)1AHA^+=(A^HA)^{-1}A^H,此时A+A=IrA^+A=I_r
  • ACrr×nA\in C^{r\times n}_r,则A+=AH(AAH)1A^+=A^H(AA^H)^{-1},此时AA+=IrAA^+=I_r

# 5.2 广义逆矩阵在线性方程组的应用

# 5.2.1 相关概念

# 1) 相容概念

ACm×n,bCmA\in C^{m\times n},b\in C^{m},非齐次线性方程组Ax=bAx=b有解时,称它是相容的,否则称它是不相容的


定理

ACm×n,bCmA\in C^{m\times n},b\in C^m则下面命题是等价的

  • Ax=bAx=b是相容的
  • rankA=rank[A,b]rankA=rank[A,b]
  • bR(A)b\in R(A),即bb可以由AA的列向量线性表示
  • b=AAbb=AA^-b,任取AA的广义逆矩阵AA^-

定理

ACm×n,bCmA\in C^{m\times n},b\in C^m,对于相容方程组,Ax=bAx=b

  • rankA=nrankA=n,方程组有唯一的解A+bA^+b
  • rankA<nrank A<n,方程组解不唯一

ACm×n,βCmA\in C^{m\times n},\beta\in C^{m},非齐次线性方程组AX=βAX=\beta有解的充要条件是存在AA的广义逆矩阵AA^-使得β=AAβ\beta=AA^-\beta

定理

设非齐次线性方程组AX=βAX=\beta有解,则它的一般解为X=AβX=A^-\beta,其中AA^-AA的任意一个广义逆。

定理

ACm×n,BCs×t,DCm×tA\in C^{m\times n},B\in C^{s\times t},D\in C^{m\times t},则矩阵方程AXB=DAXB=D有解的充要条件是

存在AABB的广义逆矩阵AA^-BB^-使得AADBB=DAA^-DB^-B=D成立

定理

ACm×n,BCs×t,DCm×tA\in C^{m\times n},B\in C^{s\times t},D\in C^{m\times t},矩阵方程AXB=DAXB=D有解的情况下,方程的通解为

X=A1DB1+YAYBBX=A^{-1}DB^{-1}+Y-A^-YBB^-

其中A,BA^-,B^-A,BA,B任意给定的广义逆,YY为任意n×sn\times s矩阵

推论1

ACm×n,DCm×nA\in C^{m\times n},D\in C^{m\times n},则矩阵方程AX=DAX=D有解的充要条件是存在AA的广义逆矩阵A1A^{-1}使得

AA1D=DAA^{-1}D=D

成立,在有解的情况下,矩阵方程的通解为X=AD+YA1AYX=A^-D+Y-A^{-1}AY

推论二

ACm×n,bCmA\in C^{m\times n},b\in C^m,则非齐次线性方程组AX=bAX=b在有解的情况下,方程组的通解为

X=Ab+YA1AY=Ab+(InAA)YX=A^-b+Y-A^{-1}AY=A^-b+(I_n-A^-A)Y

# 5.2.2 最小范数解(最小模解)AbA^-b⭐️

参考链接

https://www.jianshu.com/p/609fa0cce409
1

称相容方程组Ax=bAx=b的所有解中模(2-范数)最小的解是Ax=bAx=b的最小模解

x=A+bx=A^+b是相容线性方程组Ax=bAx=b最小模解

另一本书的概念

AA^-m×nm\times n矩阵AA的一个广义逆矩阵,并且(AA)H=AA(A^-A)^H=A^-A,那么对任给的mm维列向量BB,

只要方程组AX=BAX=B有解,则X=ABX^*=A^-B就是它的最小范数解

个人理解

minXs.t.Ax=bARm×n,bRm,xRn\min ||X|| \\ s.t. Ax=b \\ A\in R^{m\times n},b\in R^m,x\in R^n

这个问题的解称为Ax=bAx=b的最小范数解,这是一个凸优化问题。

# 5.2.3 最小二乘解X+bX^+b⭐️

# 1) 最小二乘解的概念

ACm×n,bCmA\in C^{m\times n},b\in C^m,非齐次线性方程组Ax=bAx=b无解时,

如果x0Cnx_0\in C^n满足对任意xCnx\in C^n都有Ax0b2Axb2||Ax_0-b||_2\le ||Ax-b||_2

则称x0x_0是方程组Ax=bAx=b的一个最小二乘解

矩阵分析引论上的内容--看不出真假

AA^-m×nm\times n矩阵AA的一个广义逆矩阵,并且(AA)H=AA(A^-A)^H=AA^-,

那么对任给的mm维列向量BB,X=A+BX^*=A^+B一定是AX=BAX=B的最小二乘解

定理

ACm×n,bCmA\in C^{m\times n},b\in C^m,对于不相容的方程组Ax=bAx=b

  • rankA=n,Ax=brank A=n,Ax=b有唯一最小二乘解A+bA^+b
  • rankA<n,Ax=brank A<n,Ax=b的最小二乘解不唯一

定义

uu是不相容方程组Ax=bAx=b的最小二乘解,如果对于任一个最小二乘解x0,x_0,都有不等式

u2x02||u||_2\le ||x_0||_2

则称uu是最佳最小二乘解

# 2) 最小二乘法求非齐次线性方程组

最小二乘估计,旨在求解误差平方和最小的非零解。这里直接抛出线性最小二乘法的公式:

x=(AHA)1AHbx=(A^HA)^{-1}A^Hb

该公式针对非齐次线性方程组,可直接对AHAA^HA求逆,再右乘AHbA^Hb得到xx的最小二乘解。当然此处AHAA^HA是否可逆取决于该方阵是否是满秩矩阵,即要求AA满秩,如果不是满秩矩阵,说明约束不够,仍无法得到可靠的最小二乘近似

# 3) 最小二乘法求齐次线性方程组

然而,对于齐次线性方程组Ax=0Ax=0的情况,由于b=0b=0向量,我们无法直接通过线性最小二乘公式求解xx的非零解。那么是否就无解了呢,当然不是,我们通常有两种做法:

方法一:对矩阵AA做SVD分解,分解后VV的最后一列向量即为Ax=0Ax=0的最小二乘解

方法二: 求解ATAA^TA的特征向量和特征值,最小特征值对应的特征向量即为Ax=0Ax=0的最小二乘解

例子

image-20211228174928310

# 5.3 特征值的估计

A=(aij)m×nA=(a_{ij})_{m\times n}为一给定的复数矩阵,则AA可以表示成一个厄米特矩阵BB与一个反厄米特矩阵CC之和。

B=(bij)m×n=A+AH2C=(cij)n×n=AAH2B=(b_{ij})_{m\times n}=\frac{A+A^H}{2} \\ C=(c_{ij})_{n\times n}=\frac{A-A^H}{2}

定理

nn阶复数矩阵A=(aij)A=(a_{ij})的特征值上集合(A的谱)为{λ1,λ2,,λn}\{\lambda_1,\lambda_2,\cdots,\lambda_n\},则又不等式

k=1nλk2i=1nj=1naij2\sum_{k=1}^n|\lambda_k|^2\le \sum_{i=1}^n\sum_{j=1}^n|a_{ij}|^2

等号当且只当AA为正规矩阵时成立

推论

存在酉矩阵UU即上三角矩阵TT,使得UHAU=TU^HAU=T

推论1

A,B,CA,B,C如前所设,则有

  • λknmax1i,jnaij|\lambda_k|\le n\cdot \max_{1\le i,j\le n}|a_{ij}|
  • Re(λk)nmax1i,jnbij|Re(\lambda_k)|\le n \cdot \max_{1\le i,j\le n}|b_{ij}|
  • Im(λk)nmax1i,jncij|Im(\lambda_k)|\le n\cdot \max_{1\le i,j\le n}|c_{ij}|

UHAU=T,UHAHU=THU^HAU=T,U^HA^HU=T^H,可得

UHBU=12(T+TH)U^HBU=\frac{1}{2}(T+T^H)

UHCU=12(TTH)U^HCU=\frac{1}{2}(T-T^H)

推论2

A=(aij)A=(a_{ij})nn阶实矩阵,则

Im(λk)n(n1)2max1i,jncij|Im(\lambda_k)\le \sqrt{\frac{n(n-1)}{2}}\max_{1\le i,j\le n}|c_{ij}|

image-20211230174608222

# 5.4 圆盘定理

https://zhuanlan.zhihu.com/p/31463121
1

# 5.4.1 行,列盖尔圆盘

A=(aij)A=(a_{ij})为任一nn阶复数矩阵,则AA的特征值都在复数平面上的nn个圆盘

zaiiRi|z-a_{ii}|\le R_i的并集内,这里的

Ri=ai1+ai2++ai,i1+ai,i+1++ainR_i=|a_{i1}|+|a_{i2}|+\cdots+|a_{i,i-1}|+|a_{i,i+1}|+\cdots+|a_{in}|

img

例子

image-20211230174633690

定理

AA的全部特征子都在它的nn个盖尔圆的并集中

若实矩阵AA的n个盖儿圆相互独立,则AA的特征值全为实数

AA的连通部分由k个盖儿圆构成,则此部分恰有AA的k个特征值

image-20220108152518575


# 5.4.2 定理二

img

image-20211230174724550

# 5.5 谱半径的估计

首先我们知道谱半径A=(aij)m×nA=(a_{ij})_{m\times n}是复数域上的nn阶方阵,又λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_nAA的全部特征值,则

ρ(A)=max1inλi\rho(A)=\max_{1\le i\le n}|\lambda_i|

定理

复数域上的任一nn阶方阵A=(aij)A=(a_{ij})的谱半径ρ(A)\rho(A)都不超过AA的范数A||A||

ρ(A)A\rho(A)\le ||A||

这里A||A||为任一方阵范数。

推论

AAnn阶正规矩阵,则ρ(A)=A2\rho(A)=||A||_2