4. 矩阵函数及其应用

joker ... 2022-4-7 大约 30 分钟

# 4. 矩阵函数及其应用

# 4.0 考试重点+例题

https://www.bilibili.com/read/cv4033852
1
  • 常见向量范数,向量范数的等价(性)
  • 常见矩阵范数,矩阵范数的相容(性)
  • 求矩阵函数(对角化/最小多项式)
  • 矩阵微分与积分

其他结论/定理(主要为以上内容的推导/前置铺垫):

  • 向量范数,矩阵的范数的定义、性质
  • 向量/矩阵的极限
  • 矩阵的幂级数及其收敛性
  • 常用矩阵函数的性质

# 4.0.1 求最小多项式

# 4.0.2 求矩阵的微分和积分(矩阵函数的计算)

2020年考点题

image-20220106220217843

image-20211227212707270

image-20211227212656631

# 4.0.3 哈密顿-开莱定理

利用特征多项式及哈密顿-开莱定理证明:任意可逆矩阵AA的逆矩阵A1A^{-1}都可以表示为AA的多项式

证明AA可逆,则A1=g(λ)A^{-1}=g(\lambda),其中g(λ)g(\lambda)为多项式

λEA)=f(λ)=(λλ1)(λλn)=λn+a1λn1++anAn+a1An1++an1A+anE=0A(An1+a1An2++an1)=anEA1=An1+a1An2++an1an|\lambda E-A)=f(\lambda)=(\lambda-\lambda_1)\cdots(\lambda-\lambda_n)=\lambda^n+a_1\lambda^{n-1}+\cdots+a_n \\ A^n+a_1A^{n-1}+\cdots+a_{n-1}A+a_nE=0 \\ A(A^{n-1}+a_1A^{n-2}+\cdots+a_{n-1})=-a_nE \\ A^{-1}=\frac{A^{n-1}+a_1A^{n-2}+\cdots+a_{n-1}}{-a_n}

A=[100101010]A=\begin{bmatrix}1&0&0 \\ 1&0&1 \\ 0&1&0\end{bmatrix}

证明:当n3n\ge 3时,An=An2+A2EA^n=A^{n-2}+A^2-E,求A100A^{100}

λEA=[λ1001λ101λ]=λ3λ2λ+1A3A2A+E=0n=3,A3=A+A2Ewhenn+1An+1=AnA=(An2+A2E)A=An1+A3A=An1+A2EA100=A98+A2E=A96+A2E+A2E=A2+49(A2E)=50A249E|\lambda E-A|=\begin{bmatrix}\lambda-1 &0&0 \\ -1&\lambda &-1 \\ 0&-1&\lambda\end{bmatrix}=\lambda^3-\lambda^2-\lambda+1 \\ A^3-A^2-A+E=0 \\ n=3,\to A^3=A+A^2-E \\ when \ n+1 \\ A^{n+1}=A^nA \\ =(A^{n-2}+A^2-E)A \\ =A^{n-1}+A^3-A \\ =A^{n-1}+A^2-E \\ A^100=A^{98}+A^2-E=A^{96}+A^2-E+A^2-E=A^2+49(A^2-E)=50A^2-49E

A=[102011010]A=\begin{bmatrix}1&0&2 \\ 0&-1&1 \\ 0&1&0\end{bmatrix}计算ϕ(A)=2A83A5+A4+A24E\phi(A)=2A^8-3A^5+A^4+A^2-4E

AA的特征多项式为f(λ)=λEA=λ32λ+1f(\lambda)=|\lambda E-A|=\lambda^3-2\lambda+1

再取多项式ϕ(λ)=283λ5+λ4+λ24\phi(\lambda)=2^8-3\lambda^5+\lambda^4+\lambda^2-4

f(λ)f(\lambda)去除ϕ(λ)\phi(\lambda)可得

ϕ(λ)=(2λ5+4λ35λ2+9λ14)f(λ)+r(λ)\phi(\lambda)=(2\lambda^5+4\lambda^3-5\lambda^2+9\lambda-14)f(\lambda)+r(\lambda)

这里余式r(λ)=24λ237λ+10r(\lambda)=24\lambda^2-37\lambda+10

由哈密顿-开莱定理可得

ϕ(A)=25A237A+10E=[348260956106134]\phi(A)=25A^2-37A+10E=\begin{bmatrix}-3& 48&-26 \\ 0&95 &-61 \\ 0&-61&34\end{bmatrix}

# 4.0.4 范数

证明是范数

或者计算范数

# 4.0.5 求矩阵函数

image-20220108114348348

# 4.1 向量范数⭐️

# 4.1.1 范数概念(3条)

VV是实数域RR(或复数域CC)上的nn维空间,对于VV中任意一个向量α\alpha按照某一确定法则对应着一个实数,

这个实数称为α\alpha的范数,记为α||\alpha||,并且要求范数满足下列运算条件

  • 非负性,当α0α>0\alpha\ne 0,||\alpha||>0,当且仅当α=0\alpha=0时,α=0||\alpha||=0
  • 齐次性kα=kα,k||k\alpha||=|k|||\alpha||,k为任意数
  • 三角不等式:任意α,βV\alpha,\beta\in V,都有α+βα+β||\alpha+\beta||\le ||\alpha||+||\beta||

例子

nn维线性空间中CnC^n中,对于任意的向量

α=(a1,a2,,an)TCn\alpha=(a_1,a_2,\cdots,a_n)^T\in C^n

定义

(1)α1=i=1nai||\alpha||_1=\sum_{i=1}^n|a_i|(2)α2=(i=1nai2)12||\alpha||_2=(\sum_{i=1}^n|a_i|^2)^{\frac{1}{2}}(3)α=max1inai||\alpha||_\infty=\max_{1\le i\le n}|a_i|

α1||\alpha||_1为一范数

α2||\alpha||_2为二范数

α||\alpha||_\infty为无穷范数

三种范数之间有性质

证明α1,α2,α||\alpha||_1,||\alpha||_2,||\alpha||_\infty都是CnC^n上的范数,且有

  • αα1nα||\alpha||_\infty\le ||\alpha||_1\le n||\alpha||_\infty
  • α2α1nα2||\alpha||_2\le ||\alpha||_1\le \sqrt{n}||\alpha||_2
  • αα2nα||\alpha||_\infty\le ||\alpha||_2\le n||\alpha||_\infty

# 4.1.2 不等式

为了给一般范数一个定义,需要用到两个不等式

# 1) Holder不等式

α=[a1,a2,,an]T,β=[b1,b2,,bn]TCn\alpha=[a_1,a_2,\cdots,a_n]^T,\beta=[b_1,b_2,\cdots,b_n]^T\in C^n,则

i=1naibi(i=1Naip)1p(i=1Nbiq)1q\sum_{i=1}^n|a_ib_i|\le (\sum_{i=1}^N|a_i|^p)^{\frac{1}{p}}(\sum_{i=1}^N|b_i|^q)^{\frac{1}{q}}

其中p>1,q>1p>1,q>1,且1q+1p=1\frac{1}{q}+\frac{1}{p}=1

# 2) Minkowski不等式

α=[a1,a2,,an]T,β=[b1,b2,,bn]TCn\alpha=[a_1,a_2,\cdots,a_n]^T,\beta=[b_1,b_2,\cdots,b_n]^T\in C^n,则

(i=1nai+bip)1p(i=1Naip)1p+(i=1Nbip)1p(\sum_{i=1}^n|a_i+b_i|^p)^{\frac{1}{p}}\le (\sum_{i=1}^N|a_i|^p)^{\frac{1}{p}}+(\sum_{i=1}^N|b_i|^p)^{\frac{1}{p}}

其中p1p\ge 1

# 4.1.3 常见的向量范数(一范数,二范数,无穷范数)

定义:向量α=[a1,a2,,an]T\alpha=[a_1,a_2,\cdots,a_n]^T,对任意的数p1p\ge 1,称

αp=(i=1naip)1p||\alpha||_p=(\sum_{i=1}^n|a_i|^p)^{\frac{1}{p}}

为向量α\alphap-范数

  • α1=i=1nai||\alpha||_1=\sum_{i=1}^n|a_i|α1||\alpha||_1为一范数

  • α2=(i=1nai2)12=(αHα)12||\alpha||_2=(\sum_{i=1}^n|a_i|^2)^{\frac{1}{2}}=(\alpha^H\alpha)^{\frac{1}{2}}α2||\alpha||_2为二范数。也叫做欧式范数

    向量二范数矩阵表达式

    α22=αHα||\alpha||_2^2=\alpha^H\alpha

  • α=max1inai||\alpha||_\infty=\max_{1\le i\le n}|a_i|α||\alpha||_\infty为无穷范数

定理

有限维线性空间VV上的任意两个向量范数都是等价的,利用向量范数可以去构造新的范数

例子

b||\cdot |_bCmC^m上的向量范数,且ACm×n,rank(A)=nA\in C^{m\times n},rank(A)=n,则由

αa=Aαb,αCn||\alpha||_a=||A\alpha||_b,\alpha\in C^n

所定义的a||\cdot |_aCnC^n上的向量范数

例子

VV是数域FF上的nn维线性空间,ε1,ε2,,εn\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n为其一组基底,那么对于VV中的任意一个向量α\alpha可唯一地表示称

α=i=1nxiεi,X=[x1,x2,,xn]Fn\alpha=\sum_{i=1}^nx_i\varepsilon_i,X=[x_1,x_2,\cdots,x_n]\in F^n

又设||\cdot||FnF^n上的向量范数,则由

αV=X||\alpha||_V=||X||

所定义的αV||\alpha||_VVV上的向量范数

# 4.1.4 向量范数的等价性⭐️

αa,αb||\alpha||_a,||\alpha||_bnn维线性空间VV上定义的两种向量范数,那么存在两个与α\alpha无关的正数d1,d2d_1,d_2,使得

d1αbαad2αbd_1||\alpha||_b\le ||\alpha||_a\le d_2||\alpha||_b

# 4.2 矩阵范数⭐️

# 4.2.1 矩阵范数概念(4条)

对于任何一个矩阵ACm×nA\in C^{m\times n},用A||A||表示按照某一确定法则与矩阵AA相对应的一个实数,且满足

  • 非负性,当A0A>0A \ne 0,||A||>0,当且仅当A=0A=0时,A=0||A||=0

  • 齐次性kA=kA,k||kA||=|k|||A||,k为任意数

  • 三角不等式:任意A,BCm×nA,B\in C^{m\times n},都有A+BA+B||A+B||\le ||A||+||B||

  • 矩阵乘法的相容性,对于任意两个可以相乘的矩阵A,BA,B,都有

    ABAB||AB||\le ||A||||B||

那么我们称A||A||是矩阵AA的范数

# 1) 矩阵乘法的相容性

矩阵乘法的相容性,对于任意两个可以相乘的矩阵A,BA,B,都有

ABAB||AB||\le ||A||||B||

比向量范数多了一条规则

# 2) 如何证明是矩阵范数

直接证明矩阵范数????证明其有四条性质即可

例子

对于任意ACm×nA\in C^{m\times n},定义

A=i=1mj=1naij||A||=\sum_{i=1}^m\sum_{j=1}^n|a_{ij|}

可以证明如此定义的A||A||为矩阵AA的范数

例子二

证明AB=nmaxi,jaij||AB||=n\max_{i,j}|a_{ij}|为矩阵范数

非负性,齐次性,三角板不等式很容易证明

AB=nmaxi,jk=1naikbkjnmaxi,jk=1naikbkjnnmaxi,kaikmaxk,jbkj=nmaxi,kaiknmaxk,jbkj=AB||AB||=n\max_{i,j}|\sum_{k=1}^na_{ik}b_{kj}|\le n\max_{i,j}\sum_{k=1}^n|a_{ik}||b_{kj}| \\ \le n\cdot n \max_{i,k}a_{ik}\max_{k,j}|b_{kj}| \\ =n\max_{i,k}|a_{ik}|\cdot n\max_{k,j}|b_{kj}| \\ =||A|||B||


# 4.2.2 谱半径及其性质⭐️

矩阵的谱半径是指其特征值绝对值集合的上确界,一般若为方阵A的谱半径则写作ρ(A)。

ρ(A)=max1inλi\rho(A)=\max_{1\le i\le n}|\lambda_i|

例子

ACn×nA\in C^{n\times n},那么ρ(A)A\rho(A)\le ||A||,其中A||A|| 是矩阵AA的任何一种范数

性质

AA是一个nn阶正规矩阵,则ρ(A)=A2\rho(A)=||A||_2


# 4.2.3 向量范数诱导的矩阵范数⭐️

定义Xα||X||_\alpha是向量范数,Aβ||A||_\beta是矩阵范数,如果对于任何矩阵AA和向量XX都有

AXαAβXα||AX||_\alpha\le ||A||_\beta||X||_\alpha

则称矩阵范数Aβ||A||_\beta与向量范数Xα||X||_\alpha相容的

例子

矩阵的FrobeniusFrobenius范数与向量的22-范数是相容的


下面是诱导函数的定义

Xα||X||_\alpha是向量的范数,则

Ai=maxX0AXαXα||A||_i=\max_{X\ne 0}\frac{||AX||_\alpha}{||X||_\alpha}

满足矩阵范数的定义,且Ai||A||_i是与向量范数Xα||X||_\alpha相容的矩阵范数

其中i表示induced就是诱导的意思

# 4.2.4 常见的矩阵范数⭐️

# 1) Frobenious范数酉不变性

对于任意ACm×nA\in C^{m\times n},定义

Af=(i=1mj=1naij2)12||A||_f=(\sum_{i=1}^m\sum_{j=1}^n|a_{ij}|^2)^{\frac{1}{2}}

可以证明A||A||也是矩阵AA的范数,我们称此范数为矩阵AAFrobenious范数

酉不变性

  • 如果A=[α1α2αn]A=\begin{bmatrix}\alpha_1&\alpha_2&\cdots&\alpha_n\end{bmatrix},那么AF2=i=1nαi22||A||_F^2=\sum_{i=1}^n||\alpha_i||_2^2

  • AF2=Tr(AHA)=i=1nλi(AHA)||A||_F^2=Tr(A^HA)=\sum_{i=1}^n\lambda_i(A^HA)

  • 对于任何mm阶酉矩阵UUnn阶酉矩阵VV都有等式

    AF=UAF=AHF||A||_F=||UA||_F=||A^H||_F

    =AVF=UAVF=||AV||_F=||UAV||_F


# 2) 列和范数,谱范数,行和范数⭐️

ACm×nA\in C^{m\times n}

  • 列和范数,A1=maxj(i=1maij),j=1,2,,n||A||_1=\max_{j}(\sum_{i=1}^m|a_{ij}|),j=1,2,\cdots,n

  • 谱范数:A2=maxj(λj(AHA))12,j=1,2,,n||A||_2=\max_{j}(\lambda_j(A^HA))^{\frac{1}{2}},j=1,2,\cdots,n

    其中λj(AHA)\lambda_j(A^HA)表示矩阵AHAA^HA的第jj个特征值

  • 行和范数:A=maxi(j=1naij),i=1,2,,m||A||_\infty=\max_i(\sum_{j=1}^n|a_{ij}|),i=1,2,\cdots,m

命题nn阶复矩阵AA的谱半径不大于其任何一种范数

例子

已知A=[210023120]A=\begin{bmatrix}2&-1&0 \\ 0&2&3 \\ 1&2&0\end{bmatrix},计算A1,A2,A,AF||A||_1,||A||_2,||A||_\infty,||A||_F

A1=5||A_1||=5

AF=23=5+9+9||A||_F=\sqrt{23}=\sqrt{5+9+9}

A=5||A||_\infty=5

AHA=[500096069]A^HA=\begin{bmatrix}5&0&0 \\ 0&9&6 \\ 0&6&9\end{bmatrix},所以AHAA^HA的特征值为5,15,35,15,3,A2=15||A||_2=\sqrt{15}


# 3) 性质

对于任何矩阵ACm×nA\in C^{m\times n}都有

  • AH1=AT1=A||A^H||_1=||A^T||_1=||A||_\infty
  • AH2=AT2=A2||A^H||_2=||A^T||_2=||A||_2
  • AHA2=A22||A^HA||_2=||A||_2^2
  • A22A1A||A||_2^2\le ||A||_1||A||_\infty

如何由矩阵范数构造与之相容的向量范数??

A||A||_\star是矩阵范数,则存在向量范数X||X||使得

AXAX||AX||\le ||A||_\star||X||

证明:对于任意的非零向量α\alpha,定义向量范数X=XαH||X||=||X\alpha^H||

例子

已知矩阵范数

A=A=i=1mj=1naij||A||_\star=||A||=\sum_{i=1}^m\sum_{j=1}^n|a_{ij}|

求与之相容的一个向量范数

解:取α=[010]T\alpha=\begin{bmatrix}0&1&\cdots &0\end{bmatrix}^T,设X=[x1x2xn]TX=\begin{bmatrix}x_1&x_2&\cdots&x_n\end{bmatrix}^T

那么X=XαH=i=1nxi=X1||X||=||X\alpha^H||_\star=\sum_{i=1}^n|x_i|=||X||_1

# 4.3 向量和矩阵的极限

# 4.3.1 矩阵的极限概念

设矩阵序列{A(k)}\{A^{(k)}\},其中A(k)=[aij(k)]Cm×nA^{(k)}=[a_{ij}^{(k)}]\in C^{m\times n},如果mnmn个数列{aij(k)}i=1,2,,m,j=1,2,,n\{a_{ij}^{(k)}\},i=1,2,\cdots,m,j=1,2,\cdots,n都收敛,则称矩阵序列{A(k)}\{A^{(k)}\}收敛、进一步,如果limkaij(k)=aij\lim_{k\to \infty}a_{ij}^{(k)}=a_{ij},那么limkA(k)=A=[aij]\lim_{k\to \infty}A^{(k)}=A=[a_{ij}]

我们称矩阵AA为矩阵序列A(k)A^{(k)}的极限


其中矩阵序列{A(k)}\{A^{(k)}\}----》这是由矩阵构成的序列。

序列里面每个矩阵长这个样子A(k)=[aij(k)]A^{(k)}=[a_{ij}^{(k)}]

例子

image-20211222133404438

定理

矩阵序列{A(k)}\{A^{(k)}\}收敛于AA的充分必要条件是

limkA(k)A=0\lim_{k\to \infty }||A^{(k)}-A||=0

其中A(k)A||A^{(k)}-A||为任意一种矩阵范数

# 4.3.2 矩阵的极限相关性质

  • 一个收敛的矩阵序列的极限是唯一的

  • limkA(k)=A,limkB(k)=B\lim_{k\to \infty }A^{(k)}=A,\lim_{k\to \infty }B^{(k)}=B,则

    limkaA(k)+bB(k)=aA+bB\lim_{k\to \infty }aA^{(k)}+bB^{(k)}=aA+bB

  • A(k)Cm×l,B(k)Cl×nA^{(k)}\in C^{m\times l},B^{(k)}\in C^{l\times n},如果

    limkA(k)=A,limkB(k)=B\lim_{k\to \infty }A^{(k)}=A,\lim_{k\to \infty }B^{(k)}=B

    那么limkA(k)B(k)=AB\lim_{k\to \infty}A^{(k)}B^{(k)}=AB

  • limkA(k)=A\lim_{k\to \infty}A^{(k)}=A,其中A(k)Cm×n,PCm×m,QCn×nA^{(k)}\in C^{m\times n},P\in C^{m\times m,Q\in C^{n\times n}}

    那么limkPA(k)Q=PAQ\lim_{k\to\infty }PA^{(k)}Q=PAQ

  • limkA(k)=A\lim_{k\to\infty} A^{(k)}=A,且{A(k)},A\{A^{(k)}\},A均可逆,则{(A(k))1}\{(A^{(k)})^{-1}\}

    也收敛,且limk(A(k))1=A1\lim_{k\to \infty}(A^{(k)})^{-1}=A^{-1}

例子

若对矩阵AA的某一范数A<1||A||<1,则limkAk=0\lim_{k\to \infty}A^k=0

已知矩阵序列A,A2,,Ak,A,A^2,\cdots,A^k,\cdots,则limkAk=0\lim_{k\to \infty}A^k=0的充要条件是ρ(A)<1\rho(A)<1

||\cdot||Cm×nC^{m\times n}的相容矩阵范数,则对任意ACm×nA\in C^{m\times n},都有ρ(A)=limkAk1k\rho(A)=\lim_{k\to \infty}||A^k||^{\frac{1}{k}}

# 4.4 矩阵幂级数

# 4.4.0 高等数学知识-无穷级数

# 1) 什么是级数?

在数学中,一个又穷或无穷的序列u0,u1,u2,u_0,u_1,u_2,\cdots的和s=u0+u1+u2+s=u_0+u_1+u_2+\cdots称为级数

  • 如果序列是有穷序列,其和称为有穷级数;反之,称为无穷级数。
  • 如果级数的通项是常量,则称之为常数项级数;如果级数的通项是函数,则称之为函数项级数。
  • 通项:序列u0,u1,u_0,u_1,\cdots中的项称作级数的通(或一般项)
  • 正项级数,若通项为实数的无穷级数un\sum u_n每一项unu_n都是大于等于零的,则称un\sum u_n是正数项级数

# 2) 什么是幂级数?

幂级数(power series)是一类形式简单而应用广泛的函数级数,变量可以是一个或多个。单变量的幂级数形式为:

f(x)=n=0an(xc)na0+a1(xc)1+a2(xc)2+a3(xc)3+f(x)=\sum_{n=0}^\infty a_n(x-c)^n \\ a_0+a_1(x-c)^1+a_2(x-c)^2+a_3(x-c)^3+\cdots

其中的cca0,a1,ana_0,a_1,\cdots a_n是常数。a0,a1,,ana_0,a_1,\cdots,a_n称为幂级数的系数。幂级数中的每一项都是一个幂函数

# 3) 常见的幂级数展开

ex=n=0xnn!=1+x+12!x2+13!x3+,xRcosx=n=0(1)nx2n(2n)!=112!x2+14!x4+,xRsinx=n=0(1)nx2n+1(2n+1)!=x13!x3+15!x5+11x=n=0xn=1+x+x2+x3+,x(1,1)11+x=n=0(1)nxn=1x+x2x3+,x(1,1)ln(1+x)=n=0(1)nn+1xn+1=x12x2+13x3+,x(1,1)e^x=\sum_{n=0}^\infty \frac{x^n}{n!}=1+x+\frac{1}{2!}x^2+\frac{1}{3!}x^3+\cdots,x\in R \\ \cos x=\sum_{n=0}^\infty(-1)^n\frac{x^{2n}}{(2n)!}=1-\frac{1}{2!}x^2+\frac{1}{4!}x^4+\cdots,x\in R \\ \sin x=\sum_{n=0}^\infty (-1)^n\frac{x^{2n+1}}{(2n+1)!}=x-\frac{1}{3!}x^3+\frac{1}{5!}x^5+\cdots \\ \frac{1}{1-x}=\sum_{n=0}^\infty x^n=1+x+x^2+x^3+\cdots,x\in (-1,1) \\ \frac{1}{1+x}=\sum_{n=0}^\infty(-1)^nx^n=1-x+x^2-x^3+\cdots,x\in(-1,1) \\ ln(1+x)=\sum_{n=0}^\infty \frac{(-1)^n}{n+1}x^{n+1}=x-\frac{1}{2}x^2+\frac{1}{3}x^3+\cdots,x\in (-1,1)

# 4.4.1 矩阵级数收敛性

# 1) 概念

A(k)=[aij(k)]Cm×nA^{(k)}=[a_{ij}^{(k)}]\in C^{m\times n},

如果mnmn个常数项级数

k=1aij(k),i=1,2,,m;j=1,2,,n\sum_{k=1}^\infty a_{ij}^{(k)},i=1,2,\cdots,m;j=1,2,\cdots,n都收敛,

则称就是矩阵级数k=1A(k)=A(1)+A(2)++A(k)+\sum_{k=1}^\infty A^{(k)}=A^{(1)}+A^{(2)}+\cdots+A^{(k)}+\cdots收敛


如果mnmn个常数项级数

k=1aij(k),i=1,2,,m;j=1,2,,n\sum_{k=1}^\infty a_{ij}^{(k)},i=1,2,\cdots,m;j=1,2,\cdots,n绝对收敛,

则称矩阵级数k=1A(k)=A(1)+A(2)++A(k)+\sum_{k=1}^\infty A^{(k)}=A^{(1)}+A^{(2)}+\cdots+A^{(k)}+\cdots绝对收敛

例子

如果设A(k)=[aij(k)]C2×2A^{(k)}=[a_{ij}^{(k)}]\in C^{2\times 2}

其中k=1a11(k)=k=11k(k+1)\sum_{k=1}^\infty a_{11}^{(k)}=\sum_{k=1}^\infty \frac{1}{k(k+1)}

k=1a12(k)=k=11k3\sum_{k=1}^\infty a_{12}^{(k)}=\sum_{k=1}^\infty \frac{1}{k^3}

k=1a21(k)=k=1π2k\sum_{k=1}^\infty a_{21}^{(k)}=\sum_{k=1}^\infty \frac{\pi}{2^k}

k=1a22(k)=k=1sinπ2k\sum_{k=1}^\infty a_{22}^{(k)}=\sum_{k=1}^\infty \sin \frac{\pi}{2^k}

那么矩阵级数k=1A(k)=A(1)+A(2)++A(k)+\sum_{k=1}^\infty A^{(k)}=A^{(1)}+A^{(2)}+\cdots+A^{(k)}+\cdots是收敛的

# 2) 定理(收敛性判定)

A(k)=[aij(k)]Cm×nA^{(k)}=[a_{ij}^{(k)}]\in C^{m\times n},则

矩阵级数k=1A(k)=A(1)+A(2)++A(k)+\sum_{k=1}^\infty A^{(k)}=A^{(1)}+A^{(2)}+\cdots+A^{(k)}+\cdots绝对收敛的充分必要条件

正项级数k=1A(k)=A(1)+A(2)++A(k)+\sum_{k=1}^\infty ||A^{(k)}||=||A^{(1)}||+||A^{(2)}||+\cdots+||A^{(k)}||+\cdots收敛,

其中A||A||为任意一种矩阵范数

定理

对于两个绝对收敛的矩阵级数,他们的Cauchy积所组成的矩阵级数仍然绝对收敛

S1:A1+A2++Ak+S_1:A_1+A_2+\cdots+A_k+\cdots

S2:B1+B2++Bk+S_2:B_1+B_2+\cdots+B_k+\cdots

S1A,S2BS_1\to A,S_2\to B

S3:A1B2+(A1B2+A2B1)+(A1B3+A2A2+A3B1)++(A1Bk+A2Bk1++AkB1)+S_3:A_1B_2+(A_1B_2+A_2B_1)+(A_1B_3+A_2A_2+A_3B_1)+\cdots+(A_1B_k+A_2B_{k-1}+\cdots+A_kB_1)+\cdots

S3ABS_3\to AB

# 4.4.2 幂级数

# 1) 幂级数概念

ACn×nA\in C^{n\times n},称形如

k=1akAk=a0I+a1A+a2A2++akAk+\sum_{k=1}^\infty a_kA^k=a_0I+a_1A+a_2A^2+\cdots+a_kA^k+\cdots

的矩阵级数为矩阵幂级数

# 2) 幂级数定理

如果矩阵AA的某个范数A||A||在幂级数的

a0+a1x+a2x2++akxk+a_0+a_1x+a_2x^2+\cdots+a_kx^k+\cdots

收敛域内,那么矩阵幂级数k=1akAk\sum_{k=1}^\infty a_kA^k绝对收敛

# 3) Cauchy-Hadamard 定理

幂级数k=0akxk\sum_{k=0}a_kx^k,当x<R||x||<R时,绝对收敛,当x>R||x||>R时发散。

x=R||x||=R时,幂级数收敛与否必须另行判定,这里RR为此幂级数的收敛半径

1R=limkak+1ak\frac{1}{R}=\lim_{k\to \infty}|\frac{a_{k+1}}{a_k}|

矩阵版本

设幂级数k=0akxk\sum_{k=0}^\infty a_kx^k的收敛半径为RR,AAnn阶方阵,

ρ(A)<R\rho(A)<R,则矩阵幂级数k=0akAk\sum_{k=0}^\infty a_kA^k绝对收敛

ρ(A)>R\rho(A)>R,则矩阵幂级数k=0akAk\sum_{k=0}^\infty a_kA^k发散

# 证明

AAJordanJordan标准型为

J=diag(J1(λ1),J2(λ2),,Jr(λr))J=diag(J_1(\lambda_1),J_2(\lambda_2),\cdots,J_r(\lambda_r))

其中

Ji=[λi1λi11λi]J_i= \begin{bmatrix} \lambda_i&1&&& \\ &\lambda_i&1&&& \\ &&\ddots&\ddots&& \\ &&&\ddots&1 \\ &&&&\lambda_i \end{bmatrix}

Ak=Pdiag(J1k(λ1),J2k(λ2),,Jrk(λr))P1A^k=Pdiag(J_1^k(\lambda_1),J_2^k(\lambda_2),\cdots,J_r^k(\lambda_r))P^{-1}

Ji=[λikCk1λik1Ckdi1λikdi+1λikCk1λik1λik]J_i= \begin{bmatrix} \lambda_i^k&C_k^1\lambda_i^{k-1}&&&C_k^{d_i-1}\lambda_i^{k-d_i+1} \\ &\lambda_i^k&&&& \\ &&\ddots&\ddots&& \\ &&&\ddots&C_k^1\lambda_i^{k-1} \\ &&&&\lambda_i^k \end{bmatrix}

所以

k=0akAk=k=0ak(PJkP1)\sum_{k=0}^\infty a_kA^k=\sum_{k=0}^\infty a_k(PJ^kP^{-1})

=P(k=0akJk)P1=P(\sum_{k=0}^\infty a_kJ^k)P^{-1}

=Pdiag(k=0akJ1k(λ1),k=0akJ2k(λ2),,k=0akJrk(λr))P1=Pdiag(\sum_{k=0}^\infty a_kJ_1^k(\lambda_1),\sum_{k=0}^\infty a_kJ_2^k(\lambda_2),\cdots,\sum_{k=0}^\infty a_kJ_r^k(\lambda_r))P^{-1}

k=0akJik(λi)=[k=0akλikk=0akCk1λik1k=0akCkdi1λikdi+1k=0akλikk=0akCk1λik1k=0akλik]\sum_{k=0}^\infty a_kJ_i^k(\lambda_i)= \begin{bmatrix} \sum_{k=0}^\infty a_k\lambda_i^k& \sum_{k=0}^\infty a_kC_k^1\lambda_i^{k-1}&&\cdots& \sum_{k=0}^\infty a_kC_k^{d_i-1}\lambda_i^{k-d_i+1} \\ & \sum_{k=0}^\infty a_k\lambda_i^k&&&\vdots \\ &&\ddots&\ddots&& \\ &&&\ddots& \sum_{k=0}^\infty a_kC_k^1\lambda_i^{k-1} \\ &&&& \sum_{k=0}^\infty a_k\lambda_i^k \end{bmatrix}

其中ckl=k(k1)(kl+1)l!c_k^l=\frac{k(k-1)\cdots (k-l+1)}{l!}lkl\le k

ckl=0c_k^l=0,当l>kl>k

ρ(A)<R\rho(A)<R时,幂级数都收敛,

例子

矩阵幂级数

eA=n=0Ann!e^A=\sum_{n=0}^\infty \frac{A^n}{n!}

sinAsin A

cosA=n=0(1)n(2n)!A2ncos A=\sum_{n=0}^\infty \frac{(-1)^n}{(2n)!}A^{2n}

都是绝对收敛的

当矩阵的AA的谱半径ρ(A)<1\rho(A)<1,下面的三个矩阵级数也是绝对收敛

arctanA,ln(I+A),(I+A)1,(IA)1arctan A,ln(I+A),(I+A)^{-1},(I-A)^{-1}

# 4.4.3 矩阵幂级数的收敛和

定理

矩阵幂级数

I+A+A2++Ak+I+A+A^2+\cdots +A^k+\cdots绝对收敛的充分必要条件是ρ(A)<1\rho(A)<1,且其和为(IA)1(I-A)^{-1}

例子

A=[15353515]A=\begin{bmatrix}\frac{1}{5}&\frac{3}{5} \\ \frac{3}{5}&\frac{1}{5}\end{bmatrix}

求证,矩阵幂级数k=1k2Ak\sum_{k=1}^\infty k^2A^k收敛

求矩阵幂级数k=1k2Ak\sum_{k=1}^\infty k^2 A^k的收敛和

解:λEA=(λ+25)(λ45)|\lambda E-A|=(\lambda+\frac{2}{5})(\lambda-\frac{4}{5})

可知AA的特征是为λ1=25,λ2=45,ρ(A)=45\lambda_1=\frac{-2}{5},\lambda_2=\frac{4}{5},\rho(A)=\frac{4}{5}

而级数k2Akk^2 A^k的收敛半径为R=1R=1

k=0xk=(1x)1,(k=0xk)=(1x)2\sum_{k=0}^\infty x^k=(1-x)^-1,(\sum_{k=0}^\infty x^k)^\prime=(1-x)^{-2}

k=0kxk1=(1x)2,k=0kxk=x(1x)2\sum_{k=0}^\infty kx^{k-1}=(1-x)^{-2},\sum_{k=0}^\infty k x^k=x(1-x)^{-2}

(k=0kxk)=(x+1)(1x)3(\sum_{k=0}^\infty kx^k)^\prime=(x+1)(1-x)^{-3}

k=0k2xk=x(1+x)(1x)3\sum_{k=0}^\infty k^2x^k=x(1+x)(1-x)^{-3}

所以k=0k2Ak=A(E+A)(EA)3=5[72411241124724]\sum_{k=0}^\infty k^2A^k=A(E+A)(E-A)^{-3}=5\begin{bmatrix}-\frac{7}{24}& \frac{11}{24} \\ \frac{11}{24}& -\frac{7}{24}\end{bmatrix}

# 4.5 矩阵函数

# 4.5.1 矩阵多项式

# 1) 矩阵多项式定义

已知 ACm×nA\in C^{m\times n}和关于变量x的多项式

f(x)=amxm+am1xm1++a1x+a0f(x)=a_mx^m+a_{m-1}x^{m-1}+\cdots+a_1x+a_0

那么我们称

f(A)=amAm+am1Am1++a1A+a0If(A)=a_mA^m+a_{m-1}A^{m-1}+\cdots+a_1A+a_0I

AA的矩阵多项式

# 2) 矩阵多项式计算

AA为一个nn阶矩阵,JJ为其JordanJordan标准型,则

A=PJP1=Pdiag(J1,J2,,Jr)P1A=PJP^{-1}=Pdiag(J_1,J_2,\cdots,J_r)P^{-1}

=Pdiag(J1(λ1),J2(λ2),,Jr(λr)P1)=Pdiag(J_1(\lambda_1),J_2(\lambda_2),\cdots,J_r(\lambda_r)P^{-1})

于是有了

f(A)=amAm+am1Am1++a1A+a0If(A)=a_mA^m+a_{m-1}A^{m-1}+\cdots+a_1A+a_0I

=am(PJP1)m+am1(PJP1)m1++a1(PJP1)+a0I=a_m(PJP^{-1})^m+a_{m-1}(PJP^{-1})^{m-1}+\cdots+a_{1}(PJP^{-1})+a_0I

image-20211223164614169

image-20211223164735976

image-20211223164752241

# 3) 相关定理

ACn×n,λ1,λ2,,λnA\in C^{n\times n},\lambda_1,\lambda_2,\cdots,\lambda_nAAnn个特征根,则矩阵多项式f(A)f(A)的特征根为

f(λ1),f(λ2),,f(λn)f(\lambda_1),f(\lambda_2),\cdots,f(\lambda_n)

例子

已知多项式f(x)=x42x3+x1f(x)=x^4-2x^3+x-1与矩阵

A=[200111113]A=\begin{bmatrix}2&0&0\\ 1&1&1 \\ 1&-1&3\end{bmatrix}

f(A)f(A)

首先求出矩阵AAJordanJordan标准型JJ及其相似变换矩阵PP

J=[210020002],P=[011100101]J=\begin{bmatrix} 2&1&0\\ 0&2&0 \\ 0&0&2\end{bmatrix},P=\begin{bmatrix}0&1&1 \\ 1&0&0 \\ 1&0&-1\end{bmatrix}

并计算出

P1=[010111011]P^{-1}=\begin{bmatrix}0&1&0\\ 1&-1&1 \\ 0&1&-1\end{bmatrix}

f(A)=Pf(J)P1f(A)=Pf(J)P^{-1}

=[011100101][f(2)f(2)01f(2)000f(2)][010111011]=[1009899910]=\begin{bmatrix}0&1&1\\ 1&0&0 \\ 1&0&-1\end{bmatrix} \begin{bmatrix}f(2)&f^\prime(2)&0\\ 1&f(2)&0 \\ 0&0&f(2)\end{bmatrix} \begin{bmatrix}0&1&0\\ 1&-1&1 \\ 0&1&-1 \end{bmatrix} \\ =\begin{bmatrix}1&0&0\\ 9&-8&9 \\ 9&-9&10 \end{bmatrix}

# 4.5.2 最小多项式⭐️

# 1) 化零多项式

已知ACm×nA\in C^{m\times n}和关于变量xx的多项式

f(A)=amAm+am1Am1++a1A+a0If(A)=a_mA^m+a_{m-1}A^{m-1}+\cdots+a_1A+a_0I

如果f(x)f(x)满足f(A)=On×nf(A)=O_{n\times n},那么f(x)f(x)称为矩阵AA的一个化零多项式

# 2) Hamilton-Cayley⭐️

Hamilton-Cayley定理(哈密顿一凯莱定理)

已知ACn×nA\in C^{n\times n},若f(λ)=λEAf(\lambda)=|\lambda E-A|AA的特征多项式

则有f(A)=amAm+am1Am1++a1A+a0IO=n×nf(A)=a_mA^m+a_{m-1}A^{m-1}+\cdots+a_1A+a_0IO=_{n\times n}

我们称此定理为Hamilton-Cayley定理

例子

A=[200021002]A=\begin{bmatrix}2&0&0\\ 0&2&1 \\ 0&0&2 \end{bmatrix}

特征多项式为f(λ)=(λ2)3f(\lambda)=(\lambda-2)^3,显然f(A)=Of(A)=O

# 3) 最小多项式概念

AAnn阶矩阵,则AA的首项系数为1的次数最小的零化多项式m(λ)m(\lambda)称为AA的最小多项式

# 4) 最小多项式的性质

  • 矩阵的任何一个化零多项式均能被m(λ)m(\lambda)整除
  • 矩阵AA的最小多项式的唯一的
  • 相似矩阵有相同的最小多项式

# 5) 最小多项式的计算⭐️

引理

kk级Jordan块的J=[ai1ai11ai]J=\begin{bmatrix}a_i&1&&& \\ &a_i&1&&\\ &&\ddots&\ddots&\\ &&&\ddots&1\\ &&&&a_i\end{bmatrix}最小多项式为(xa)k(x-a)^k

定理

数域P上n级矩阵A与对角矩阵相似的充要条件为A的最小多项式是P上互素的一次因式的乘积

定理

已知分块对角矩阵A=diag(A1,A2,,Ar),m1(λ),m2(λ),,mr(λ)A=diag(A_1,A_2,\cdots,A_r),m_1(\lambda),m_2(\lambda),\cdots,m_r(\lambda)分别为子块A1,A2,,ArA_1,A_2,\cdots,A_r的最小多项式。则AA的最小多项式为m1(λ),m2(λ),,mr(λ)m_1(\lambda),m_2(\lambda),\cdots,m_r(\lambda)的最小公倍数[m1(λ),m2(λ),,mr(λ)][m_1(\lambda),m_2(\lambda),\cdots,m_r(\lambda)]

定理

image-20211227195029237

例子

image-20211227195108020

image-20211227195212657

# 4.5.3 矩阵函数概念

影谱上有定义

ACn×n,λ1,λ2,,λsA\in C^{n\times n},\lambda_1,\lambda_2,\cdots,\lambda_sAAss个互异的特征值,

AA的最小多项式m(λ)=(λλ1)d1(λλ2)d2(λλs)dsm(\lambda)=(\lambda-\lambda_1)^{d_1}(\lambda-\lambda_2)^{d_2}\cdots(\lambda-\lambda_s)^{d_s}

其中di1(i=1,2,,s),i=1sdi=md_i\ge 1(i=1,2,\cdots,s),\sum_{i=1}^sd_i=m

如果函数f(x)f(x)具有足够高阶的导数并且下列mm个值

{f(λi),f(λi),,f(di1)(λi)}\{f(\lambda_i),f^\prime(\lambda_i),\cdots ,f^{(d_i-1)}(\lambda_i)\}

存在,则称函数f(x)f(x)在矩阵AA的影谱上有定义。

例子

image-20211225155328396

image-20211225155358179


矩阵函数的定义

设矩阵ACn×nA\in C^{n\times n},其最小多项式为m(λ)=(λλ1)d1(λλ2)d2(λλs)dsm(\lambda)=(\lambda-\lambda_1)^{d_1}(\lambda-\lambda_2)^{d_2}\cdots(\lambda-\lambda_s)^{d_s}

函数f(x)f(x)在矩阵AA的影谱上有定义,如果存在多项式p(λ)p(\lambda)满足

f(k)(λi)=p(k)(λi),i=1,2,,sf^{(k)}(\lambda_i)=p^{(k)}(\lambda_i),i=1,2,\cdots,s

则定义矩阵函数f(A)=p(A)f(A)=p(A)

注意点

  • 满足上述定义的多项式p(λ)p(\lambda)存在且不唯一
  • 矩阵函数f(A)f(A)是与AA相同阶数的矩阵

定理

g(λ)g(\lambda)q(λ)q(\lambda)为两个不同的多项式,AAnn阶矩阵,则g(A)=q(A)g(A)=q(A)的充分必要条件是g(λ)g(\lambda)q(λ)q(\lambda)AA的影谱上的值对应相等,即

g(k)(λi)=q(k)(λi)g^{(k)}(\lambda_i)=q^{(k)}(\lambda_i)

ACn×nA\in C^{n\times n},如果f(A)f(A)有定义,那么f(AT)f(A^T)是否也有定义

因为AAATA^T相似,所以有相同的最小多项式,f(x)f(x)AA上有定义 ,所以f(AT)f(A^T)有定义

# 4.5.4 矩阵函数计算

# 1) 矩阵函数的Jordan表示

ACn×nA\in C^{n\times n}JJ为矩阵的Jordan标准型,PP为其相似变换矩阵且使得A=PJP1A=PJP^{-1}

如果函数f(x)f(x)在矩阵AA的影谱上有定义,那么f(A)=Pf(J)P1f(A)=Pf(J)P^{-1}

image-20211225161314442

定理

ACn×nλ1,λ2,,λnA\in C^{n\times n},\lambda_1,\lambda_2,\cdots,\lambda_nAAnn个特征根,则矩阵函数f(A)f(A)的特征根,则矩阵函数f(A)f(A)的特征根为

f(λ1),f(λ2),,f(λn)f(\lambda_1),f(\lambda_2),\cdots,f(\lambda_n)

例子

A=[126103114]A=\begin{bmatrix}-1&-2&6 \\ -1&0&3 \\ -1&-1&4\end{bmatrix}

f(A)f(A)JordanJordan表示并计算etA,sinAe^{tA},\sin A

J=[100011001],P=[122110011]J=\begin{bmatrix}1&0&0 \\ 0&1&1 \\ 0&0&1\end{bmatrix},P=\begin{bmatrix}-1&2&2 \\ 1&1&0 \\ 0&1&1\end{bmatrix}

从而f(A)f(A)的Jordan表示为

f(A)=Pf(J)P1f(A)=Pf(J)P^{-1}

=[122110011][f(1)000f(1)f(1)00f(1)][102112113]=\begin{bmatrix}-1&2&2 \\ 1&1&0 \\ 0&1&1\end{bmatrix}\begin{bmatrix}f(1)&0&0 \\ 0&f(1)&f^\prime(1) \\ 0&0&f(1)\end{bmatrix}\begin{bmatrix}-1&0&2 \\ 1&1&-2 \\ -1&-1&3\end{bmatrix}

=[f(1)2f(1)2f(1)6f(1)f(1)f(1)f(1)3f(1)f(1)f(1)f(1)+3f(1)]=\begin{bmatrix}f(1)-2f^\prime(1)&-2f^\prime(1)&6f^\prime(1) \\ -f^\prime(1)&f(1)-f^\prime(1)&3f^\prime(1) \\ -f^\prime(1)&-f^\prime(1)&f(1)+3f^\prime(1)\end{bmatrix}

f(x)=etxf(x)=e^{tx}是,可得f(1)=et,f(1)=tetf(1)=e^t,f^\prime(1)=te^t

etA=[(12t)et2tet6tettet(1t)et3tettettet(1+3t)et]e^{tA}=\begin{bmatrix} (1-2t)e^t&-2te^t&6te^t \\ -te^t&(1-t)e^t&3te^t \\ -te^{t}&-te^t&(1+3t)e^t \end{bmatrix}

image-20211225162128974

# 2) 矩阵函数的多项式表示

设矩阵ACn×nA\in C^{n\times n}的最小多项式m(λ)=(λλ1)d1(λλ2)d2(λλs)dsm(\lambda)=(\lambda-\lambda_1)^{d_1}(\lambda-\lambda_2)^{d_2}\cdots(\lambda-\lambda_s)^{d_s}

其中di1(i=1,2,,s),i=1sdi=md_i\ge 1(i=1,2,\cdots,s),\sum_{i=1}^sd_i=m

根据计算方法中的Lagrange-Svlvester内插多项式定理可得,有一个次数为m1m-1次的多项式

p(x)=am1xm1+am2xm2++a1x+a0p(x)=a_{m-1}x^{m-1}+a_{m-2}x^{m-2}+\cdots+a_1x+a_0

满足p(k)(λi)=f(k)(λi),i=1,2,,sp^{(k)}(\lambda_i)=f^{(k)}(\lambda_i),i=1,2,\cdots,s

p(x)p(x)的系数为am1,am2,,a1,a0a_{m-1},a_{m-2},\cdots,a_1,a_0,可以通过上面关系树确定出来,我们称

f(A)=am1Am1+am2Am2++a1A+a0If(A)=a_{m-1}A^{m-1}+a_{m-2}A^{m-2}+\cdots+a_1A+a_0I

为矩阵函数f(A)f(A)的多项式表示

例子

A=[200111113]A=\begin{bmatrix}2&0&0 \\ 1&1&1 \\ 1&-1&3\end{bmatrix}

f(A)f(A)的多项式表示并且计算etAe^{tA}

解求AA的Jordan标准型为

J=[200021002]J=\begin{bmatrix}2&0&0 \\ 0&2&1 \\ 0&0&2\end{bmatrix}

矩阵AA的最小多项式为m(λ)=(λ2)2m(\lambda)=(\lambda-2)^2

从而存在一个次数为1的多项式p(x)=a1x+a0p(x)=a_1x+a_0满足

p(2)=f(2),p=f(2)p(2)=f(2),p^\prime=f^\prime(2)

f(2)=2a1+a0,f(2)=a1f(2)=2a_1+a_0,f^\prime(2)=a_1

解得a0=f(2)2f(2),a1=f(2)a_0=f(2)-2f^\prime(2),a_1=f^\prime(2)

image-20211225163557933

# 4.5.5 矩阵函数的幂级数表示

ACn×nA\in C^{n\times n},一元函数f(x)f(x)能够展开成关于xx的幂级数f(x)=k=0ckxkf(x)=\sum_{k=0}^\infty c_kx^k,收敛半径为RR当矩阵AA的谱半径ρ(A)<R\rho(A)<R时,矩阵幂级数k=0ckAk\sum_{k=0}^\infty c_kA^k绝对收敛并且

f(A)=k=0ckAkf(A)=\sum_{k=0}^\infty c_kA^k

image-20211225164355005

例子

已知A=[200111113]A=\begin{bmatrix}2&0&0 \\ 1&1&1 \\ 1&-1&3\end{bmatrix}

求矩阵幂级数k=0k+110k+1Ak\sum_{k=0}^\infty \frac{k+1}{10^{k+1}}A^k的和

AA的Jordan标准型为J=[200021002]J=\begin{bmatrix}2&0&0 \\ 0&2&1 \\ 0&0&2\end{bmatrix}

所以ρ(A)=2\rho(A)=2

image-20211225164711236

image-20211225164752270

# 4.6 矩阵的微分和积分

# 4.6.1 函数矩阵⭐️

# 1) 函数矩阵概念

以未定元x的函数为元素的矩阵

[a11(x)a12(x)a1n(x)a21(x)a22(x)a2n(x)am1(x)am2(x)amn(x)]\begin{bmatrix} a_{11}(x)&a_{12}(x)&\cdots&a_{1n}(x) \\ a_{21}(x)&a_{22}(x)&\cdots&a_{2n}(x) \\ \cdots&\cdots&\cdots&\cdots \\ a_{m1}(x)&a_{m2}(x)&\cdots&a_{mn}(x) \end{bmatrix}

称为函数矩阵,其中所有的元素aija_{ij}都是定义在闭区间[a,b][a,b]上的多项式

函数矩阵和数字矩阵一样有加法,数乘,乘法,转置等几种运算,并且运算法则相同

已知

A=[1xsinxex1+x],B=[1+xcosxex1x]A=\begin{bmatrix}1-x& \sin x \\ e^x&1+x\end{bmatrix},B=\begin{bmatrix}1+x&\cos x \\ e^x&1-x\end{bmatrix}

计算A+B,AB,AT,2x(AB)A+B,AB,A^T,2^x(A-B)

# 2) 函数矩阵的可逆矩阵

A(x)A(x)为一个nn阶函数矩阵,如果存在nn阶函数矩阵B(x)B(x)使得对于任何x[a,b]x\in [a,b]都有

A(x)B(x)=B(x)A(x)=IA(x)B(x)=B(x)A(x)=I

那么我们称A(x)A(x)在区间[a,b][a,b]上是可逆的。称B(x)B(x)A(x)A(x)的逆矩阵,一般记为A1(x)A^{-1}(x)

image-20211225201003729


# 3) 函数矩阵可逆的充分必要条件

定理

nn阶矩阵A(x)A(x)在区间[a,b][a,b]上可逆的充分必要条件是A(x)|A(x)|[a,b][a,b]处处不为零,并且

A1(x)=1A(x)A(x)A^{-1}(x)=\frac{1}{|A(x)|}A^*(x)

其中A(x)A^*(x)为矩阵A(x)A(x)的伴随矩阵

# 4) 函数矩阵的秩

区间在[a,b][a,b]上的m×nm\times n函数矩阵不恒等于零的子式的最高阶数称为A(x)A(x)的秩

特别的,设A(x)A(x)在区间[a,b][a,b]上的nn阶函数矩阵,如果A(x)A(x)的秩为nn,则称A(x)A(x)一个满秩矩阵

注意点。对于nn阶函数矩阵而言,满秩与可逆不是等价的,可逆的一定是满秩的,但是满秩的并不一定是可逆的

image-20211225201636642

# 5) 函数矩阵的导数⭐️

定义:如果A(x)=(aij(x))m×nA(x)=(a_{ij}(x))_{m\times n}的所有各元素aij(x)a_{ij}(x)x=x0x=x_0处有极限,即

limxx0aij(x)=aij\lim_{x\to x_0}a_{ij}(x)=a_{ij}

其中aija_{ij}为固定常数。则称A(x)A(x)x=x0x=x_0处有极限,且记为limxx0A(x)=A\lim_{x \to x_0}A(x)=A

其中

[a11a13a1na21a22a2nam1am2amn]\begin{bmatrix} a_{11}&a_{13}&\cdots&a_{1n} \\ a_{21}&a_{22}&\cdots&a_{2n} \\ \cdots&\cdots&\cdots&\cdots \\ a_{m1}&a_{m2}&\cdots&a_{mn} \end{bmatrix}

如果A(x)A(x)​各元素aija_{ij}​在x=x0x=x_0​处连续,即limxx0aij(x)=aij(x0)\lim_{x\to x_0}a_{ij}(x)=a_{ij}(x_0)

则称A(x)A(x)x=x0x=x_0处连续,且记为limxx0A(x)=A(x0)\lim_{x\to x_0}A(x)=A(x_0)

容易验证下面的等式是成立的

limxx0A(x)=A,limxx0B(x)=B\lim_{x\to x_0}A(x)=A,\lim_{x\to x_0}B(x)=B

limxx0A(x)±B(x)=A±B\lim_{x\to x_0}A(x)\pm B(x)=A\pm B

limxx0(kA(x))=kA\lim_{x\to x_0}(kA(x))=kA

limxx0A(x)B(x)=AB\lim_{x\to x_0}A(x)B(x)=AB

# 导数定义

如果A(x)=(aij(x))m×nA(x)=(a_{ij}(x))_{m\times n}的所有各元素aij(x)a_{ij}(x)在点x=x0x=x_0处(或在区间[a,b][a,b]上)可导,便称此函数矩阵A(x)A(x)在点x=x0x=x_0处(或在区间[a,b][a,b]上)可导,并且记为

A(x0)=dA(x)dx=limΔx0A(x0+Δx)A(x0)Δx=[a11a13a1na21a22a2nam1am2amn]A^\prime(x_0)=\frac{dA(x)}{dx}=\lim_{\Delta x\to 0} \frac{A(x_0+\Delta x)-A(x_0)}{\Delta x} \\ =\begin{bmatrix} a_{11}^\prime&a_{13}^\prime&\cdots&a_{1n}^\prime \\ a_{21}^\prime&a_{22}^\prime&\cdots&a_{2n}^\prime \\ \cdots&\cdots&\cdots&\cdots \\ a_{m1}^\prime&a_{m2}^\prime&\cdots&a_{mn}^\prime \end{bmatrix}

# 导数性质
  • A(x)A(x)常数矩阵的充分必要条件

    dA(x)dx=0\frac{dA(x)}{dx}=0

  • A(x)=(aij(x))m×n,B(x)=(bij(x))m×nA(x)=(a_{ij}(x))_{m\times n},B(x)=(b_{ij}(x))_{m\times n}均可导,则

    ddx[A(x)+B(x)]=dA(x)dx+dB(x)dx\frac{d}{dx}[A(x)+B(x)]=\frac{d A(x)}{dx}+\frac{dB(x)}{dx}

  • k(x)k(x)xx的纯量函数,A(x)A(x)是多项式矩阵,k(x)k(x)A(x)A(x)均可导,则

    ddx[k(x)A(x)]=dk(x)dxA(x)+k(x)dA(x)dx\frac{d}{dx}[k(x)A(x)]=\frac{dk(x)}{dx}A(x)+k(x)\frac{dA(x)}{dx}

    特别地,当k(x)k(x)是常数kk,时

    ddx[kA(x)]=kdA(x)dx\frac{d}{dx}[kA(x)]=k\frac{dA(x)}{dx}

  • A(x),B(x)A(x),B(x)均可导,且A(x)A(x)B(x)B(x)是可乘的,则

    ddx[A(x)B(x)]=dA(x)dxB(x)+A(x)dB(x)dx\frac{d}{dx}[A(x)B(x)]=\frac{dA(x)}{dx}B(x)+A(x)\frac{dB(x)}{dx}

  • 如果A(x)A(x)A1(x)A^{-1}(x)均可导,则

    dA1(x)dx=A1(x)dA(x)dxA1(x)\frac{d A^{-1}(x)}{dx}=-A^{-1}(x)\frac{dA(x)}{dx}A^{-1}(x)

  • A(x)A(x)为一函数矩阵,x=f(t)x=f(t)tt的纯量函数,f(t)f(t)A(x)A(x)均可导则

    ddtA(x)=dA(x)dxf(t)=f(t)dA(x)dx\frac{d}{dt}A(x)=\frac{dA(x)}{dx}f^\prime(t)=f^\prime(t)\frac{d A(x)}{dx}

# 6) 函数矩阵的定积分⭐️

函数矩阵的定积分性质如下

abkA(x)dx=kanA(x)dx\int_a^bkA(x)dx=k\int_a^nA(x)dx

ab[A(x)+B(x)]dx=abA(x)dx+abB(x)dx\int_a^b[A(x)+B(x)]dx=\int_a^bA(x)dx+\int_a^bB(x)dx

例子

image-20211225212136537

ddxA(x)=[02x10]d2dx2A(x)=[0200]d3dx3A(x)=[0000]\frac{d}{dx}A(x)=\begin{bmatrix}0&2x \\ 1&0\end{bmatrix}\quad \frac{d^2}{dx^2}A(x)=\begin{bmatrix}0&2 \\ 0&0\end{bmatrix}\quad \frac{d^3}{dx^3}A(x)=\begin{bmatrix}0&0 \\ 0&0\end{bmatrix}

由于A(x)=x3|A(x)|=-x^3,所以

ddxA(x)=3x2\frac{d}{dx}|A(x)|=-3x^2

下面去A1(x)A^{-1}(x),由伴随矩阵公式可得

image-20211225212604362

例子二

image-20211225212650412

image-20211225212729048

检验

image-20211227212333378

# 7) 函数向量的相关性

设有定义在区间[a,b][a,b]上的mm个连续的函数变量ai(x)=(ai1(x),ai2(x),,ain(x))a_i(x)=(a_{i1}(x),a_{i2}(x),\cdots,a_{in}(x))

如果存在一组不全为零的常实数k1k2,,kmk-1,k_2,\cdots,k_m使得对所有的x[a,b]x\in [a,b]等式

k1α1(x)+k2α2(x)++kmαm(x)=0k_1\alpha_1(x)+k_2\alpha_2(x)+\cdots+k_m\alpha_m(x)=0

成立,我们称在[a,b][a,b]α1(x),α2(x),,αm(x)\alpha_1(x),\alpha_2(x),\cdots,\alpha_m(x)线性相关

定义

α1(x),α2(x),,αm(x)\alpha_1(x),\alpha_2(x),\cdots,\alpha_m(x)mm个定义在区间[a,b][a,b]上的连续函数向量

αi(x)=(αi1(x),αi2(x),,αim(x))\alpha_i(x)=(\alpha_{i1}(x),\alpha_{i2}(x),\cdots,\alpha_{im}(x))

gij=abαi(x)αjT(x)dxg_{ij}=\int_a^b \alpha_i(x)\alpha_j^T(x)dx

gijg_{ij}为元素的常数矩阵

G=(gij)m×nG=(g_{ij})_{m\times n}

称为α1(x),α2(x),,αm(x)\alpha_1(x),\alpha_2(x),\cdots,\alpha_m(x)GramGram矩阵,detGdetG称为GramGram行列式

定理

定义在区间[a,b][a,b]上的连续多项式向量α1(x),α2(x),,αm(x)\alpha_1(x),\alpha_2(x),\cdots,\alpha_m(x)线性无关的充要条件是她GramGram矩阵为满秩矩阵

例子

image-20211225213906321

image-20211225214401578

定义

image-20211225214526750

image-20211225214552519

image-20211225214643941

# 4.6.2 矩阵的微分方程⭐️

形如

dx1dt=a11(t)x1(t)+a12(t)x2(t)++a1n(t)xn(t)+f1(t)dx2dt=a21(t)x1(t)+a22(t)x2(t)++a2n(t)xn(t)+f2(t)dxndt=an1(t)x1(t)+an2(t)x2(t)++ann(t)xn(t)+fn(t)\frac{dx_1}{dt}=a_{11}(t)x_1(t)+a_{12}(t)x_2(t)+\cdots+a_{1n}(t)x_n(t)+f_1(t) \\ \frac{dx_2}{dt}=a_{21}(t)x_1(t)+a_{22}(t)x_2(t)+\cdots+a_{2n}(t)x_n(t)+f_2(t) \\ \cdots \\ \frac{dx_n}{dt}=a_{n1}(t)x_1(t)+a_{n2}(t)x_2(t)+\cdots+a_{nn}(t)x_n(t)+f_n(t)

的线性微分方程组在引进多项式矩阵与多项式向量以后可以表示如下形式

dx(t)dt=A(t)x(t)+f(t)A(t)=[a11(t)a12(t)a1n(t)a21(t)a22(t)a2n(t)an1(t)an2(t)ann(t)]x(t)=[x1(t),x2(t),,xn(t)]Tf(t)=[f1(t),f2(t),,fn(t)]T\frac{dx(t)}{dt}=A(t)x(t)+f(t) \\ A(t)= \begin{bmatrix} a_{11}(t)&a_{12}(t)&\cdots&a_{1n}(t) \\ a_{21}(t)&a_{22}(t)&\cdots&a_{2n}(t) \\ \cdots&\cdots&\cdots&\cdots \\ a_{n1}(t)&a_{n2}(t)&\cdots&a_{nn}(t) \end{bmatrix} \\ x(t)=[x_1(t),x_2(t),\cdots,x_n(t)]^T \\ f(t)=[f_1(t),f_2(t),\cdots,f_n(t)]^T

定理

AA是一个nn阶常数矩阵,则微分方程组

dx(t)dt=Ax(t)\frac{dx(t)}{dt}=Ax(t)

满足初始条件x(t0)=x0x(t_0)=x_0的解为

x(t)=eA(tt0)x0x(t)=e^{A(t-t_0)}x_0

定理

AA是一个nn阶常数矩阵,则微分方程组

dx(t)dt=Ax(t)+f(t)\frac{dx(t)}{dt}=Ax(t)+f(t)

满足初始条件x(t0)=x0x(t_0)=x_0的解为

x(t)=eA(tt0)[x0+t0teA(tτ)f(τ)dτ]x(t)=e^{A(t-t_0)}[x_0+\int_{t_0}^t e^{A(t-\tau)}f(\tau)d\tau]

定理

A,BA,B都是nn阶常数矩阵,f(t)f(t)是一个连续的多项式向量,那么线性非齐次初值问题

dx(t)dt=Ax(t)+Bf(t),x(t0)=x0\frac{dx(t)}{dt}=Ax(t)+Bf(t),x(t_0)=x_0

的解可以由如下公式给出

x=eA(tt0)[x0+t0teA(tτ)Bf(τ)dτ]x=e^{A(t-t_0)}[x_0+\int_{t_0}^te^{A(t-\tau)}Bf(\tau)d\tau]

定义

AA是一个nn阶常数矩阵,如果对任意的t0t_0x0x_0,初值问题

{dx(t)dt=Ax(t)x(t0)=x0\begin{cases} \frac{dx(t)}{dt}=Ax(t) \\ x(t_0)=x_0 \end{cases}

的解x(t)x(t)满足limtx(t)=0\lim_{t\to \infty}x(t)=0,那么称微分方程组

dx(t)dt=Ax(t)\frac{dx(t)}{dt}=Ax(t)的解渐近稳定的

例子

A=[126103114]A=\begin{bmatrix}1&-2&6 \\ -1&0&3 \\ -1&-1&4\end{bmatrix}

求微分方程组dx(t)dt=Ax(t)\frac{dx(t)}{dt}=Ax(t)满足初始条件x(0)=[111]Tx(0)=\begin{bmatrix}1&1&1\end{bmatrix}^T的解

image-20211225220828741

例子2

image-20211225220947606

image-20211225221011742

image-20211225221034151

image-20211225221057803