2. 内积空间

joker ... 2022-4-7 大约 12 分钟

# 2. 内积空间

# 2.0 考试重点+例题

https://www.bilibili.com/read/cv3995642
1

重点内容

  • 内积空间的判定/证明

  • 柯西-许瓦兹不等式

  • 施密特正交化(求标准正交基)

  • 正交变换的判定/证明

  • 方程组的最小二乘解

  • 复数矩阵的对角化

    一些其他概念/定义:对角行矩阵,实对称矩阵,实反对称矩阵,厄米特矩阵,反厄米特矩阵,正交矩阵,酉矩阵。

# 2.0.1 求矩阵的特征值和矩阵的迹

这个就不举例了

一个n×nn\times n矩阵AA中主对角线(从左上方至右下方的对角线)上各元素的总和被称为AA的迹trA=i=1naii=λ1++λntrA=\sum_{i=1}^na_{ii}=\lambda_1+\cdots+\lambda_n

# 2.0.2 矩阵的秩的关系

r(A)+r(B)nr(AB)min(r(A),r(B))r(A)+r(B)-n\le r(A|B)\le min(r(A),r(B))

# 2.0.3 求最小二乘解

α1=[1234],α2=[5611],b=[1000]\alpha_1=\begin{bmatrix} 1\\ 2\\ 3\\ 4 \end{bmatrix},\alpha_2=\begin{bmatrix}5 \\ 6 \\ 1 \\ 1\end{bmatrix}, b=\begin{bmatrix}1 \\ 0\\ 0\\ 0\end{bmatrix}

bbL(α1,α2)L(\alpha_1,\alpha_2)的最小距离

ATAx=XTB[12345611][15263141][x1x2]=[12345611][1000][30242463][x1x2]=[15]x1=19438,x2=21219Axb2A^TAx=X^TB \\ \begin{bmatrix}1&2&3&4 \\ 5&6&1&1\end{bmatrix}\begin{bmatrix}1&5 \\ 2&6 \\ 3&1 \\ 4&1\end{bmatrix} \begin{bmatrix}x_1\\ x_2\end{bmatrix}=\begin{bmatrix}1&2&3&4 \\ 5&6&1&1\end{bmatrix}\begin{bmatrix}1 \\ 0\\ 0\\ 0\end{bmatrix} \\ \begin{bmatrix}30&24 \\ 24&63\end{bmatrix}\begin{bmatrix}x_1\\ x_2\end{bmatrix}=\begin{bmatrix}1\\ 5\end{bmatrix} \\ \to x_1=\frac{-19}{438},x_2=\frac{21}{219} \\ ||Ax-b||_2

# 2.0.4 酉矩阵的特征值

λi2=1,AAH=E|\lambda_i|^2=1,AA^H=E

# 2.1 内积空间的相关概念

欧式空间与酉空间通称为内积空间

# 2.1.1 欧式空间⭐️

VV是实数域RR上的nn维空间,对于VV中的任意两个向量α,β\alpha,\beta按照某一确定法则对应着一个实数,这个实数称为α\alphaβ\beta的内积。记为(α,β)(\alpha,\beta),并且要求内积满足下列运算条件:

  • (α,β)=(β,α)(\alpha,\beta)=(\beta,\alpha)
  • (kα,β)=k(α,β)(k\alpha,\beta)=k(\alpha,\beta)
  • (α+β,r)=(α,r)+(β,r)(\alpha+\beta,r)=(\alpha,r)+(\beta,r)
  • (α,α)0(\alpha,\alpha)\ge 0,当且仅当α=0\alpha=0(α,α)=0(\alpha,\alpha)=0

这里α,β,r\alpha,\beta,rVV中的任意向量,kk为任意实数,这样我们称带有这样内积的nn维线性空间VV为欧式空间

例子

RnR^n中,对于

α=(x1,x2,,xn)T,β=(y1,y2,,yn)T\alpha=(x_1,x_2,\cdots,x_n)^T,\beta=(y_1,y_2,\cdots,y_n)^T

若规定(α,β)=αTβ=x1y1+x2y2++xnyn(\alpha,\beta)=\alpha^T\beta=x_1y_1+x_2y_2+\cdots+x_ny_n

容易验证是RnR^n上的一个内积,从而RnR^n成为一个欧式空间

# 2.1.2 酉空间⭐️

VV是复数域CC上的nn维空间,对于VV中的任意两个向量α,β\alpha,\beta按照某一确定法则对应着一个实数,这个实数称为α\alphaβ\beta的内积。记为(α,β)(\alpha,\beta),并且要求内积满足下列运算条件:

  • (α,β)=(β,α)(\alpha,\beta)=(\overline{\beta,\alpha})
  • (kα,β)=k(α,β)(k\alpha,\beta)=k(\alpha,\beta)
  • (α+β,r)=(α,r)+(β,r)(\alpha+\beta,r)=(\alpha,r)+(\beta,r)
  • (α,α)0(\alpha,\alpha)\ge 0,当且仅当α=0\alpha=0(α,α)=0(\alpha,\alpha)=0

定义

VVnn维酉空间,{αi}\{\alpha_i\}为其一组基底,对于VV中的任意两个向量α=i=1nxiαi,β=j=1nyjαj\alpha=\sum_{i=1}^nx_i\alpha_i,\beta=\sum_{j=1}^ny_j\alpha_j

那么α\alphaβ\beta的内积为

(α,β)=(i=1nxiαi,j=1nyjαj)=i,j=1nxiyj(αi,αj)(\alpha,\beta)=(\sum_{i=1}^nx_i\alpha_i,\sum_{j=1}^ny_j\alpha_j)=\sum_{i,j=1}^n x_i\overline{y_j}(\alpha_i,\alpha_j)

酉空间CnC^n内积定义可以简写为

(X,Y)=XYH(X,Y)=XY^H

酉空间上内积的定义:X和Y的共轭转置相乘

# 2.1.3 厄米特矩阵⭐️

前期数学准备

ACn×nA\in C^{n\times n},用A\overline{A}表示以AA中元素的共轭复数为元素组成的矩阵,记为AH=(A)TA^H=(\overline{A})^T

AHA^HAA复共轭转置矩阵

性质如下

  • AH=(AT)A^H=(\overline{A^T})
  • (A+B)H=AH+BH(A+B)^H=A^H+B^H
  • (kA)H=kAH(kA)^H=\overline{k}A^H
  • (AB)H=BHAH(AB)^H=B^HA^H
  • (Ak)H=(AH)k(A^k)H=(A^H)^k
  • (AH)H=A(A^H)^H=A
  • A=A|\overline{A}|=|\overline{A}|
  • (AH)1=(A1)H(A^H)^{-1}=(A^{-1})^H,如果AA可逆

# 1) 厄米特矩阵和反厄米特矩阵

如果ACn×nA\in C^{n\times n},如果 AH=AA^H=A,那么我们称A为Hermite(厄米特)矩阵

如果AH=AA^H=-A,那么称AA反Hermite(厄米特)矩阵

Hermite矩阵如下图所示

[a1b12b1nb12a2b2nb1nb2nan]\begin{bmatrix} a_1&b_{12}&\cdots&b_{1n} \\ \overline{b_{12}}&a_2&\cdots&b_{2n} \\ \vdots&\vdots&\ddots&\vdots \\ \overline{b_{1n}}&\overline{b_{2n}}&\cdots &a_n \end{bmatrix}

举例,判断下列矩阵是HH-矩阵

1.[4i2+i4+2i2+ii14+2i12i]2.[61+2i3i12i91i3i1+i7]1.\begin{bmatrix}4i&2+i&4+2i\\ -2+i&i&1\\ -4+2i&-1 &-2i\end{bmatrix} \\ 2. \begin{bmatrix}6&1+2i&3i\\ 1-2i&9&1-i\\ -3i&1+i&-7\end{bmatrix}

# 2) 厄米特矩阵相关性质

任意ACn×nA\in C^{n\times n}都可以表示为一个HH-矩阵和一个反HH-阵之和

A=A+AH2+AAH2A=\frac{A+A^H}{2}+\frac{A-A^H}{2}

# 2.1.4 度量概念

VV为欧式空间,向量αV\alpha\in V的长度定义为非负数α=(α,α)||\alpha||=\sqrt{(\alpha,\alpha)}

例子

α=(1+2i,i,3,2+2i)\alpha=(1+2i,-i,3,2+\sqrt{2}i)

α=5+1+9+6=21||\alpha||=\sqrt{5+1+9+6}=\sqrt{21}

定义

VV为欧式空间,两个非零向量(α,β)(\alpha,\beta)的夹角定义为

<α,β>=arcos(α,β)αβ<\alpha,\beta>=arcos\frac{(\alpha,\beta)}{||\alpha||||\beta||}

于是有

0<α,β>π0\le<\alpha,\beta>\le \pi

# 2.1.5 柯西许瓦兹不等式⭐️

VV是内积空间,α,β\alpha,\betaVV中任两向量,则有

(α,β)αβ|(\alpha,\beta)|\le ||\alpha||||\beta||

等号当且仅当α,β\alpha,\beta线性相关时成立

向量长度具有如下性质

  • α0||\alpha||\ge 0,当且仅当α=0\alpha=0时,α=0||\alpha||=0
  • kα=kα,kC||k\alpha||=|k|||\alpha||,k\in C
  • α+βα+β||\alpha+\beta||\le ||\alpha||+||\beta||
  • (α,β)αβ|(\alpha,\beta)|\le ||\alpha||||\beta||

# 2.2 正交基和子空间的正交关系

在空间VV中,如果(α,β)=0(\alpha,\beta)=0,则称α\alphaβ\beta正交,记为αβ\alpha\perp \beta

长度为1的向量称为单位向量,对于任何一个非零的向量α\alpha,向量αα\frac{\alpha}{||\alpha||}总是单位向量,称此过程为单位化

# 2.2.1 正交基相关概念

{αi}\{\alpha_i\}为一组不含有零向量的向量组,如果{αi}\{\alpha_i\}内的任意两个向量彼此正交,则称其为正交向量组

如果一个正交向量组中任何一个向量组都是单位向量,则称此向量组为标准正交向量组

nn维内积空间中,由nn个正交向量组组成的基底称为正交基底

nn个标准的正交向量组成的基底称为标准正交基底

定理

向量组{αi}\{\alpha_i\}为正交向量组的充分必要条件是

(αi,αj)=0,ij(\alpha_i,\alpha_j)=0,i\ne j

向量组{αi}\{\alpha_i\}为标准正交向量组的充分必要条件是

(αi,αj)=δij={1i=j0ij(\alpha_i,\alpha_j)=\delta_{ij}=\begin{cases}1&i=j\\ 0&i\ne j\end{cases}

# 2.2.2 Schmidt正交化(2步)⭐️

千万别把Smith正交化和后面的Smith标准型搞混了

正交向量组合向量组的关系

正交的向量组是一个线性无关的向量组,反之,由一个线性无关的向量组出发,可以构造一个正交向量组。甚至是一个标准正交向量组

怎么构造呢????---》这就是Schmidt正交化

Schmidt正交化与单位化过程:

{α1,α2,,αr}\{\alpha_1,\alpha_2,\cdots,\alpha_r\}nn维内积空间VVrr个线性无关的向量,利用这rr个线性无关的向量,利用这rr个向量可以构造与之等价的一个标准正交向量组,而且span{α1,α2,,αr}span\{\alpha_1,\alpha_2,\cdots,\alpha_r\}的一个标准正交基

# 1) 正交化

β1=α1β2=α2(α2,β1)(β1,β1)β1βr=αr(αr,β1)(β1,β1)β1(αr,βr1)(βr1,βr1)βr1\beta_1=\alpha_1 \\ \beta_2=\alpha_2-\frac{(\alpha_2,\beta_1)}{(\beta_1,\beta_1)}\beta_1 \\ \vdots \\ \beta_r=\alpha_r-\frac{(\alpha_r,\beta_1)}{(\beta_1,\beta_1)}\beta_1-\cdots-\frac{(\alpha_r,\beta_{r-1})}{(\beta_{r-1},\beta_{r-1})}\beta_{r-1}

# 2) 单位化

η1=β1β1,η2=β2β2,,ηr=βrβr\eta_1=\frac{\beta_1}{||\beta_1||},\eta_2=\frac{\beta_2}{||\beta_2||},\cdots,\eta_r=\frac{\beta_r}{||\beta_r|}

显然,{η1,η2,,ηr}\{\eta_1,\eta_2,\cdots,\eta_r\}是一组标准的正交向量组

例子

image-20211221172216505

image-20211221172308839

# 2.3 正交(酉)变换⭐️

# 2.3.1 酉矩阵和正交矩阵

酉矩阵

AA为一个nn阶复矩阵,如果满足AHA=AAH=IA^HA=AA^H=I

则称AA为酉矩阵,一般记作AUn×nA\in U^{n\times n}

AA是酉矩阵的充要条件是AA的每个特征值λi\lambda_i的模λi=1|\lambda_i|=1

正交矩阵

AA为一个nn阶实矩阵,如果其满足ATA=AAT=IA^TA=AA^T=I

则称AA为正交矩阵,一般记作AEn×nA\in E^{n\times n}

例子

1.[0222210002222]2.[231323232313132323]3.[cosθsinθsinθcosθ]4.[cosθ0isinθ010isinθ0cosθ]1. \begin{bmatrix}0&\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\\ 1&0&0\\ 0&-\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\end{bmatrix} \\ 2.\begin{bmatrix}-\frac{2}{3}&-\frac{1}{3}&\frac{2}{3}\\ \frac{2}{3}&-\frac{2}{3}&\frac{1}{3}\\ \frac{1}{3}&\frac{2}{3}&\frac{2}{3}\end{bmatrix} \\ 3. \begin{bmatrix}cos\theta&-sin\theta\\ sin\theta&cos\theta\end{bmatrix} \\ 4. \begin{bmatrix}-cos\theta&0&isin\theta\\ 0&1&0\\ i\sin\theta&0&-\cos\theta\end{bmatrix}

前三个都是正交矩阵

第四个为酉矩阵

总结

AE3×3A\in E^{3\times 3},那么

T1AT=[a000cosθsinθ0sinθcosθ]T^{-1}AT=\begin{bmatrix}a&0&0\\ 0&\cos\theta&-\sin\theta\\ 0&\sin\theta&\cos\theta\end{bmatrix}

这里当A=1|A|=1时,a=1a=1,当A=1|A|=-1时,a=1a=1

性质

image-20211221173946578

定理

ACn×nA\in C^{n\times n}AA是一个酉矩阵(正交矩阵)的充分必要条件为AAnn个列(或行)向量组是标准正交向量组

# 2.3.2 酉相似

设给定A,BA,B,若果存在一个酉矩阵UCU\in C,使得U1AU=UHAU=BU^{-1}AU=U^HAU=B,我们称AABB酉相似

如果UU可以取为实数,那我们就说AABB实正交相似。

如果AA与一个对角矩阵酉相似,我们称AA可以酉对角化。

如果AA与一个对角矩阵实正交相似,我们称AA可以实正交对角化

# 2.3.3 正交变换的判定

TT是内积空间VV的线性变换,若TT能保持VV中向量内积不变,即对任何(α,β)V(\alpha,\beta)\in V,都有

(Tα,Tβ)=(α,β)(T\alpha,T\beta)=(\alpha,\beta)

则线性变换TT称为VV的一个正交变换。(即变换后,内积不变)

# 2.4 正规矩阵

# 2.4.1 正规矩阵概念

ACn×nA\in C^{n\times n},且AHA=AAHA^HA=AA^H,那么我们称矩阵AA为一个正规矩阵

ARn×nA\in R^{n\times n},且AAT=ATAAA^T=A^TA,那么我们称矩阵AA为一个实正规矩阵

例子

[1111]\begin{bmatrix}1&-1\\ 1&1\end{bmatrix}为实正规矩阵

HH-矩阵,反HH-矩阵,正交矩阵,酉矩阵,对角矩阵都是正规矩阵

# 2.4.2 正规矩阵性质

  • AA是一个正规矩阵,则与AA酉相似的矩阵一定是正规矩阵
  • AA是一个正规矩阵且又是三角矩阵,则AA必为对角矩阵

AA是一个正规矩阵

  • A是厄米特的充要条件是:AA的特征值全为实数
  • AA是反厄米特矩阵的充要条件是:A的特征值为零或纯虚数
  • A是酉矩阵的充要条件是AA的特征值的模长为1

# 2.4.3 正规矩阵的结构定理

根据第三章的舒尔定理,可以证明

矩阵ACn×nA\in C^{n\times n},为正规矩阵的充要条件是:存在酉矩阵QQ,使得AA酉相似与对角形矩阵

QHAQ=Q1AQ=[λ1λ2λn]Q^HAQ=Q^{-1}AQ=\begin{bmatrix}\lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\end{bmatrix}

其中λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_nAA的特征值

推论,可以出判断题

  • n阶正规矩阵有n个线性无关的特征向量(必要不充分)
  • 可对角化的矩阵不一定可酉对角化
  • 正规矩阵属于不同特征值的特征向量彼此正交

image-20211221222421144

image-20211221222459356

image-20211221222526964

image-20211221222555561

# 2.5 最小二乘⭐️

根据我们在本科学的知识点,求Ax=bAx=b

r(A)=r(Ab)r(A)=r(A|b)时,我们才有解??

但是大多数实际情况,是无解的情况,

我们想求出一个最靠近答案的解??

使得Axb2||Ax-b||_2最小

下面直接给答案

ATAx=ATBA^TAx=A^TB就是最小二乘解

例子

{x1+x2=1x1+x3=2x1+x2+x3=0x1+2x2x3=1\begin{cases} x_1+x_2=1 \\ x_1+x_3=2 \\ x_1+x_2+x_3=0 \\ x_1+2x_2-x_3=-1\end{cases}

解如下

A=[110101111121],AT=[111110120111],B=[1201]soATAX=[441461113][x1x2x3]=[213]=ATBx1=176,x2=136,x3=46A=\begin{bmatrix}1&1&0 \\ 1&0&1 \\ 1&1&1 \\ 1&2&-1\end{bmatrix},A^T= \begin{bmatrix}1&1&1&1 \\ 1&0&1&2 \\ 0&1&1&-1\end{bmatrix},B= \begin{bmatrix}1 \\ 2 \\ 0\\ -1\end{bmatrix} \\ so \quad A^TAX=\begin{bmatrix}4&4&1 \\ 4&6&-1 \\ 1&-1&3\end{bmatrix} \begin{bmatrix}x_1\\ x_2 \\x_3 \end{bmatrix}= \begin{bmatrix}2\\ -1 \\3\end{bmatrix}=A^TB \\ x_1=\frac{17}{6},x_2=-\frac{13}{6},x_3=-\frac{4}{6}

# 2.6 正交投影变换(书上没有-不用看)

# 2.6.1 幂等矩阵

ACn×nA\in C^{n\times n},如果AA满足A2=AA^2=A则称AA是一个幂等矩阵

性质

  • AT,AH,IA,IAT,IAHA^T,A^H,I-A,I-A^T,I-A^H都是幂等矩阵

  • A(IA)=(IA)A=0A(I-A)=(I-A)A=0

  • N(A)=R(IA)N(A)=R(I-A)

  • Ax=xAx=x的充分必要条件是xR(A)x\in R(A)

  • Cn=R(A)N(A)C^n=R(A)\oplus N(A),x=Ax+(xAx)x=Ax+(x-Ax)

    R(A)指的是A的值域,N(A)是其零空间

  • N(A)=R(IA)N(A)=R(I-A)

    如果xN(A)x\in N(A),则有Ax=0Ax=0

    可知xAx=x0=xx-Ax=x-0=x,整理为(IA)x=x(I-A)x=x

    因此xR(IA)x\in R(I-A),即可得N(A)R(IA)N(A)\subseteq R(I-A)

幂等矩阵的结构定理

AA是一个秩为rrnn阶矩阵,那么AA为一个幂等矩阵的充分必要条件是存在PCnn×nP\in C^{n\times n}_n使得

P1AP=[Ir000]P^{-1}AP=\begin{bmatrix}I_r&0\\ 0&0\end{bmatrix}

AA是一个nn阶幂等矩阵,则有

Tr(A)=rank(A)Tr(A)=rank(A)

幂矩阵与投影变换

S,TS,Tnn维酉空间VV的两个子空间,且V=STV=S\oplus T,则对于VV中任一向量α\alpha均可唯一的表示为

α=x+y,xS,yT\alpha=x+y,x\in S,y\in T

则称xxα\alpha沿TTSS的投影,yyα\alpha沿SSTT的投影

由上式确定的线性变换τ:VSVτ(α)=x\tau:V\to S\subseteq V\\ \tau(\alpha)=x

称为VV沿TTSS的投影变换

定理

AA是一个nn阶幂等矩阵,则线性变换τ(α)=Aα,αCn\tau(\alpha)=A\alpha,\forall \alpha\in C^n

CnC^n沿着N(A)N(A)R(A)R(A)的投影变换

提示:Cn=R(A)N(A),α=Aα+(αAα)C^n=R(A)\oplus N(A),\alpha=A\alpha+(\alpha-A\alpha),其中AαR(A),(αAα)N(A)A\alpha\in R(A),(\alpha-A\alpha)\in N(A)

定理

τ\taunn维酉空间VV上的线性变换,则下列命题等价

  • τ\tauVV上的投影变换
  • τ2=τ\tau ^2=\tau
  • τ\tau的矩阵表示AA满足A2=AA^2=A

# 2.6.2 概念

# 正交补

# 正交投影变换

AA是一个nn阶幂等的HH-矩阵,则线性变换

σ(α)=Aα,αCn\sigma(\alpha)=A\alpha,\forall \alpha \in C^n

CnC^nR(A)R(A)的正交投影变换

正交投影是指像空间U和零空间W相互正交子空间的投影。

# 2.6.3 总结

为什么投影变换和正交投影变换的区别是幂等矩阵是否是Hermite矩阵?

投影变换的充要条件是A^2=A, 正交投影变换的充要条件是A^2=A,且A是Hermite矩阵。

# 2.7 厄米特二次型