0%

6. 正规方程与矩阵方程求解

正规方程与矩阵方程

6.1 正规方程

6.1.1 正规方程必有解

正规方程 $A^HAx=A^Hb$ 必有解 ,且特解为 $x_0=A^+b$ ,使 $A^HAx_0=A^Hb$

证明

推论

若矩阵方程 $AXD=B$ 有解,则有特解 $X_1=A^+BD^+$

6.1.2 Ax=b 与 $A^HAx=A^Hb$ 的关系

a. $Ax=b$ 有解判定

若 $Ax=b$ 有解(相容),则可知 $b\in R(A)=\{y=Ax\vert x\in C^n\}$ ,即 $Ax=b$ 有解 $\iff$ $b\in R(A)$

b. 无解定理

c. 高阵的解

若 $A=A_{m\times n}$ 为列满秩阵,则有 $N(A)=\{\vec{0}\}$ ,即 $AX=0$ 只有零解 $X=\vec{0}$

image-20221126230150770

若A为高阵,则 $Ax=b$ 的解为 $x_0=A^+b$ 的唯一解

image-20221126231457378

eg

image-20221126235235885

image-20221126235303011


image-20221126235324994

image-20221126235358218

6.1.3 通解公式

a. $Ax=b$ 有解情形

设 $Ay=0$ 基本解为 $Y_1,Y_2,\cdots,Y_k$ ,则 $Ay=0$ 有通解,$y=t_1Y_1+t_2Y_2+\cdots+t_kY_k$ ,可写 $N(A)=\{y\vert Ay=0\}=\{全体y=t_1Y_1+t_2Y_2+\cdots+t_kY_k\}$

且 $Ay=b$ 通解公式为 $x=x_0+(t_1Y_1+t_2Y_2+\cdots+t_kY_k)\xlongequal{\Delta}x_0+y,\forall y\in N(A)$ ,k=n-r(A)

image-20221126105400820

最小二乘解

若 $Ax=b$ 有解,则哪个解x的长度平方 $\vert x\vert^2=x^Hx=\vert x_1\vert^2+\cdots+\vert x_k\vert^2$ 最小:$x_0=A^+b$

image-20221126105946649

eg

image-20221126223035844

b. $A x=b$ 无解情形

若 $Ax=b$ 无解,则 $\vert Ax-b\vert^2>0$ ,对于 $x\in C^n$ ,如何使 $\vert Ax-b\vert$ 最小:$x_0=A^+b$

若 $\vert Ax_0-b\vert ^2$ 为 $\vert Ax-b\vert^2$ 的最小值,则 $x_0$ 为 $Ax-b$ 的一个极小二乘解,即 $\vert Ax_0-b\vert^2$ 为 $AX$ 与 $b$ 的最小平方距离

image-20221126115227049

证明

小二解公式

令 $x_0=A^+b$ ,则 $Ax=b$ 的全体小二解为 $x=x_0+Y,Y\in N(A),AY=0$

image-20221126120818294

最佳小二解

若 $Ax=b$ 无解,则 $x_0=A^+b$ 为最佳小二解

eg

image-20221126121428698


image-20221126192349185

6.1.4 其他通解公式

a. $Ax=0$ 的通解公式

image-20221126195256015

可写核空间公式 $N(A)=\{w=(I-A^+A)y\vert y\in C^n\}$

b. $Ax=b$ 的通解

$Ax=b$ 的通解公式为 $x=(A^+b)+(I_n-A^+A)y,y\in C^n$

image-20221126195417835

6.2 矩阵方程AXB=C求解

6.2.1 有解判定

a. 定理

拉直可求解线性矩阵方程 $AXB=C$ ,其中 $A=A_{m\times n},X=X_{n\times p},B=B_{p\times q}$

记 $X=(x_{ij})_{n\times p}$ ,即为 $np$ 个未知量 $x_{ij}$ 的线性方程组

根据拉直公式,则方程 $AXB=C$ 可被拉直为 $(A\otimes B^T)\vec{X}=\vec{C}$

推广:一般的线性矩阵方程 $A_1XB_1+A_2XB_2+\cdots+A_SXB_S=C$

拉直前有解则拉直后也有解

  • $AXB=C$ 有解的充要条件为 $r(A\otimes B^T\mid\vec{C})=r(A\otimes B^T)$
  • 齐次方程 $AXB=0$ 的基础解系含有 $np-r(A\otimes B^T)=np-r(A)r(B)$ 个无关向量

b. 有解与唯一解条件

image-20221129091217678

6.2.2 AXB=C求解

a. 有解情况

若矩阵方程 $AXB=C$ 有解相容,则有特解 $X_0=A^+CB^+$

  • 无解定理:若 $X_0=A^+CB^+$ ,使 $AX_0B\neq C$ ,则矩阵方程无解

  • 齐次方程 $AXB=0$ 的通解公式为:$X=Y-A^+AYBB^+$ Y为任一矩阵

  • 矩阵方程 $AXB=C$ 的通解公式为:$X=X_0+(Y-A^+AYBB^+) = A^+CB^++(Y-A^+AYBB^+)$

$AXA=A$必有解,特解为 $X_0=A^+AA^+=A^+$,通解为 $X=X_0+(Y-A^+AYAA^+)$

eg

image-20221201083059970


image-20221201084529031

b. 无解情况

若矩阵方程 $AXB=C$ 无解,矩阵 $X=(x_{ij})_{p\times q}$ 的欧式范数或模长记为 $\Vert X\Vert=\Vert X\Vert_F=\sqrt{\sum\vert x_{ij}\vert^2}=\sqrt{tr(X^HX)}$

定理1:若矩阵方程 $AXB=C$ 有解(相容),则 $X_0=A^+CB^+$ 是最小范数解,即 $AXB=C$ 的通解满足 $\Vert X\Vert^2\ge \Vert X_0\Vert^2(最小模长)$

定理2 :若矩阵方程 $AXB=C$ 无解(不相容),则 $X_0=A^+CB^+$ 是最佳最小二乘解,即任一 $X$ 满足 $\Vert AXB-C\Vert^2\ge \Vert AX_0B-C\Vert^2(最小误差)$

6.2.3 AX+XB=C(里亚普诺夫)

$AX+XB=C$ ,其中 $A\in C^{m\times m}.B\in C^{n\times n},X\in C^{m\times n}$

  1. 使用拉直公式

    $AX+XB=C\iff (AXI_n+I_mXB)=C\iff(\overrightarrow{AXI_n+I_mXB})=\vec{C}\\\iff(A\otimes I_n+I_m\otimes B^T)\vec{X}=\vec{C}$

  2. 有解的充要条件为 $r(A\otimes I_n+I_m\otimes B^T\mid\vec{C})=r(A\otimes I_n+I_m\otimes B^T)$

  3. 唯一解充要条件 :$\vert A\otimes I_n+I_m\otimes B^T\vert\neq 0$

    根据特征值计算 $\vert A\otimes I_n+I_m\otimes B^T\vert$

定理1

  • $AX+XB=C$ 有唯一解 $\iff \vert AX+XB\vert \neq 0$ $\iff A\otimes I_n+ I_m\otimes B^T$ 可逆 $\iff A$ 和 $(-B)$ 无公共特根
  • $AX-XB=C$ 有唯一解 $\iff \vert AX-XB\vert \neq 0$ $\iff A\otimes I_n- I_m\otimes B^T$ 可逆 $\iff A$ 和 $B$ 无公共特根

若 $A=A_{m\times m}$ 的特根为 $\lambda_1,\lambda_2,\cdots,\lambda_m$ ; $B=B_{n\times n}$ 的特根为 $t_1,t_2,\cdots,t_n$

则 $A\otimes I_n+I_m\otimes B^T$ 的 $mn$ 个特根为 $\{\lambda_k+t_j\}$ ;$A\otimes I_n-I_m\otimes B^T$ 的 $mn$ 个特征值 $\{\lambda_k-t_j\}$ $(k=1,2,\cdots,m,j=1,2,\cdots,n)$

因为 $B$ 与 $B^T$ 有相同的特征值

$\Rightarrow$ $\vert A\otimes I_n\pm I_m\otimes B^T\vert$ 的 $mn$ 个特征值为 $(\lambda_k\pm t_j)$

$\Rightarrow A\otimes I_n\pm I_m\otimes B$ 不可逆的条件为 无零根 即 $\{\lambda_k\pm t_j\neq 0\}$

$\iff A$ 与 $(\pm B)$ 没有公共特征值

定理2: 若 A 和 B 的特根都有负实部,则 $AX+XB=C$ 有唯一解

  • 若特根都在左半平面,则 $A$ 与 $-B$ 不会有公共特根

定理3 :若 $A$ 和 $B$ 分别为 $m$ 阶和 $n$ 阶方阵,若 $A$ 和 $B$ 没有公共特征值,则 $\left[\begin{matrix}A&C\\0&B\end{matrix}\right]$ 与 $\left[\begin{matrix}A&0\\0&B\end{matrix}\right]$ 相似

  • image-20221129095042378

定理4 :若 $A \in C^{m\times m},B\in C^{n\times n},F\in C^{m\times n}$ ,若 $A$ 和 $B$ 没有公共特根,则 $\left[\begin{matrix}A&0\\F&B\end{matrix}\right]$ 与 $\left[\begin{matrix}A&0\\0&B\end{matrix}\right]$ 相似

  • 证明:令 $P=\left(\begin{matrix}I&0\\X&I\end{matrix}\right),P^{-1}=\left(\begin{matrix}I&0\-X&I\end{matrix}\right)$ ,则有许尔公式,$P\left(\begin{matrix}A&0\\F&B\end{matrix}\right)P^{-1}=\left(\begin{matrix}A&0\\XA-BX+F&B\end{matrix}\right)$ ,若为对角阵,则 $AX-BX=-F\Rightarrow AX-BX=F$

a. 求解矩阵方程

image-20221130203556960

A的特征值为 -2,3;B的特征值为1,1。矩阵方程拉直为 $AX+XB=C\iff(A\otimes I_2+I_2\otimes B^T)\vec{X}=\vec{C}$ 。而 $A$ 与 $-B$ 没有公共特征值,则拉直后方程具有唯一解。

image-20221130204119310


image-20221129100721429

$\lambda(A)=\{2,2\},\lambda(B)=\{1,2\}$ ,故A和B有公共特征值,故解不唯一,

$AX-XB=C$ 可拉直为 $(A\otimes I_{2\times 2}-I_{2\times 2}\otimes B^T)\vec{X}=\vec{C}$ ,有 $X=\left[\begin{matrix}x_1&x_2\\x_3&x_4\end{matrix}\right],\vec{X}=\left(\begin{matrix}x_1\\x_2\\x_3\\x_4\end{matrix}\right)$

$(A\otimes I_{2\times 2}-I_{2\times 2}\otimes B^T)\vec{X}=\left(\begin{matrix}-1&-1&-1&0\\2&2&0&-1\\0&0&-1&-1\\0&0&2&2\end{matrix}\right)\left(\begin{matrix}x_1\\x_2\\x_3\\x_4\end{matrix}\right)=\left(\begin{matrix}0\-2\\2\-4\end{matrix}\right) \iff GX=b$ 由于 $r(G\vert b)=r(G)=3$ ,故方程有解,其解为 $(G\vert b)\rightarrow \left(\begin{array}{c:c} \begin{matrix} 1&1&0&0\\ 0&0&1&0\\0&0&0&1\\0&0&0&0 \end{matrix}& \begin{matrix} -4\\ 4\-6\\0 \end{matrix} \end{array}\right)$

故 G 的解为 $X=\left(\begin{matrix}-4\\0\\4\\6\end{matrix}\right)+t\left(\begin{matrix}1\-1\\0\\0\end{matrix}\right)$ 原矩阵方程的解为 $X=\left(\begin{matrix}-4&0\\4&6 \end{matrix}\right)+t\left(\begin{matrix}1&-1\\0&0\end{matrix}\right)$


b. 求解一般的矩阵方程 $A_1XB_1+\cdots+A_sXB_s=C$

image-20221129101037295

image-20221129101057687


c. 求解 $AX-XA=\mu X$

  1. 将方程拉直为 $(A\otimes I_n-I_n\otimes A^T)\vec{X}=\mu \vec{X}$

  2. 记 $G=A\otimes I_n-I_n\otimes A^T$ 原方程化为 $G\vec{X}=\mu \vec{X}\Rightarrow (G-\mu I)\vec{X}=0$

    有非零解条件为 $\vert G-\mu I\vert=0$ ,即 $\mu$ 是 G的特征值,而 $\lambda(G)=\{\lambda_r-\lambda_s\}$

    故 有非零解条件为:$\exists r,s$ ,使 $\mu=\lambda_r-\lambda_s,1\le r,s\le n$

image-20221130220205304

$\lambda(A)=\{1,3\}$,$G=A\otimes I_2-I_2\otimes A^T=\left(\begin{matrix}0&-2&0&0\\0&-2&0&0\\2&0&2&-2\\0&2&0&0\end{matrix}\right)$ $\lambda(G)=\{\lambda(A)_i-\lambda(A)_j\}=\{2,0,0,-2\}$ ,故 $\exist \lambda(G)=\mu=-2$ ,矩阵方程有非零解

$X=\left(\begin{matrix}x_1&x_2\\x_3&x_4\end{matrix}\right)$ ,$\vec{X}=\left(\begin{matrix}x_1\\x_2\\x_3\\x_4\end{matrix}\right)$ ,解 $G\vec{X}=0$ $\Rightarrow \vec{X}=t_1\left(\begin{matrix}-1\\0\end{matrix}\right)+t_2\left(\begin{matrix}1\\0\end{matrix}\right)=\left(\begin{matrix}-t_1&t_2\\0&0\end{matrix}\right)$ ,故原矩阵方程的解 $X=\left(\begin{matrix}-t_1\\t_2\\0\\0\end{matrix}\right)$


image-20221129101322691


image-20221130231046004

由拉直公式 $\frac{dX}{dt}=AX+XB=(A\otimes I_n+I_m\otimes B^T)\vec{X}=\vec{C}$

-------------本文结束-------------