======More Gaussian Elimination======
LAFF Week 7 Notes
----
本章的重要内容:
* 置换矩阵的概念
* 使用置换矩阵处理 $LU$ 分解中可能存在的对角线元素为 0 的问题
* 非奇异矩阵与逆矩阵
* 逆矩阵的概念及其性质
====When Gaussian Elimination Works====
先来回顾一下 $LU$ 分解中 关于 $Ux = z$ 求解的循环部分,我们发现其中有这么一个过程:
\\
$$\beta_{21} = \beta_{21} / v_{11}$$
\\
这一部分代表了对 ''multiplier'' 的计算。如果仔细观察,我们注意到如果 $v_{11}=0$,也就是主对角线元素为 $0$ 的时候,该算法就无法进行下去了。
\\
\\
那么反过来想,如果主对角线所有元素都不为 $0$,那么该算法是有解的。鉴于在 $Lz = b$ 的算法中不包含除法,因此 $Ux=z$ 有解也就意味着整个 $Ax=b$ 有解。那么这里有一个问题:$Ax=b$ 的解是唯一的吗?
\\
\\
我们试着通过反证法来证明一下:
/* part 1*/
假设:Ax = b 有两个解 u 和 v
那么根据 Ax = b,有
Au = b
Ax = b
因为 A 是 矩阵(线性变换)
因此 A (u - v) = b => Au - Av = b - b = 0
令 u - v = w,即可得 Aw = 0
通过 LU 分解, A = LU
那么 Aw = (LU)w = L(Uw) = 0
来看一下 $Lz=0$ 意味着什么:
\\
{{ math:linear_algebra:laff:7_1-min.png?400 |}}
\\
根据上图,我们发现如果要 $Lz = 0$,那么:
- $\zeta_0 = 0$
- $\lambda_{10}\zeta_0+1*\zeta_1 = 0$
以此类推,我们可以得出 $z$ 必须为 $0$ 的结论。
\\
\\
再来看看通过 $z=0$,也就是 $Uw=0$ 意味着什么:
\\
{{ math:linear_algebra:laff:7_2-min.png?400 |}}
\\
根据之前的假设,我们假设 $Ux=z$ 有解,也就是图中所有的 $v$ 都不为 0,那么有:
- $v_{n-1,n-1}w_{n-1} = 0$,因为所有 $v$ 不为 0,那么 $w_{n-1} = 0$
- $v_{n-2,n-2}w_{n-2}+v_{n-1,n-1}w_{n-1} = 0$,也就是 $w_{n-2} = 0$
依次类推,可以得出 $w=0$ 的结论,也就是 $u=v$;因此可以推断出只要通 $LU$ 分解求解中,如果主对角线均不为 0 , $Ax=b$ **必定有且只有一个唯一解**。
===主对角线有 0 时的问题===
当 $U$ 的主对角线上有 0 的时候,麻烦就来了。根据 $Ux=z$ 的算法,我们不可避免的遭遇到除 0 的情况。该情况会导致算法无法继续进行;但问题在于,有时算法的无法进行并不代表我们无法得出解。下面是一个很明显的例子:
\\
\\
$$
\displaystyle \left(
\begin{array}{c c}
0 & 1 \\
1 & 0
\end{array} \right)
\left(
\begin{array}{c}
x_0\\
x_1
\end{array} \right)
=
\left(
\begin{array}{c}
\beta_0\\
\beta_1
\end{array} \right)
$$
\\
上式很显然有解,但我们并不能通过之前学习的算法来求解。因此,我们需要引进**置换矩阵**的概念来解决这个问题。
===置换矩阵 Permutations Matrix===
置换矩阵(//Permutations Matrix//)可以简要的概述为每行每列有且只有一个 1,其他元素都为 0 的方阵;比如下图的矩阵就是一个置换矩阵:
\\
\\
$$\left(\begin{array}{c}0&1&0\\0&0&1\\1&0&0\end{array}\right)$$
\\
\\
**置换**这个名字非常形象。以上面的置换矩阵为例,来看一个矩阵的乘法:
\\
\\
$$
\left(\begin{array}{c}0&1&0\\0&0&1\\1&0&0\end{array}\right)
\left(\begin{array}{c}-2&1&2\\3&2&1\\-1&0&-3\end{array}\right)
= \left(\begin{array}{c}3&2&1\\-1&0&-3\\-2&1&2\end{array}\right)
$$
\\
\\
这个例子有趣的地方在于,如果将置换矩阵改为单位矩阵 $I$,再对两个乘法进行对比,我们会发现其实置换矩阵改变的是目标矩阵**行的排序**,而该排序正好对应置换矩阵中行之余单位矩阵中的行的位置:
\\
\\
因为 Ax = b
所以 PAx = Pb //保持相等
整个完整的算法如下图所示:
\\
\\
{{ math:linear_algebra:laff:752_summaryc-min.png?600 |}}
\\
\\
跟之前的 LU 分解相比,上图唯一的变化就是先求出 $p$,然后使用 $p$ 更新 $b$。接着就是我们熟悉的两步: $Lz=b$ 与 $Ux = z$ 了。
\\
\\
当然,我们还会遇到一种情况:矩阵中根本就找不到合适的一行与当前含 0 行进行替换。这象征着 $Ax=b$ 无解或者有无限多解,该内容将在第八章中详述。
====Inverse Matrix====
在高中我们都学过反函数。反函数可以理解为一个映射的逆映射,也就是**还原**当前映射。令原函数为 $f$,反函数为 $f^{-1}$,则下方数学表达式表达了如下关系:
\\
$$
f^{-1}(f(x)) = x
$$
\\
很显然,原函数中的自变量和因变量必须要**一一对应**,才能完成这样的“还原”。
\\
\\
下面再来看看矩阵。根据之前的知识,我们知道矩阵也是映射的一种。与反函数相似,如果存在这么一个矩阵,可以**还原**某个矩阵表示的映射,那么我们就称这个矩阵是原矩阵的**逆矩阵**。而原矩阵,我们也称为**非奇异矩阵**(//Nonsingular Matrix//)。
\\
\\
当然,相较于 1D 函数,矩阵是向量的函数,映射前与映射后维度可能发生变化 $f: \mathbb{R}^n \to \mathbb{R}^m)$。但因为逆矩阵必须要求映射的定义域与值域有着一一对应的关系,那么只有当 $m=n$,也就是原矩阵是**方阵**的时候,才有可能存在逆矩阵。
\\
\\
===逆矩阵的基本性质===
- 逆矩阵也是线性变换
- $AA^{-1} = I$
- $(aB)^{-1} = \frac{1}{a}B^{-1} $
- $(AB)^{-1} = B^{-1}A^{-1}$
- $(ABC)^{-1} = C^{-1}B^{-1}A^{-1}$
- $(A^T)^{-1} = (A^{-1})^T$
===特殊矩阵的逆矩阵===
详情如下图:
\\
\\
{{ math:linear_algebra:laff:752_summaryd-min.png?600 |}}
\\
\\
当然,不管是什么矩阵,求其逆矩阵的主要方法都是通过 $AA^{-1} = I$ 这个关系来求。进一步的说,我们可以将 $I$ 按列划分,按列得出关系,一列一列的求逆矩阵。(例子待添加)FIXME
====参考资料====
* [[https://www.youtube.com/watch?time_continue=325&v=5GSNGUXTozQ|带置换矩阵的 LU 分解手动计算过程]]
* [[http://www.cs.utexas.edu/users/flame/LAFF/Notes/Week7.pdf#page=21|本章 pdf]]
* 本章所有非 svg 图片来源于 LAFF 课件