线性代数复习笔记
以清华大学林润亮老师的ppt为基础进行整理
主要用来进行知识点回顾和快速复习
1 向量及其运算
线性代数
线性代数是建立在向量的 加法
和 数乘
这两种所谓 线性运算
上的
两向量相等
两个向量相等 $\iff$ 两者长度相等, 方向相同
向量运算性质
向量加法和数乘的运算性质: 交结零负一乘分分
分别是: 向量加法交换律, 向量加法结合律, 零向量, 反向量, 1 数乘向量, 两个数乘数乘向量, 两个数加数乘向量, 一个数数乘两个向量
列向量
$$ \vec{a}= \begin{pmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix} $$
其中 $a_i$ 为向量 $\vec{a}$ 的第 $i$ 个分量
向量的线性组合
设 $\vec v_1,\cdots,\vec v_m$ 为 $m$ 个 $n$ 维向量, 称 $c_1\vec v_1+\cdots +c_m\vec v_m$ 为向量 $\vec v_1,\cdots,\vec v_m$ 的一个线性组合
在 3 维空间中,一般,对于向量 $\vec u,\vec v,\vec w$
- {非零向量 $\vec u$} 的所有线性组合是一条直线;
- {不共线的 $\vec u,\vec v$} 的所有线性组合是一个平面;
- {不共面的 $\vec u,\vec v,\vec w$} 的所有线性组合是整个三维空间.
向量的长度
向量 $\vec v$ 的长度或模定义为 $\left\|\vec v\right \|=\sqrt{\vec v\cdot \vec v}$
向量正交
若 $\vec v\cdot \vec w=0$, 则称向量 $\vec v$ 和 $\vec w$ 垂直 / 正交. 记作 $\vec v\perp \vec w$
Cauchy-Schwarz 不等式
$|\vec v\cdot \vec w|=\left \|\vec v\right \|\left \|\vec w\right \|$, 等号成立当且仅当一个向量是另一个向量的倍数.
三角不等式
$\left\|\vec v+ \vec w\right \|\le \left\|\vec v\right\|+\left\|\vec w\right\|$, 等号成立当且仅当 $\vec v, \vec w$ 之一为另一向量的非负倍数.
2 矩阵与线性方程组
对矩阵与向量乘积的理解
$A \vec x$
理解1
得到 $A$ 各列向量的一个线性组合;理解2
列向量 $\vec x$ 与 $A$ 各行向量做内积
对线性方程组的理解
$A \vec x=\vec b$
理解1
求 $A$ 列向量的线性组合, 使之等于 $\vec b$;理解2
求向量 $\vec x$, 使之与 $A$ 的行向量内积分别为 $\vec b$ 中的元素
可逆矩阵
若 $A \vec x=\vec b$ ($n$ 个方程, $n$ 个未知数) 对任意向量 $\vec b$ 有唯一解, 则称方阵 $\vec A$ 可逆
若 $A=(\vec u, \vec v, \vec w)$ 可逆, 则 $\vec u, \vec v, \vec w$ 的全部线性组合所得空间是整个三维空间, 这时向量 $\vec u, \vec v, \vec w$ 线性无关 / 不共面, 相应 $A \vec x=\vec b$ 只有零解
线性方程组的行图和列图
行图
(二维) 两直线交点列图
两列向量的线性组合
3 高斯消元法
矩阵的初等行变换
对方程组 $A \vec x=\vec b$, 消元法涉及以下三种同解变形:
- 把一个方程减去另一个方程的倍数;
- 交换两个方程的位置;
- 用一个非零数乘一个方程.
相应地对增广矩阵作以下三种行变换 (即: 初等行变换):
- 把一行减去另一行的倍数;
- 交换两行;
- 用一个非零数乘一行.
增广矩阵
对线性方程组 $A \vec x=\vec b$ 做消元法, 即用一系列初等矩阵在左边, 去乘增广矩阵 $(A | \vec b)$
消去矩阵
将单位阵中某个 $0$ 变为非零的数得到的矩阵称为消去矩阵, 消去矩阵是一类初等矩阵
置换阵
如 $P_{12}=\begin{pmatrix} 0&1&0 \\ 1&0&0 \\ 0&0&1 \end{pmatrix}$
置换阵 $P$ 满足 $P^{-1}=P^{T}$
4 矩阵的运算
矩阵乘法的性质
满足结合律, 左分配律, 右分配律
矩阵的乘法一般不可交换, 消去律一般也不成立
分块矩阵
矩阵的转置
- 若 $A^T=A$ 则称 $A$ 是一个对称矩阵
- 若 $A^T=-A$ 则称 $A$ 是一个反对称矩阵
- 若 $R$ 为 $m\times n$ 矩阵 (实数域), 则 $RR^T$ 为 $m\times n$ 对称矩阵, 且其对角元均非负
5 矩阵的逆
逆矩阵
对方阵 $A$, 若存在矩阵 $B$, 满足 $AB=BA=I$, 则称 $A$ 是可逆的. 称 $B$ 是 $A$ 的逆矩阵, 记作 $A^{-1}$.
可逆矩阵也称为非奇异矩阵, 不可逆矩阵也称为奇异矩阵
性质
- $n$ 阶阵 $A$ 可逆等价于 $A$ 有 $n$ 个主元
- 方阵的逆唯一
- 若 $A$ 可逆, 则 $A\vec x=\vec b$ 有唯一解 $\vec x=A^{-1}\vec b$
- 若 $A\vec x=\vec 0$ 有非零解, 则 $A$ 不可逆
- 二阶阵 $A=\begin{pmatrix} a&b \\ c&d \end{pmatrix}$ 可逆等价于 $ad-bc\neq0$, 且 $A^{-1}=\frac{1}{ad-bc}\begin{pmatrix} d&-b \\ -c&a \end{pmatrix}$
- 对角阵可逆等价于对角元均不为 $0$
- $(A^{-1})^{-1}=A$
- $(AB)^{-1}=B^{-1}A^{-1}$
6 LU 分解
将矩阵分解成一个下三角矩阵和一个上三角矩阵的乘积
$EA=U, A=E^{-1}U=LU$
$A=E^{-1}DU=LDU$ 其中 $L$ 和 $U$ 的对角元为 $1$
LU 分解的存在性和唯一性
设可逆矩阵 $A=(a_{ij})_{n\times n}$ 的顺序主子式
$A_k = (a_{ij})_{k\times k}(k=1,\cdots ,n)$
均为可逆阵, 则 $A$ 有 $LU$ 分解.
若 $l_{ii}=1, u_{ii}\neq 0(1\le i\le n)$, 则分解唯一
设 $A$ 是一个 $n$ 阶可逆阵, 则存在置换阵 $P$ 使得 $PA=LU$
对称矩阵的 $LDL^T$ 分解
7 向量空间
向量子空间
设 $V$ 是 $\mathbb R^n$ 的非空子集, 且 $V$ 关于向量加法和数乘运算封闭 ($\forall \alpha ,\beta\in V,\forall c_1,c_2\in \mathbb R \Longrightarrow c_1\alpha+c_2\beta\in V$), 则称 $V$ 是 $\mathbb R^n$ 的一个向量子空间
推广的向量空间的定义
在由称为“向量”的元素构成的非空集合 $V$ 中, 若定义了加法和数乘运算, 且对任意向量 $\vec{a}, \vec{b}, \vec{c}$ 及数域 $\mathbb{F}$, $k,l\in \mathbb{F}$ 满足以下八条性质:
- $\vec a + \vec b=\vec b + \vec a$
- $\vec a + (\vec b+\vec c)=(\vec a + \vec b)+\vec c$
- 存在零向量 $\vec 0,\ \vec a+\vec 0=\vec a$
- 对任意向量 $\vec a$, 存在唯一相反向量 $-\vec a$, 使得 $\vec a+(-\vec a)=\vec 0$
- $1\cdot \vec a=\vec a$
- $(kl)\vec a=k(l\vec a)$
- $k(\vec a+\vec b)=k\vec a+k\vec b$
- $(k+l)\vec a=k\vec a+l\vec a$
则称 $V$ 为定义在数域 $\mathbb{F}$ 上的向量空间
列空间
$A$ 的列向量所有线性组合构成的空间称为 $A$ 的列空间, 记作 $C(A)$
$C(A)=\{c_1 \vec \alpha_1+ c_2 \vec \alpha_2+\cdots+ c_n \vec \alpha_n | c_i\in \mathbb R\}=\{\vec y\in\mathbb R^m | \vec y=A \vec x,\vec x\in \mathbb R^n\}$
$A \vec x=\vec b$ 有解 $\iff \vec b\in C(A)$
求列空间: 将矩阵化为阶梯形, 阶梯形中主元所在的的列 / 原矩阵中主元所在的列的线性组合就是列空间
零空间
$N(A)=\{\vec x | A \vec x= \vec 0\}\subset \mathbb R^n$
求零空间: 将矩阵化为阶梯形 / 简化行阶梯形 (RREF), 将主元所在的列对应解 $\vec x$ 位置的数字标记为 1, 通过 $A \vec x=\vec 0$ 确定 $\vec x$ 其他位置的数字得到基础解系, 进行组合得到零空间
阶梯形
- $A\overset{行变换}{\longrightarrow}U$, 则 $N(A)=N(U)$
- $B \vec x= \vec 0\Longrightarrow AB \vec x= \vec 0$, 这说明 $N(B)\subset N(AB)$
- $C(AB)\subset C(A)$, 即 $(AB)$ 的每一列是 $A$ 的列向量的线性组合
- 设 $A \vec x=\vec b$ 有一个解 $\vec x^* $, 则 $A \vec x=\vec b$ 的解集为 $\vec x^*+N(A)$
8 求解齐次线性方程组
$A \vec x=\vec 0$ 的基础解系
- 主元个数 = 未知量个数 ($A$ 的列数)- 自由变量个数
- 自由变量个数 = 基础解系中向量的个数 = 解集中线性无关解向量可达到的最大个数
- 主元个数 = $A$ 的列向量中线性无关列向量的个数
9 求解非齐次线性方程组
极大线性无关组
向量组的极大线性无关组: 从原向量组中选出一部分向量构成的线性无关向量组, 并且再填入原向量组中的任一向量就线性相关
秩
向量组的秩: 向量组的极大线性无关组中向量的个数.
定理: 两组向量若能互相线性表出, 则它们的秩相等
$A$ 的行秩 = $A$ 的列秩 = $A$ 的秩
求特解 $\vec x^*$
将矩阵化为 RREF 后令自由变量为 0, 解出主元对应位置的数字即可
10 无关性、基与维数
基与维数
$\vec v_1, \vec v_2, \cdots , \vec v_n\in V$ 且 $\vec v_1, \vec v_2, \cdots , \vec v_n$ 线性无关, 且 $\forall \alpha\in V,\alpha$ 是 $\vec v_1, \vec v_2, \cdots , \vec v_n$ 的线性组合, 则称 $\{\vec v_1, \vec v_2, \cdots , \vec v_n\}$ 是 $V$ 的一组基
可逆矩阵与一组基相乘得到的还是一组基
关于秩的不等式
- $r(AB)\le \min \{r(A),r(B)\}$
- $r(A)=r(A^T)$
- $r(A+B)\le r(A)+r(B)$
11 四个基本子空间的基与维数
四个基本子空间
- 列空间 $C(A)=\{\vec y\in\mathbb R^m | \vec y=A \vec x,\vec x\in \mathbb R^n\}$
- 行空间 $C(A^T)=\{\vec y\in\mathbb R^n | \vec y=A^T \vec x,\vec x\in \mathbb R^m\}$
- 零空间 $N(A)=\{\vec x \in \mathbb R^n| A \vec x= \vec 0\}$
- 左零空间 $N(A^T)=\{\vec x \in \mathbb R^m| A^T \vec x= \vec 0\}$
- $C(A)$ 和 $N(A^T)$ 是 $\mathbb R^m$ 的子空间
- $C(A^T)$ 和 $N(A)$ 是 $\mathbb R^m$ 的子空间
子空间的基和维数
$RREF$ 中主元所在的列 / 对应原矩阵中的列是 $C(A)$ 的一组基
用 "上面行的倍数加到下面行" 化 $A$ 为阶梯形 (忽略中间的全零行), 阶梯形非零行标号对应 $A$ 的行即为 $C(A^T)$ 的一组基
- $A$ 的基础解系构成 $N(A)$ 的一组基
- $A^T$ 的基础解系构成 $N(A^T)$ 的一组基
- $dim(C(A))=dim(C(A^T))=r$
- $dim(N(A))=n-r$
- $dim(N(A^T))=m-r$
维数公式
$dim W_1+dim W_2=dim(W_1 \cap W_2)+dim(W_1+W_2)$
12 四个基本子空间的正交性
- $C(A^T)\perp N(A), C(A^T)+ N(A)=\mathbb R^n$
- $C(A)\perp N(A^T), C(A)+ N(A^T)=\mathbb R^m$
$A \vec x=\vec b$ 在 $C(A^T)$ 中解的唯一性
定理: 若 $A \vec x=\vec b$ 有解, 则 $A \vec x=\vec b$ 在 $C(A^T)$ 中有唯一解
13 投影
引言
若 $A \vec x=\vec b$ 无解, 能够找到 $\hat{\vec x}\in \mathbb R^n$, 使得 $\left \| A \hat{\vec x}-\vec b \right \|$ 最小
直观上,$A \vec x=\vec b$ 无解 $\iff \vec b\notin C(A)$. 上述问题意味着求 $C(A)$ 上距离 $\vec b$ 最近的点 $A\hat{\vec x}$, 它是 $\vec b$ 在 $C(A)$ 上的投影点
投影矩阵
点 $v$ 在平面 $\pi=C(A)$ 上的投影 $p$:
投影 $\vec p=A\hat{\vec x}\in C(A)\Longrightarrow \vec v- \vec p=\vec e\perp C(A) \Longrightarrow A^T(\vec v-A\hat{\vec x})=\vec 0$
$\Longrightarrow \hat{\vec x}$ 是 $A^TA \vec x=A^T \vec v$ 的解
若 $A$ 列满秩,$A^TA$ 是可逆阵 $\Longrightarrow \hat{\vec x}=(A^TA)^{-1}A^T \vec v, \vec p=A(A^TA)^{-1}A^T \vec v$
将 $P=A(A^TA)^{-1}A^T$ 称为投影矩阵
若 $A^TA$ 可逆, 投影阵 $P=A(A^TA)^{-1}A^T$ 满足 $P^2=P,P^T=P$
一般的, 一个矩阵 $P$ 满足 $P^2=P, P^T=P$, 则称 $P$ 为投影矩阵
14 最小二乘法
若 $A \vec x=\vec b$ 无解, 将 $A^TA\hat{\vec x}=A^T \vec b$ 称为正规方程组. 解出 $\hat{\vec x}$, 得到 $\vec b$ 在 C(A) 上的投影 $\vec p=A\hat{\vec x}$
15 Gram-Schmidt 正交化
目标: 给定 $V\in \mathbb R^n$ 为一个子空间,$\vec v_1,\vec v_2,\cdots ,\vec v_k$ 是 $V$ 的一组基, 把它们化成一组正交的向量 $\vec w_1,\vec w_2,\cdots ,\vec w_k$, 满足:
- ${\vec w_i}^T\vec w_j=0,i\neq j$
- $L(\vec v_1,\vec v_2,\cdots ,\vec v_t)=L(\vec w_1,\vec w_2,\cdots ,\vec w_t),1\le t\le k$,$L(\vec v_1,\vec v_2,\cdots ,\vec v_t)$ 表示 $\vec v_1,\vec v_2,\cdots ,\vec v_t$ 生成的 $V$ 的子空间
正交化过程
$$ \vec w_1=\vec v_1 \\ \vec w_2=\vec v_2-\frac{{\vec w_1}^T \vec v_2}{{\vec w_1}^T \vec w_1}\vec w_1 \\ \vec w_3=\vec v_3-\frac{{\vec w_1}^T \vec v_3}{{\vec w_1}^T \vec w_1}\vec w_1-\frac{{\vec w_2}^T \vec v_3}{{\vec w_2}^T \vec w_2}\vec w_2 $$
再进行单位化 $\vec q_i=\frac{\vec w_i}{\left \| \vec w_i \right \|}$
QR 分解
举例:
$$ A=(\vec v_1,\vec v_2, \vec v_3)=\begin{pmatrix}1&1&0 \\ 1&0&1 \\ 0&1&1 \end{pmatrix} $$
$$ A=QR=\begin{pmatrix} \frac{1}{\sqrt 2}&\frac{1}{\sqrt 6}&-\frac{1}{\sqrt 3} \\ \frac{1}{\sqrt 2}&-\frac{1}{\sqrt 6}&\frac{1}{\sqrt 3}\\0&\frac{2}{\sqrt 6}&\frac{1}{\sqrt 3} \end{pmatrix}\begin{pmatrix} \frac{2}{\sqrt 2}&\frac{1}{\sqrt 2}&\frac{1}{\sqrt 2} \\ 0&\frac{3}{\sqrt 6}&\frac{1}{\sqrt 6}\\0&0&\frac{2}{\sqrt 3} \end{pmatrix} $$
$R$ 是对角元为正数的上三角矩阵
16 行列式的基本性质
行列式的几何意义
- 二阶行列式的几何意义: 平面四边形的“有向”面积
- 三阶行列式的几何意义: 平行六面体的“有向”体积
行列式性质
- 单位阵行列式为 $1$
- 给一行乘 $c$, 行列式值乘 $c$
- 一行元素可以拆为两数之和进而分为两个矩阵
- 交换任意两行行列式值取反
- 行列互换行列式值不变
推论:
- 两行成比例, 行列式值为 $0$
- 将一行的倍数加到另一行, 行列式值不变
行列式与初等变换
- 行列式不为零等价于矩阵可逆
- 两 $n$ 阶方阵乘积的行列式 = 各自行列式的乘积
17 行列式的计算
$M_{ij}$ 是 $A$ 划去第 $i$ 行第 $j$ 列得到的 $n-1$ 阶矩阵
余子式: $\det M_{ij}$
代数余子式: $C_{ij}=(-1)^{i+j}\det M_{ij}$
行列式展开定理
$$ \det A=|{a_{ij}}|_ {n\times n}=a_ {i1}C_ {i1}+a_{i2}C_{i2}+\cdots+a_{in}C_{in},\forall i,j=1,\cdots,n $$
典型计算方法
化为上三角或下三角, 计算对角元乘积即为行列式值
通过行列式展开定理展开进行不断降阶后计算行列式值
n 阶范德蒙德行列式
$$ D_{n}=\left|\begin{array}{ccccc} 1 & 1 & 1 & \cdots & 1 \\ x_{1} & x_{2} & x_{3} & \cdots & x_{n} \\ x_{1}^{2} & x_{2}^{2} & x_{3}^{2} & \cdots & x_{n}^{2} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ x_{1}^{n-1} & x_{2}^{n-1} & x_{3}^{n-1} & \cdots & x_{n}^{n-1} \end{array}\right|=\prod_{1 \leq i<j \leq n}\left(x_{j}-x_{i}\right) $$
18 Cramer 法则及行列式的几何意义
代数余子式的重要性质
$$ \sum_{k=1}^{n}a_{ik}C_{jk}=\left\{\begin{array}{c} D,i=j \\ 0,i\neq j \end{array} \right. $$
伴随矩阵
下面的矩阵称为 $A$ 的伴随矩阵
$$ A^*=adj(A)=\left(\begin{array}{cccc} C_{11} & C_{21} & \cdots & C_{n 1} \\ C_{12} & C_{22} & \cdots & C_{n 2} \\ \vdots & \vdots & & \vdots \\ C_{1 n} & C_{2 n} & \cdots & C_{n n} \end{array}\right) $$
$(A^*)^T$:$A$ 的代数余子式矩阵
求逆矩阵公式
$A^{-1}=\frac{adj(A)}{|A|}$
线性方程组的公式解
一般地, 若不使用行列式,$A$ 可逆时,$A \vec x=\vec b$ 解的表达式将非常复杂.
定理 (Cramer's Rule): 设 $A$ 是 $n$ 阶可逆阵,$\vec b \in \mathbb{R}^{n}$, 令 $B_{k}$ 是将 $A$ 的 第 $k$ 列换成向量 $\vec b$ 后所得的矩阵. 则 $A \vec {x}=\vec {b}$ 的唯一解为
$$ \vec {x}=\left(x_{1}, \cdots, x_{n}\right)^{T}, \quad x_{1}=\frac{\operatorname{det}\left(B_{1}\right)}{\operatorname{det} A}, \cdots, x_{n}=\frac{\operatorname{det}\left(B_{n}\right)}{\operatorname{det} A} $$
向量的叉积 / 外积
$\vec u=\begin{pmatrix}u_1\\u_2\\u_3\end{pmatrix},\vec v=\begin{pmatrix}v_1\\v_2\\v_3\end{pmatrix}$,$\vec u\times \vec v$ 是与 $\vec u$ 和 $\vec v$ 都垂直且成右手关系的向量
有 $\vec u\times \vec v=-\vec v\times \vec u$
$(\vec u_1+\vec u_2)\times \vec v=\vec u_1\times \vec v+\vec u_2\times \vec v$
混合积
混合积 $\vec u\times \vec v\cdot \vec w$ , 几何上表示三向量组成的平行六面体的有向体积.
性质: $\vec u\times \vec v\cdot \vec w=\vec v\times \vec w\cdot \vec u=\vec w\times \vec u\cdot \vec v$
定理: $\vec u\times \vec v\cdot \vec w=\det (\vec u,\vec v,\vec w)$
19 特征值和特征向量
特征值
对 $A$, 若存在数 $\lambda$ 和非零向量 $\vec x$, 满足 $A \vec x=\lambda \vec x$, 则称 $\lambda$ 为 $A$ 的特征值,$\vec x$ 为 $A$ 的属于特征值 $\lambda$ 的特征向量数 $\lambda$ 为方阵 $A$ 的特征值 $\iff \det (A-\lambda I)=0$
$\det (A-\lambda I)=0$ 是关于 $\lambda$ 的多项式, 求解多项式得到 $\lambda$, 之后将解出的 $\lambda$ 分别带回 $(A-\lambda I)\vec x=\vec 0$ 即可解出特征值对应的特征向量
举例: 投影矩阵的特征值是 $0$ 和 $1$
特征值的性质
$\sum_{i=1}^{n}\lambda_i=tr(A)=\sum_{i=1}^{n}a_{ii}$
$\prod_{i=1}^n=\det A$
20 矩阵的对角化
设 $n\times n$ 矩阵 $A$ 有 $n$ 个线性无关的特征向量 $\vec x_1 ,\vec x_2,\cdots, \vec x_n, A \vec x_i=\lambda_i \vec x_i$, 令 $S=(\vec x_1 ,\vec x_2,\cdots, \vec x_n)$, 则 $S^{-1}AS$ 是一个对角矩阵 $\Lambda$, 其对角元素是 $A$ 的特征值
$$S^{-1}AS=\Lambda=\begin{pmatrix}\lambda_1& & \\ & \ddots& \\ & &\lambda_n\end{pmatrix}$$
若存在可逆矩阵 $S$, 使得 $S^{-1}AS$ 为对角矩阵, 则称矩阵 $A$ 是可对角化的
$n\times n$ 矩阵 $A$ 可对角化的充要条件是 $A$ 有 $n$ 个线性无关的特征向量 $\vec x_1 ,\vec x_2,\cdots, \vec x_n, A \vec x_i=\lambda_i \vec x_i$
定理:
设 $\vec \lambda_1 ,\vec \lambda_2,\cdots, \vec \lambda_k$ 是 $A$ 的互异特征值,$\vec x_1 ,\vec x_2,\cdots, \vec x_k$ 是相应特征向量, 则 $\vec x_1 ,\vec x_2,\cdots, \vec x_k$ 线性无关
推论:
具有 $n$ 个两两互异特征值的 $n\times n$ 矩阵可以对角化
特征值的代数重数和几何重数
定义: 设 $\operatorname{det}(A-\lambda I)=\left(\lambda_{1}-\lambda\right)^{n_{1}} \cdots\left(\lambda_{k}-\lambda\right)^{n_{k}}$, 其中 $\lambda_{i} \neq \lambda_{j}(i \neq j)$. 称 $n_{i}$ 为特征值 $\lambda_{i}$ 的代数重数, 记作 $AM\left(\lambda_{i}\right)=n_{i}$. 称 $\operatorname{dim} N\left(A-\lambda_{i} I\right)$ 为特征值 $\lambda_{i}$ 的几何重数, 记作 $G M\left(\lambda_{i}\right)=\operatorname{dim} N\left(A-\lambda_{i} I\right)$
$G M\left(\lambda_{i}\right)\le AM\left(\lambda_{i}\right)$
定理: 复方阵 $A$ 可对角化 $\iff$ 对任意特征值 $\lambda_i$ ,$G M\left(\lambda_{i}\right)= AM\left(\lambda_{i}\right)$
对角化的应用
快速计算 $A^k$
22 实对阵矩阵
- 定理: 实对称矩阵的特征值都是实数
- 定理: 任何实对称矩阵都正交相似于对角阵, 即对实对称阵 $A$, 存在正交阵 $Q$, 使 $Q^TAQ$ 为对角阵
1 正定矩阵
特征值全是正数的实对称矩阵称为正定矩阵
实对称矩阵 A 正定的充要条件
- $A$ 的所有特征值均为正
- ${\vec x}^TA \vec x>0$ 对所有非零实向量 $\vec x$ 成立
- $A$ 的所有顺序主子式都是正的
- (只做上面行的倍数加到下面行) $n$ 阶阵 $A$ 有 $n$ 个主元都是正的
- 存在列满秩矩阵 $R$, 使得 $A=R^TR$
- $A$ 的所有主子式都是正的
在 $n$ 阶行列式中任选 $k$ 行: 第 $i_1,i_2,\cdots,i_k$ 行, 再取相应的第 $i_1,i_2,\cdots,i_k$ 列. 由上述选取的 $k$ 行 $k$ 列交汇处元素组成的新矩阵称
为 $k$ 阶主子阵; 主子阵的行列式, 称为 $n$ 阶行列式的一个 $k$ 阶主子式.
在 $n$ 阶行列式中由第 $1,\cdots,k$ 行和第 $1,\cdots,k$ 列所确定的主子式称为 $k$ 阶顺序主子式.
半正定矩阵
若实对称矩阵 $A$ 的特征值均非负,那么称 $A$ 为半正定矩阵
半正定矩阵的判别条件
- $A$ 的所有特征值 $\lambda_i$ 均非负
- ${\vec x}^TA \vec x≥0$ 对所有实向量 $\vec x$ 成立.
- 存在矩阵 $R$, 使得 $A=R^TR$ ($R$ 可能是不可逆阵)
- A 的所有主子式均非负
二次型
对 $n$ 维实向量 $\vec x \in \mathbb R ^{n}$ 及 n 阶实矩阵 A, 称数值函数
$$ f(\mathbf{x})=\mathbf{x}^{T} A \mathbf{x}=\mathbf{x}^{T}\left(a_{i j}\right)_ {n \times n} \mathbf{x}=\sum_ {i=1}^{n} \sum_{j=1}^{n} a_{i j} x_{i} x_{j} $$
为一个 (实) 二次型, 它是关于 $x_1,\cdots,x_n$ 的二次齐次多项式
主轴定理
设 $A$ 是一个 $n$ 阶实对称矩阵, 则存在正交变量代换 $\mathbf x = Q\mathbf y$, 使得二次型
$$ \mathbf{x}^{T} A \mathbf{x}=\mathbf{y}^{T} \Lambda \mathbf{y}=\sum_{i=1}^{n} \lambda_{i} y_{i}^{2} $$
变为对角形的二次型, 其中 $Q^{T} A Q=\Lambda=\operatorname{diag}\left(\lambda_{1}, \cdots, \lambda_{n}\right)$, $\lambda_{1}, \cdots, \lambda_{n}$ 为 $A$ 的所有特征值.
二次型的分类
一个二次型 $f(\mathbf{x})=\mathbf{x}^{T} A \mathbf{x}$ 是:
- 正定的, 若对所有 $\mathbf{x} \neq \mathbf{0}$, 有 $f(\mathbf{x})>0$ $\iff A$ 的所有特征值都是正数
- 负定的, 若对所有 $\mathbf{x} \neq \mathbf{0}$, 有 $f(\mathbf{x})<0$ $\iff A$ 的所有特征值都是负数
- 不定的, 若 $f(\mathbf{x})$ 既有正值, 又有负值 $\iff A$ 既有正特征值, 又有负特征值
- 半正定的, 若对所有 $\mathbf x$, 有 $f(\mathbf{x}) \geq 0$
- 半负定的, 若对所有 $\mathbf x$, 有 $f(\mathbf{x}) \leq 0$
矩阵的合同
两个 $n$ 阶矩阵 $A$,$B$, 若存在 $n$ 阶可逆矩阵 $C$, 使得 $C^{T} A C=B$, 则称矩阵 $A$ 与 $B$ 合同, 记为 $A\cong B$
主轴定理可表述为: 任何实对称矩阵都正交合同于对角阵
3 奇异值分解
引言: 如何“对角化”$m\times n$ 矩阵
奇异值分解
设 $A$ 是一个 $m\times n$ 矩阵, 则存在 $m$ 阶正交矩阵 $U$ 和 $n$ 阶正交矩阵 $V$, 满足:
$$ A=U\begin{pmatrix}\sigma_1&&&\\&\ddots&&\\&&\sigma_2&\\&&&\vec 0\end{pmatrix}V^T=U\Sigma V^T $$
其中 $r=rank(A)$. 习惯上, 取 $\sigma_1≥\sigma_2≥\cdots≥\sigma_r≥0$, 称 $\sigma_1, \sigma_2 ,\cdots,\sigma_r$ 为奇异值, 称 $U$ 和 $V$ 的前 $r$ 列向量为奇异向量. 这个分解称为奇异值分解, 简称 $SVD$.
有 $A \vec v_i=\sigma_i \vec u_i$,$A^T \vec u_i=\sigma_i \vec v_i$
有 $A^T A \vec v_i={\sigma_i}^2 \vec v_i$
$\vec u_i=\frac{A \vec v_i}{\sigma_i}$
- $\{\vec u_1, \cdots, \vec u_r\}$ 为 $C(A)$ 的一组单位正交基
- $\{\vec v_1, \cdots, \vec v_r\}$ 为 $C(A^T)$ 的一组单位正交基
奇异值分解的应用
设 $A=U\Sigma V^T$ 是 $m\times n$ 实矩阵 $A$ 的奇异值分解,$r=r(A)$, 则
- 正交矩阵 $U$ 的前 $r$ 列是 $C(A)$ 的一组标准正交基;
- 正交矩阵 $U$ 的后 $(m-r)$ 列是 $N(A^T)$ 的一组标准正交基;
- 正交矩阵 $V$ 的前 $r$ 列是 $C(A^T)$ 的一组标准正交基;
- 正交矩阵 $V$ 的后 $(n-r)$ 列是 $N(A)$ 的一组标准正交基.
4 线性变换 I
设 $V,W$ 是数域 $\mathbb F$ 上的向量空间,$V$ 到 $W$ 的映射 $T:V\to W$ 若保持加法和数乘计算, 即
$T(\vec x+ \vec y)=T(\vec x)+T(\vec y),\ T(k \vec x)=kT(\vec x), \ \forall \vec x,\vec y\in V,\ \forall k\in \mathbb F$, 则称 $T:V\to W$ 是一个线性变换
向量空间 $V$ 到 $W$ 的全体线性变换构成一个向量空间, 记为 $\mathcal L (V,W)$
线性变换的乘积
定义: 设 $\tau \in \mathcal{L}(U, V), \sigma \in \mathcal{L}(V, W) .$ 定义线性变换的乘积 $\sigma \tau: U \rightarrow W$ 为:
$$ (\sigma \tau)(\mathbf{u})=\sigma(\tau(\mathbf{u})), \quad \forall \mathbf{u} \in U $$
直接验证得 $\sigma \tau \in \mathcal{L}(U, W)$
线性变换的逆
设 $\tau \in \mathcal{L}(V, V)$, 若存在 $\tau \in \mathcal{L}(V, V)$ 使得 $\sigma \tau=\tau \sigma=I$, 则称 $\sigma$ 是可逆线性变换, $\tau$ 为 $\sigma$ 的逆变换
线性变换的矩阵表示
$$ T\left(\mathbf{v}_ {1}, \ldots, \mathbf{v}_ {n}\right)=\left(T\left(\mathbf{v}_ {1}\right), \ldots, T\left(\mathbf{v}_ {n}\right)\right)=\left(\mathbf{w}_ {1}, \ldots, \mathbf{w}_ {m}\right)\left(\begin{array}{cccc}a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{m 1} & a_{m 2} & \cdots & a_{m n}\end{array}\right) $$
称 $m\times n$ 矩阵 $A$ 为线性变换 $T$ 在 $V$ 中给定基 $\vec v_1,\cdots ,\vec v_n$ 和 W 中给定基 $\vec w_1,\cdots ,\vec w_m$ 下的矩阵表示
注: $A$ 中第 $j$ 列恰是 $T(\vec v_j)$ 在基 $\vec w_1,\cdots ,\vec w_m$ 下的坐标 '
定理: 设 $\vec v_1,\cdots ,\vec v_n$ 是 $n$ 维空间 $V$ 的一组基,$\vec w_1,\cdots ,\vec w_m$ 是 $m$ 维向量空间 $W$ 的一组基,$A$ 是任一 $m\times n$ 矩阵, 则有唯一的线性变换 $\sigma$ 满足:$\sigma (\vec v_1,\cdots ,\vec v_n)=(\vec w_1,\cdots ,\vec w_m)A$
5 线性变换 II
恒同变换: 对应矩阵 $I_n$
- 有线性变换 $\sigma:V\to W$
- 线性变换的核:$\ker \sigma=\{\vec v\in V | \sigma (\vec v)=\vec 0\}$
- 线性变换的像 (值域):$\operatorname{Im} \sigma = \{\sigma ( \vec v)|\vec v\in V\}$
- $\dim (\ker \sigma)$ 称为线性变换 $\sigma$ 的零度
- $\dim (\operatorname{Im} \sigma)$ 称为线性变换 $\sigma$ 的秩
版权属于:字节星球/肥柴之家 (转载请联系作者授权)
原文链接:https://www.bytecho.net/archives/2367.html
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。