高等代数(上)
1 线性方程组的解法
1.1 解线性方程组的矩阵消元法
1、线性方程组:左端为未知量x的一次齐次式,右端是常数。关键词:系数、常数项、n元线性方程组、解集
2、线性方程组的初等变换:1)把一个方程的倍数加到另一个方程上;2)互换两个方程位置;3)用一个非零数乘其中一个方程
3、关键词:阶梯型方程组、简化阶梯型方程组、增广矩阵、系数矩阵、零矩阵、方阵、m级矩阵(方阵)、矩阵的初等变换
4、阶梯型矩阵:1)零行在下方(如果有零行的话);2)非零行从左边起第一个不为0的元素(称为主元),它们的列指标随行指标的递增而严格增大。
5、简化行阶梯形矩阵:1)是阶梯型矩阵;2)非零行的主元为1;3)主元所在列的其余元素为0。
6、定理1:任意一个矩阵都可以经过一系类初等行变换化成阶梯形矩阵。
证明:
7、推论1:任意一个矩阵都可以经过一系类初等行变换化成简化阶梯形矩
8、线性方程组的一般解:以主元为系数的未知量称为主变量,其余未知量为自由未知量,一般解就是用含自由未知量的式子表示主变量。
1.2线性方程组的解的情况及其判别准则
1、定理1:系数为有理数(或实数、复数)的你元线性方程组的解的情况只有三种可能:1)无解、2)有唯一解、3)有无穷多个解。
高斯-约当 算法:
graph TD
01["线性方程组的增广矩阵"]-->| 初等行变换|02["阶梯形矩阵"]
02-->03{"是否出现“0=d?”"}
03-->|是|04["原方程无解"]
03-->|否 初等行变换|05["简化行阶梯形矩阵"]
05-->06{"非零行数目=未知量数目?"}
06-->|是|07["原方程有唯一解"]
06-->|否 初等行变换|08["有无穷多个解"]
如果一个线性方程组有解,那么称它是相容的;否则,称它是不相容的。关键词:齐次线性方程组、零解、非零解
2、推论1:n元齐次线性方程组有非零解的充分必要是:它的系数矩阵经过初等行变换化成的阶梯形矩阵中,非零行的数目r<n。
3、推论2:n元齐次线性方程组如果方程的数目s小于未知量的数目n,那么它一定有非零解。
1.3 数域
1、定义:复数集的一个子集K如果满足:
(1) 0,1∈K;
(2) a,b∈K→a±b,ab∈K,
a,b∈K,且b≠0→a/b∈K
那么,称K是一个数域。
2、有理数集Q,实数集R,复数集C都是数域;但整数集Z不是数域,因为Z对于除法不封闭。任何数域都含有有理数域,有理数域是最小的数域,复数域是最大的数域。
3、命题1:任一数域都包含有理数域。
2 行列式
2.1 n元排列
1、n个不同的自然数的一个全排列称为一个n元排列。
2、顺序、逆序、逆序数:τ(abcd…)(读音:tao)、奇排列、偶排列、对换(a,b)
3、定理1:对换改变n元排列的奇偶性。
4、定理2:任一n元排列与顺序排列123……n可以经过一系类对换互变,且所做对换次数与这个n元排列有相同的奇偶性。
2.2 n阶行列式的定义
1、定义1:n阶行列式是n!项的代数和,其中每一项都是位于不同行、不同列的n个元素的乘积,把这n个元素以行指标为自然序号排好位置,当列指标构成的排列是偶排列时,该项带正号;是奇排列时,该项带负号。即:
∣ a 11 a 12 . . . a 1 n a 21 a 22 . . . a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 . . . a n n ∣ = ∑ j 1 j 2 . . . j n ( − 1 ) τ ( j 1 j 2 . . . j n ) a 1 j 1 a 2 j 2 . . . a 3 j 3 (1) \tag{1}
\begin{vmatrix}
a_{11} & a_{12} & ... & a_{1n} \\
a_{21} & a_{22} & ... & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & ... & a_{nn}
\end{vmatrix}=
\sum_{j_1j_2...j_n}(-1)^{\tau(j_1j_2...j_n)} a_{1j_1}a_{2j_2}...a_{3j_3}
a 11 a 21 ⋮ a n 1 a 12 a 22 ⋮ a n 2 ... ... ... a 1 n a 2 n ⋮ a nn = j 1 j 2 ... j n ∑ ( − 1 ) τ ( j 1 j 2 ... j n ) a 1 j 1 a 2 j 2 ... a 3 j 3 ( 1 )
其中,j 1 j 2 . . . j n j_1j_2...j_n j 1 j 2 ... j n 是n元排列, ∑ \sum ∑ 表示对所有的n元排列求和。(1)式称为n阶行列式的完全展开式 。
令
A = [ a 11 a 12 . . . a 1 n a 21 a 22 . . . a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 . . . a n n ] (2) A=\tag{2}
\begin{bmatrix}
a_{11} & a_{12} & ... & a_{1n} \\
a_{21} & a_{22} & ... & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & ... & a_{nn}
\end{bmatrix}
A = a 11 a 21 ⋮ a n 1 a 12 a 22 ⋮ a n 2 ... ... ... a 1 n a 2 n ⋮ a nn ( 2 )
则n阶行列式(1)也称为n级矩阵A的行列式,简记作|A|或者det A。
2、命题1:n阶上三角行列式的值等于它的主对角线上n个元素的乘积。
2.3 行列式的性质
1、性质1:行列互换,行列式的值不变。推论:行列式的行与列的地位是对称的 。因此,行列式有关行的性质,对于列也同样成立。
2、性质2:行列式一行的公因子可以提出去。推论:如果行列式中有一行的元素全为0,那么行列式的值为0。
∣ a 11 a 12 . . . a 1 n ⋮ ⋮ ⋮ k a i 1 k a i 2 . . . k a i n ⋮ ⋮ ⋮ a n 1 a n 2 . . . a n n ∣ = k ∣ a 11 a 12 . . . a 1 n ⋮ ⋮ ⋮ a i 1 a i 2 . . . a i n ⋮ ⋮ ⋮ a n 1 a n 2 . . . a n n ∣ (1) \tag{1}
\begin{vmatrix}
a_{11} & a_{12} & ... & a_{1n} \\
\vdots & \vdots & &\vdots \\
ka_{i1} & ka_{i2} & ... & ka_{in} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & ... & a_{nn}
\end{vmatrix}=
k\begin{vmatrix}
a_{11} & a_{12} & ... & a_{1n} \\
\vdots & \vdots & &\vdots \\
a_{i1} & a_{i2} & ... & a_{in} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & ... & a_{nn}
\end{vmatrix}
a 11 ⋮ k a i 1 ⋮ a n 1 a 12 ⋮ k a i 2 ⋮ a n 2 ... ... ... a 1 n ⋮ k a in ⋮ a nn = k a 11 ⋮ a i 1 ⋮ a n 1 a 12 ⋮ a i 2 ⋮ a n 2 ... ... ... a 1 n ⋮ a in ⋮ a nn ( 1 )
3、性质3:行列式中若是有某一行是两组数的和,则此行列式等于两个行列式的和,这两个行列式的这一行分别是第一组数和第二组数,而其余各行与原来行列式的相应各行相同。即:
∣ a 11 a 12 . . . a 1 n ⋮ ⋮ ⋮ b 1 + c 1 b 2 + c 2 . . . b n + c n ⋮ ⋮ ⋮ a n 1 a n 2 . . . a n n ∣ ( 第 i 行 ) = ∣ a 11 a 12 . . . a 1 n ⋮ ⋮ ⋮ b 1 b 2 . . . b n ⋮ ⋮ ⋮ a n 1 a n 2 . . . a n n ∣ + ∣ a 11 a 12 . . . a 1 n ⋮ ⋮ ⋮ c 1 c 2 . . . c n ⋮ ⋮ ⋮ a n 1 a n 2 . . . a n n ∣ (2) \begin{vmatrix}
a_{11} & a_{12} & ... & a_{1n} \\
\vdots & \vdots & &\vdots \\
b_1+c_1 & b_2+c_2& ... & b_n+c_n \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & ... & a_{nn}
\end{vmatrix}(第i行)=
\begin{vmatrix}
a_{11} & a_{12} & ... & a_{1n} \\
\vdots & \vdots & &\vdots \\
b_1 & b_2 & ... & b_n \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & ... & a_{nn}
\end{vmatrix}+
\begin{vmatrix}
a_{11} & a_{12} & ... & a_{1n} \\
\vdots & \vdots & &\vdots \\
c_1 & c_2 & ... & c_n \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & ... & a_{nn}
\end{vmatrix} \tag{2}
a 11 ⋮ b 1 + c 1 ⋮ a n 1 a 12 ⋮ b 2 + c 2 ⋮ a n 2 ... ... ... a 1 n ⋮ b n + c n ⋮ a nn ( 第 i 行 ) = a 11 ⋮ b 1 ⋮ a n 1 a 12 ⋮ b 2 ⋮ a n 2 ... ... ... a 1 n ⋮ b n ⋮ a nn + a 11 ⋮ c 1 ⋮ a n 1 a 12 ⋮ c 2 ⋮ a n 2 ... ... ... a 1 n ⋮ c n ⋮ a nn ( 2 )
4、性质4:两行互换,行列式反号。
5、性质5:两行相同,行列式的值为0。
6、性质6:两行成比例,行列式的值为0。
7、性质7:把一行的倍数加到另一行上,行列式的值不变。
graph TD
00[行列式定义]--> 01["性质1:行列互换 ,行列式的值不变"]
00 --> 03["性质3:行列式中若是有某一行是两 组数的和,则此行列式等于两个行列 式的和,这两个行列式的这一行分别 是第一组数和第二组数,而其余各行 与原来行列式的相应各行相同。"]
00 --> 02["性质2:行列式一行的 公因子可以提出去。"]
00 --> 04["性质4:两行互换 ,行列式反号。"]
04 --> 05["性质5:两行相同 ,行列式的值为0。"]
02 --> 06["性质6:两行成比 例,行列式的值为0。"]
05 --> 06
03 --> 07["性质7:把一行的倍数加到另一行上,行列式的值不变。"]
06 --> 07
8、综上,如果A → 初等行变换 B A \xrightarrow{初等行变换}B A 初等行变换 B ,那么∣ B ∣ = l ∣ A ∣ |B|=l|A| ∣ B ∣ = l ∣ A ∣ ,其中l l l 是个非零数。
2.4 行列式按一行(列)展开
1、定义1:n阶行列式∣ A ∣ |A| ∣ A ∣ 中,划去第i i i 行和,第j j j 列,剩下的元素按原来次序组成的n − 1 n-1 n − 1 阶行列式称为矩阵A的( i , j ) (i,j) ( i , j ) 元的余子式 ,记作M i j M_{ij} M ij 。令
A i j = ( − 1 ) i + j M i j (1) \tag{1}A_{ij}=(-1)^{i+j}M_{ij}
A ij = ( − 1 ) i + j M ij ( 1 )
称A i j A_{ij} A ij 是A的( i , j ) (i,j) ( i , j ) 元的代数余子式 。
2、定理1:n阶行列式∣ A ∣ |A| ∣ A ∣ 等于它的第i i i 行元素与自己的代数余子式的乘积之和,即
∣ A ∣ = a i 1 A i 1 + a i 2 A i 2 + ⋯ + a i m A i m = ∑ j = 1 n a i j A i j (2) \tag{2}|A|=a_{i1}A_{i1}+a_{i2}A_{i2}+\dots+a_{im}A_{im}=\sum_{j=1}^na_{ij}A_{ij}
∣ A ∣ = a i 1 A i 1 + a i 2 A i 2 + ⋯ + a im A im = j = 1 ∑ n a ij A ij ( 2 )
其中i ∈ { 1 , 2 … n } i\in\{1,2\dots n\} i ∈ { 1 , 2 … n } ,(2)式称为n阶行列式按第i i i 行的展开式。
3、定理2:n阶行列式∣ A ∣ |A| ∣ A ∣ 等于它的第j j j 列元素与自己的代数余子式的乘积之和,即
∣ A ∣ = a 1 j A 1 j + a 2 j A 2 j + ⋯ + a n j A n j = ∑ l = 1 n a l j A l j (3) |A|=a_{1j}A_{1j}+a_{2j}A_{2j}+\dots+a_{nj}A_{nj}=\sum_{l=1}^na_{lj}A_{lj} \tag{3}
∣ A ∣ = a 1 j A 1 j + a 2 j A 2 j + ⋯ + a nj A nj = l = 1 ∑ n a l j A l j ( 3 )
4、定理3:n阶行列式∣ A ∣ |A| ∣ A ∣ 的第i i i 行元素与第k k k 行( k ≠ i ) (k\neq i) ( k = i ) 的相应元素的代数余子式的乘积之和等于0,即
a i 1 A k 1 + a i 2 A k 2 + ⋯ + a i n A k n = 0 , 当 k ≠ i (4) a_{i1}A_{k1}+a_{i2}A_{k2}+\dots +a_{in}A_{kn}=0,当\space k \neq i \tag{4}
a i 1 A k 1 + a i 2 A k 2 + ⋯ + a in A kn = 0 , 当 k = i ( 4 )
5、定理4:n阶行列式∣ A ∣ |A| ∣ A ∣ 的第j j j 列元素与第l l l 列( l ≠ j ) (l\neq j) ( l = j ) 的相应元素的代数余子式的乘积之和等于0,即
a 1 j A 1 l + a 2 j A 2 l + ⋯ + a n j A n l = 0 , 当 l ≠ j (5) a_{1j}A_{1l}+a_{2j}A_{2l}+\dots +a_{nj}A_{nl}=0,当\space l \neq j \tag{5}
a 1 j A 1 l + a 2 j A 2 l + ⋯ + a nj A n l = 0 , 当 l = j ( 5 )
6、小结
∑ j = 1 n a i j A k j = { ∣ A ∣ , 当 k = i , 0 , 当 k ≠ i ; (6) \sum_{j=1}^na_{ij}A_{kj}=\begin{cases}
|A|, & 当k=i, \\
0, & 当k \neq i;
\end{cases}\tag{6}
j = 1 ∑ n a ij A kj = { ∣ A ∣ , 0 , 当 k = i , 当 k = i ; ( 6 )
∑ i = 1 n a i j A i l = { ∣ A ∣ , 当 l = j , 0 , 当 l ≠ j . (7) \sum_{i=1}^na_{ij}A_{il}=\begin{cases}
|A|, & 当l=j, \\
0, & 当l \neq j.
\end{cases}\tag{7}
i = 1 ∑ n a ij A i l = { ∣ A ∣ , 0 , 当 l = j , 当 l = j . ( 7 )
7、范德蒙(Vandermonde)行列式
∣ 1 1 1 … 1 a 1 a 2 a 3 . . . a n a 1 2 a 2 2 a 3 2 . . . a n 2 ⋮ ⋮ ⋮ ⋮ a 1 n − 2 a 2 n − 2 a 3 n − 2 . . . a n n − 2 a 1 n − 1 a 2 n − 1 a 3 n − 1 . . . a n n − 1 ∣ = ∏ 1 ⩽ j < i ⩽ n ( a i − a j ) (8) \begin{vmatrix}
1 & 1 & 1 & \dots & 1 \\
a_1 & a_2 & a_3 & ... & a_n \\
a_1^2 & a_2^2 & a_3^2 & ... & a_n^2 \\
\vdots & \vdots & \vdots & & \vdots \\
a_1^{n-2} & a_2^{n-2} & a_3^{n-2} & ... & a_n^{n-2} \\
a_1^{n-1} & a_2^{n-1} & a_3^{n-1} & ... & a_n^{n-1} \\
\end{vmatrix}=
\prod_{1\leqslant j < i\leqslant n}(a_i-a_j) \tag{8}
1 a 1 a 1 2 ⋮ a 1 n − 2 a 1 n − 1 1 a 2 a 2 2 ⋮ a 2 n − 2 a 2 n − 1 1 a 3 a 3 2 ⋮ a 3 n − 2 a 3 n − 1 … ... ... ... ... 1 a n a n 2 ⋮ a n n − 2 a n n − 1 = 1 ⩽ j < i ⩽ n ∏ ( a i − a j ) ( 8 )
2.5 克莱姆(Cramer)法则
1、定理1:数域K上n个方程的n元线性方程组有唯一解的充分必要条件是它的系数行列式(即系数矩阵A的行列式∣ A ∣ |A| ∣ A ∣ )不等于0。
推论1:数域K上n个方程的n元齐次线性方程组只有零解的充分必要条件是它的系数行列式不等于0。从而它有非零解的充分必要条件是它的系数行列式等于0。
2、定理2:n个方程的n元线性方程组(1)的系数行列式∣ A ∣ ≠ 0 |A|\neq 0 ∣ A ∣ = 0 时,它的唯一解是
( ∣ B 1 ∣ ∣ A ∣ , ∣ B 2 ∣ ∣ A ∣ , … , ∣ B n ∣ ∣ A ∣ ) . (1) (\frac {|B_1|} {|A|},\frac {|B_2|} {|A|},\dots,\frac {|B_n|} {|A|}). \tag{1}
( ∣ A ∣ ∣ B 1 ∣ , ∣ A ∣ ∣ B 2 ∣ , … , ∣ A ∣ ∣ B n ∣ ) . ( 1 )
2.6 行列式按k行(列)展开
1、定义1:n阶行列式∣ A ∣ |A| ∣ A ∣ 中任意取定k k k 行,k k k 列1 ⩽ k < n 1 \leqslant k < n 1 ⩽ k < n ,位于这些行和列的交叉处的k 2 k^2 k 2 个元素按原来的排法组成的k k k 阶行列式,称为∣ A ∣ |A| ∣ A ∣ 的一个k阶子式 。
取定∣ A ∣ |A| ∣ A ∣ 的第i 1 , i 2 , … , i k i_1,i_2,\dots,i_k i 1 , i 2 , … , i k 行( i 1 < i 2 < ⋯ < i k ) (i_1<i_2<\dots<i_k) ( i 1 < i 2 < ⋯ < i k ) ,第j 1 , j 2 , … , j k j_1,j_2,\dots,j_k j 1 , j 2 , … , j k 列( j 1 < j 2 < ⋯ < j k ) (j_1<j_2<\dots<j_k) ( j 1 < j 2 < ⋯ < j k ) ,所得到的k阶子式记作
A ( i 1 , i 2 , … , i k j 1 , j 2 , … , j k ) (1) A\begin{pmatrix}
i_1,i_2,\dots,i_k \\
j_1,j_2,\dots,j_k
\end{pmatrix} \tag{1}
A ( i 1 , i 2 , … , i k j 1 , j 2 , … , j k ) ( 1 )
划去这个k阶子式所在的行和列,剩下的元素按原来的排法组成的( n − k ) (n-k) ( n − k ) 阶行列式,称为子式(1)的余子式 ,它前面乘以
( − 1 ) ( i 1 + i 2 + ⋯ + i k ) + ( j 1 + j 2 + ⋯ + j − k ) , (-1)^{(i_1+i_2+\dots+i_k)+(j_1+j_2+\dots+j-k)},
( − 1 ) ( i 1 + i 2 + ⋯ + i k ) + ( j 1 + j 2 + ⋯ + j − k ) ,
则称为子式(1)的代数余子式 。令
{ i 1 ‘ , i 2 ‘ , … , i n − k ‘ } = { 1 , 2 , … , n } \ { i 1 , i 2 , … , i k } , { j 1 ‘ , j 2 ‘ , … , j n − k ‘ } = { 1 , 2 , … , n } \ { j 1 , j 2 , … , j k } , \begin{align}
\{i_1^`,i_2^`,\dots,i_{n-k}^`\}&=\{1,2,\dots,n\}\backslash\{i_1,i_2,\dots,i_k\},\\
\{j_1^`,j_2^`,\dots,j_{n-k}^`\}&=\{1,2,\dots,n\}\backslash\{j_1,j_2,\dots,j_k\},
\end{align}
{ i 1 ‘ , i 2 ‘ , … , i n − k ‘ } { j 1 ‘ , j 2 ‘ , … , j n − k ‘ } = { 1 , 2 , … , n } \ { i 1 , i 2 , … , i k } , = { 1 , 2 , … , n } \ { j 1 , j 2 , … , j k } ,
并且i 1 ‘ < i 2 ‘ < ⋯ < i n − k ‘ , j 1 ‘ < j 2 ‘ < ⋯ < j n − k ‘ i_1^`<i_2^`<\dots<i_{n-k}^`,j_1^`<j_2^`<\dots<j_{n-k}^` i 1 ‘ < i 2 ‘ < ⋯ < i n − k ‘ , j 1 ‘ < j 2 ‘ < ⋯ < j n − k ‘ ,则子式(1)的余子式为
A ( i 1 ‘ , i 2 ‘ , … , i n − k ‘ j 1 ‘ , j 2 ‘ , … , j n − k ‘ ) (2) A\begin{pmatrix}
i_1^`,i_2^`,\dots,i_{n-k}^` \\
j_1^`,j_2^`,\dots,j_{n-k}^`
\end{pmatrix} \tag{2}
A ( i 1 ‘ , i 2 ‘ , … , i n − k ‘ j 1 ‘ , j 2 ‘ , … , j n − k ‘ ) ( 2 )
2、定理1:拉普拉斯(Laplace)定理 (或行列式按k行展开定理),在n阶行列式∣ A ∣ |A| ∣ A ∣ 中,取定第i 1 , i 2 , … , i k i_1,i_2,\dots,i_k i 1 , i 2 , … , i k 行( i 1 < i 2 < ⋯ < i k ) (i_1<i_2<\dots<i_k) ( i 1 < i 2 < ⋯ < i k ) ,则这k行元素形成的所有k阶子式与它们自己的代数余子式的乘积之和等于∣ A ∣ |A| ∣ A ∣ ,即
∣ A ∣ = ∑ 1 ⩽ j 1 < j 2 < ⋯ < j k A ( i 1 , i 2 , … , i k j 1 , j 2 , … , j k ) ( − 1 ) ( i 1 + i 2 + ⋯ + i k ) + ( j 1 + j 2 + ⋯ + j − k ) A ( i 1 ‘ , i 2 ‘ , … , i n − k ‘ j 1 ‘ , j 2 ‘ , … , j n − k ‘ ) . (3) |A|=\sum_{1\leqslant j_1<j_2<\dots<j_k}
A\begin{pmatrix}
i_1,i_2,\dots,i_k \\
j_1,j_2,\dots,j_k
\end{pmatrix}
(-1)^{(i_1+i_2+\dots+i_k)+(j_1+j_2+\dots+j-k)}
A\begin{pmatrix}
i_1^`,i_2^`,\dots,i_{n-k}^` \\
j_1^`,j_2^`,\dots,j_{n-k}^`
\end{pmatrix}. \tag{3}
∣ A ∣ = 1 ⩽ j 1 < j 2 < ⋯ < j k ∑ A ( i 1 , i 2 , … , i k j 1 , j 2 , … , j k ) ( − 1 ) ( i 1 + i 2 + ⋯ + i k ) + ( j 1 + j 2 + ⋯ + j − k ) A ( i 1 ‘ , i 2 ‘ , … , i n − k ‘ j 1 ‘ , j 2 ‘ , … , j n − k ‘ ) . ( 3 )
推论1:
∣ A 0 C B ∣ = ∣ A ∣ ∗ ∣ B ∣ . (4) \begin{vmatrix}
A & 0 \\
C & B
\end{vmatrix}=|A|*|B|. \tag{4}
A C 0 B = ∣ A ∣ ∗ ∣ B ∣. ( 4 )
3 线性方程组的解集的结构
3.1 n维向量空间K n K^n K n
1、定义1:数域K上所有n元有序数组组成的集合K n K^{n} K n ,连同定义在它上面的加法运算和数量乘法运算,以及满足的8条运算法则一起,称为数域K上的一个n维向量空间 。K n K^{n} K n 的元素称为n维向量 ;设向量α = ( a 1 , a 2 , … , a n ) \alpha =(a_1,a_2,\dots,a_n) α = ( a 1 , a 2 , … , a n ) ,称a i a_i a i 是α \alpha α 的第i i i 个分量 。
取定一个数域K,设n是任意给定的一个正整数。令
K n = { ( a 1 , a 2 , … , a n ) ∣ a i ∈ K , i = 1 , 2 , … , n } . K^n=\{(a_1,a_2,\dots,a_n)\space|\space a_i \in K,i=1,2,\dots,n\}.
K n = {( a 1 , a 2 , … , a n ) ∣ a i ∈ K , i = 1 , 2 , … , n } .
如果a 1 = b 1 , a 2 = b 2 , … , a n = b n a_1=b_1,a_2=b_2,\dots,a_n=b_n a 1 = b 1 , a 2 = b 2 , … , a n = b n ,则称K n K^ n K n 中两个元素( a 1 , a 2 , … , a n ) (a_1,a_2,\dots,a_n) ( a 1 , a 2 , … , a n ) 与( b 1 , b 2 , … , b n ) (b_1,b_2,\dots,b_n) ( b 1 , b 2 , … , b n ) 相等。
在K n K^{n} K n 中规定加法运算如下:
( a 1 , a 2 , … , a n ) + ( b 1 , b 2 , … , b n ) = def ( a 1 + b 1 , a 2 + b 2 , … , a n + b n ) (a_1,a_2,\dots,a_n)+(b_1,b_2,\dots,b_n)\xlongequal{\text{def}}(a_1+b_1,a_2+b_2,\dots,a_n+b_n)
( a 1 , a 2 , … , a n ) + ( b 1 , b 2 , … , b n ) def ( a 1 + b 1 , a 2 + b 2 , … , a n + b n )
在K K K 的元素与K n K^{n} K n 的元素之间规定数量乘法运算如下:
k ( a 1 , a 2 , … , a n ) = def ( k a 1 , k a 2 , … , k a n ) k(a_1,a_2,\dots,a_n) \xlongequal{\text{def}} (ka_1,ka_2,\dots,ka_n)
k ( a 1 , a 2 , … , a n ) def ( k a 1 , k a 2 , … , k a n )
容易直接验证加法和数量乘法满足下述8条运算法则:对于α , β , γ ∈ K n ; k , l ∈ K \alpha ,\beta ,\gamma \in K^n ;\space k,l \in K α , β , γ ∈ K n ; k , l ∈ K 有
(1)α + β = β + α \alpha + \beta = \beta + \alpha α + β = β + α ;
(2)( α + β ) + γ = α + ( β + γ ) (\alpha +\beta)+\gamma=\alpha +(\beta +\gamma) ( α + β ) + γ = α + ( β + γ ) ;
(3)把元素( 0 , 0 , … , 0 ) (0,0,\dots,0) ( 0 , 0 , … , 0 ) 记作0 ,它使得
0 + α = α + 0 = α , \bold 0+\alpha=\alpha+\bold 0=\alpha,
0 + α = α + 0 = α ,
称0 是K n K^n K n 的零元素 ;
(4)对于α = ( a 1 , a 2 , … , a n ) ∈ K n \alpha=(a_1,a_2,\dots,a_n)\in K^n α = ( a 1 , a 2 , … , a n ) ∈ K n ,令
− α = def ( − a 1 , − a 2 , … , − a n ) ∈ K n , -\alpha \xlongequal{\text{def}} (-a_1,-a_2,\dots,-a_n) \in K^n,
− α def ( − a 1 , − a 2 , … , − a n ) ∈ K n ,
有
α + ( − α ) = ( − α ) + α = 0 , \alpha+(-\alpha)=(-\alpha)+\alpha=\bold 0,
α + ( − α ) = ( − α ) + α = 0 ,
称− α -\alpha − α 是α \alpha α 的负元素 ;
(5)1 α = α 1\alpha=\alpha 1 α = α ;
(6)( k l ) α = k ( l α ) (kl)\alpha=k(l\alpha) ( k l ) α = k ( l α ) ;
(7)( k + l ) α = k α + l α (k+l)\alpha=k\alpha+l\alpha ( k + l ) α = k α + l α ;
(8)k ( α + β ) = k α + k β k(\alpha+\beta)=k\alpha+k\beta k ( α + β ) = k α + k β .
2、补充:
(1)通常用小写字母α , β , γ \alpha ,\beta ,\gamma α , β , γ 表示向量。
(2)在n维向量空间K n K^n K n 中,可以定义减法运算如下:
α − β = def α + ( − β ) . \alpha -\beta \xlongequal{\text{def}} \alpha +(-\beta).
α − β def α + ( − β ) .
(3)在n维向量空间K n K^n K n 中,容易直接验证下述4条性质:
0 α = 0 , ∀ α ∈ K n ; ( − 1 ) α = − α , ∀ α ∈ K n ; k 0 = 0 , ∀ k ∈ K ; k α = 0 ⟹ k = 0 或 α = 0 \begin{aligned}
0\alpha=\bold 0,& \qquad \forall \alpha \in K^n; \\
(-1)\alpha=-\alpha,& \qquad \forall \alpha \in K^n; \\
k\bold 0=\bold 0,& \qquad \forall k \in K; \\
k\alpha=\bold 0 \implies & k=0 \, 或 \, \alpha=\bold 0
\end{aligned}
0 α = 0 , ( − 1 ) α = − α , k 0 = 0 , k α = 0 ⟹ ∀ α ∈ K n ; ∀ α ∈ K n ; ∀ k ∈ K ; k = 0 或 α = 0
(4)n元有序数组写成一行,称为行向量 ;写成一列,称为列向量 。K n K^n K n 既是n维行向量组成的向量空间,也是n维列向量组成的向量空间。
(5)在K n K^n K n 中,给定向量组α 1 , α 2 , … , α s \alpha_1,\alpha_2,\dots,\alpha_s α 1 , α 2 , … , α s ,对于β ∈ K n \beta \in K^n β ∈ K n ,如果存在K中一组数c 1 , c 2 , … , c s c_1,c_2,\dots,c_s c 1 , c 2 , … , c s 使得
β = c 1 α 1 + c 2 α 2 + ⋯ + c s α s , \beta=c_1\alpha_1+c_2\alpha_2+\dots+c_s\alpha_s,
β = c 1 α 1 + c 2 α 2 + ⋯ + c s α s ,
那么称β \beta β 可以由α 1 , α 2 , … , α s \alpha_1,\alpha_2,\dots,\alpha_s α 1 , α 2 , … , α s 线性表出(示) 。β \beta β 是向量组α 1 , α 2 , … , α s \alpha_1,\alpha_2,\dots,\alpha_s α 1 , α 2 , … , α s 的一个线性组合 ,其中c 1 , c 2 , … , c s c_1,c_2,\dots,c_s c 1 , c 2 , … , c s 称为系数 。
3、定义2:K n K^n K n 的一个非空子集U如果满足:
( 1 ) α , γ ∈ U ⟹ α + γ ∈ U , ( 2 ) α ∈ U , k ∈ K ⟹ k α ∈ U , \begin{aligned}
(1) \quad & \alpha,\gamma \in U \implies \alpha +\gamma \in U, \\
(2) \quad & \alpha \in U,k\in K \implies k\alpha \in U,
\end{aligned}
( 1 ) ( 2 ) α , γ ∈ U ⟹ α + γ ∈ U , α ∈ U , k ∈ K ⟹ k α ∈ U ,
那么称U是K n K^n K n 的一个线性子空间 ,简称子空间 。其中性质(1)称为U对于K n K^n K n 的加法封闭 ;性质(2)称为U对于K n K^n K n 的数量乘法封闭 。
(1) {0 }是K n K^n K n 的一个子空间,称为零子空间 。K n K^n K n 本身也是K n K^n K n 的一个子空间。
(2) 从而,K n K^n K n 中,向量组α 1 , α 2 , … , α s \alpha_1,\alpha_2,\dots,\alpha_s α 1 , α 2 , … , α s 的所有线性组合组成的集合W是K n K^n K n 的一个子空间,称它为α 1 , α 2 , … , α s \alpha_1,\alpha_2,\dots,\alpha_s α 1 , α 2 , … , α s 生成(或张成)的子空间 ,记作
< α 1 , α 2 , … , α s > <\alpha_1,\alpha_2,\dots,\alpha_s>
< α 1 , α 2 , … , α s >
(3) 命题1:数域K上n元线性方程组x 1 α 1 + x 2 α 2 + ⋯ + x n α n = β x_1\alpha_1+x_2\alpha_2+\dots+x_n\alpha_n=\beta x 1 α 1 + x 2 α 2 + ⋯ + x n α n = β 有解
⟺ β 可以由 α 1 , α 2 , … , α n 线性表出 ⟺ β ∈ < α 1 , α 2 , … , α n > \begin{aligned}
\iff & \beta \, 可以由\, \alpha_1,\alpha_2,\dots,\alpha_n \,线性表出 \\
\iff & \beta \in <\alpha_1,\alpha_2,\dots,\alpha_n>
\end{aligned}
⟺ ⟺ β 可以由 α 1 , α 2 , … , α n 线性表出 β ∈< α 1 , α 2 , … , α n >
3.2 线性相关与线性无关的向量组
1、定义1:K n K^n K n 中向量组α 1 , α 2 , … , α s ( s ⩾ 1 ) \alpha_1,\alpha_2,\dots,\alpha_s(s\geqslant 1) α 1 , α 2 , … , α s ( s ⩾ 1 ) 称为是线性相关 的,如果有K中不全为0的数k 1 , k 2 , … , k s k_1,k_2,\dots,k_s k 1 , k 2 , … , k s ,使得
k 1 α 1 + ⋯ + k s α s = 0 k_1\alpha_1+\dots+k_s\alpha_s=\bold 0
k 1 α 1 + ⋯ + k s α s = 0
2、定义2:K n K^n K n 中向量组α 1 , α 2 , … , α s ( s ⩾ 1 ) \alpha_1,\alpha_2,\dots,\alpha_s(s\geqslant 1) α 1 , α 2 , … , α s ( s ⩾ 1 ) 如果不是线性相关的,那么称为线性无关 的。
3、从定义1和定义2显得:
(1)包含零向量的向量组一定线性相关( k 0 + α 2 + ⋯ + 0 α s = 0 ) (k\bold 0+\alpha_2+\dots+0\alpha_s=\bold 0) ( k 0 + α 2 + ⋯ + 0 α s = 0 ) ;
(2)单个向量α \alpha α 线性相关当且仅当α = 0 ( 因为 k α = 0 , k ≠ 0 ⟺ α = 0 ) \alpha=\bold 0(因为k\alpha=0,k\not=0 \iff\alpha=\bold 0) α = 0 ( 因为 k α = 0 , k = 0 ⟺ α = 0 ) ;
从而单个向量α \alpha α 线性无关当且仅当α ≠ 0 \alpha \not= \bold 0 α = 0 ;
(3)K n K^n K n 中,向量组
ε 1 = [ 1 0 0 ⋮ 0 0 ] , ε 2 = [ 0 1 0 ⋮ 0 0 ] , … , ε n = [ 0 0 0 ⋮ 0 1 ] , \varepsilon_1=\begin{bmatrix} 1 \\0\\0\\ \vdots \\0\\0\end{bmatrix},
\varepsilon_2=\begin{bmatrix} 0 \\1\\0\\ \vdots \\0\\0\end{bmatrix},\dots,
\varepsilon_n=\begin{bmatrix} 0 \\0\\0\\ \vdots \\0\\1\end{bmatrix},
ε 1 = 1 0 0 ⋮ 0 0 , ε 2 = 0 1 0 ⋮ 0 0 , … , ε n = 0 0 0 ⋮ 0 1 ,
是线性无关的。
4、向量组线性相关与线性无关区别:
(1)从线性组合看:
向量组 α 1 , … , α s ( s ⩾ 1 ) 线性相关 ⟺ 它们有系数不全为 0 的线性组合等于零向量; 向量组 α 1 , … , α s ( s ⩾ 1 ) 线性无关 ⟺ 它们只有系数全为 0 的线性组合才会等于零向量。 \begin{aligned}
&向量组\alpha_1,\dots,\alpha_s(s\geqslant1)线性相关 \\
\iff&它们有系数不全为0的线性组合等于零向量;\\ \\
&向量组\alpha_1,\dots,\alpha_s(s\geqslant 1)线性无关 \\
\iff&它们只有系数全为0的线性组合才会等于零向量。
\end{aligned}
⟺ ⟺ 向量组 α 1 , … , α s ( s ⩾ 1 ) 线性相关 它们有系数不全为 0 的线性组合等于零向量; 向量组 α 1 , … , α s ( s ⩾ 1 ) 线性无关 它们只有系数全为 0 的线性组合才会等于零向量。
(2)从线性表出看:
向量组 α 1 , … , α s ( s ⩾ 2 ) 线性相关 ⟺ 其中至少有一个向量可以由其余向量线性表出; 向量组 α 1 , … , α s ( s ⩾ 2 ) 线性无关 ⟺ 其中每一个向量都不能由其余向量线性表出。 \begin{aligned}
&向量组\alpha_1,\dots,\alpha_s(s\geqslant 2)线性相关 \\
\iff&其中至少有一个向量可以由其余向量线性表出;\\ \\
&向量组\alpha_1,\dots,\alpha_s(s\geqslant 2)线性无关 \\
\iff&其中每一个向量都不能由其余向量线性表出。
\end{aligned}
⟺ ⟺ 向量组 α 1 , … , α s ( s ⩾ 2 ) 线性相关 其中至少有一个向量可以由其余向量线性表出; 向量组 α 1 , … , α s ( s ⩾ 2 ) 线性无关 其中每一个向量都不能由其余向量线性表出。
(3)从齐次线性方程组看:
列向量组 α 1 , … , α s ( s ⩾ 1 ) 线性相关 ⟺ 齐次线性方程组 x 1 α 1 + ⋯ + x s α s = 0 有非零解; 列向量组 α 1 , … , α s ( s ⩾ 1 ) 线性无关 ⟺ 齐次线性方程组 x 1 α 1 + ⋯ + x s α s = 0 只有零解。 \begin{aligned}
&列向量组\alpha_1,\dots,\alpha_s(s\geqslant 1)线性相关 \\
\iff&齐次线性方程组x_1\alpha_1+\dots+x_s\alpha_s=\bold 0有非零解;\\ \\
&列向量组\alpha_1,\dots,\alpha_s(s\geqslant 1)线性无关 \\
\iff&齐次线性方程组x_1\alpha_1+\dots+x_s\alpha_s=\bold 0只有零解。
\end{aligned}
⟺ ⟺ 列向量组 α 1 , … , α s ( s ⩾ 1 ) 线性相关 齐次线性方程组 x 1 α 1 + ⋯ + x s α s = 0 有非零解; 列向量组 α 1 , … , α s ( s ⩾ 1 ) 线性无关 齐次线性方程组 x 1 α 1 + ⋯ + x s α s = 0 只有零解。
(4)从行列式看:
n 个 n 维列(行)向量 α 1 , … , α n ( s ⩾ 1 ) 线性相关 ⟺ 以 α 1 , … , α n 为列(行)向量组的矩阵的行列式等于零; n 个 n 维列(行)向量 α 1 , … , α n ( s ⩾ 1 ) 线性无关 ⟺ 以 α 1 , … , α n 为列(行)向量组的矩阵的行列式不等于零。 \begin{aligned}
&n个n维列(行)向量\alpha_1,\dots,\alpha_n(s\geqslant 1)线性相关 \\
\iff&以\alpha_1,\dots,\alpha_n为列(行)向量组的矩阵的行列式等于零;\\ \\
&n个n维列(行)向量\alpha_1,\dots,\alpha_n(s\geqslant 1)线性无关 \\
\iff&以\alpha_1,\dots,\alpha_n为列(行)向量组的矩阵的行列式不等于零。
\end{aligned}
⟺ ⟺ n 个 n 维列(行)向量 α 1 , … , α n ( s ⩾ 1 ) 线性相关 以 α 1 , … , α n 为列(行)向量组的矩阵的行列式等于零; n 个 n 维列(行)向量 α 1 , … , α n ( s ⩾ 1 ) 线性无关 以 α 1 , … , α n 为列(行)向量组的矩阵的行列式不等于零。
(5)从向量组线性表出一个向量的方式看:
设向量 β 可以由向量组 α 1 , … , α s 线性表出,则 向量组 α 1 , … , α s 线性无关 ⟺ 表出方式唯一; 向量组 α 1 , … , α s 线性相关 ⟺ 表出方式有无穷多种。 \begin{aligned}
设向量\beta 可以由向量组\alpha_1,\dots,\alpha_s线性表出,则 \\
向量组\alpha_1,\dots,\alpha_s线性无关
\iff&表出方式唯一;\\
向量组\alpha_1,\dots,\alpha_s线性相关
\iff&表出方式有无穷多种。
\end{aligned}
设向量 β 可以由向量组 α 1 , … , α s 线性表出,则 向量组 α 1 , … , α s 线性无关 ⟺ 向量组 α 1 , … , α s 线性相关 ⟺ 表出方式唯一; 表出方式有无穷多种。
(6)从向量组与它的部分组的关系看:
如果向量组的一个部分组线性相关,那么整个向量组也线性相关。 如果向量组线性无关,那么它的任何一个部分组也线性无关。 \begin{aligned}
&如果向量组的一个部分组线性相关,那么整个向量组也线性相关。 \\
&如果向量组线性无关,那么它的任何一个部分组也线性无关。
\end{aligned}
如果向量组的一个部分组线性相关,那么整个向量组也线性相关。 如果向量组线性无关,那么它的任何一个部分组也线性无关。
(7)从向量组与它的延伸组或缩短组的关系看:
如果向量组线性无关,那么把每个向量添上 m 个分量(所添分量位置对于每个向量都一样)得到的延伸组也线性无关。 如果向量组线性相关,那么把每个向量去掉 m 个分量(去掉的分量位置对于每个向量都一样)得到的缩短组也线性相关。 \begin{aligned}
&如果向量组线性无关,那么把每个向量添上m个分量(所添分量位置对于每个向量都一样)得到的延伸组也线性无关。 \\
&如果向量组线性相关,那么把每个向量去掉m个分量(去掉的分量位置对于每个向量都一样)得到的缩短组也线性相关。
\end{aligned}
如果向量组线性无关,那么把每个向量添上 m 个分量(所添分量位置对于每个向量都一样)得到的延伸组也线性无关。 如果向量组线性相关,那么把每个向量去掉 m 个分量(去掉的分量位置对于每个向量都一样)得到的缩短组也线性相关。
5、命题1:设向量组α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 线性无关,则向量β \beta β 可以由α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 线性表出的充分必要条件是α 1 , … , α s , β \alpha_1,\dots,\alpha_s,\beta α 1 , … , α s , β 线性相关。
推论1:设向量组α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 线性无关,则向量β \beta β 不能由α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 线性表出的充分必要条件是α 1 , … , α s , β \alpha_1,\dots,\alpha_s,\beta α 1 , … , α s , β 线性无关。
6、替换定理:设向量组α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 线性无关,β = b 1 α 1 , … , b s α s \beta=b_1\alpha_1,\dots,b_s\alpha_s β = b 1 α 1 , … , b s α s 。如果b i ≠ 0 b_i\not=0 b i = 0 ,那么用β \beta β 替换α i \alpha_i α i 后得到的向量组α 1 , … , α i − 1 , β , α i + 1 , … , α s \alpha_1,\dots,\alpha_{i-1},\beta,\alpha_{i+1},\dots,\alpha_s α 1 , … , α i − 1 , β , α i + 1 , … , α s 也线性无关。
3.3 向量组的秩
1、定义1:向量组的一个部分组称为一个极大线性无关组 ,如果这个部分组本身是线性无关的,但是从这个向量组的其余向量(如果还有的话)中任取一个添进去,得到的新的部分组都线性相关。
2、定义2:如果向量组α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 的每一个向量都可以由向量组β 1 , … , β r \beta_1,\dots,\beta_r β 1 , … , β r 线性表出,那么称向量组α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 可以由向量组β 1 , … , β r \beta_1,\dots,\beta_r β 1 , … , β r 线性表出。如果向量组α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 与向量组β 1 , … , β r \beta_1,\dots,\beta_r β 1 , … , β r 可以相互线性表出,那么称向量组α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 与向量组β 1 , … , β r \beta_1,\dots,\beta_r β 1 , … , β r 等价 ,记作
{ α 1 , … , α s } ≅ { β 1 , … , β r } \{\alpha_1,\dots,\alpha_s\}\cong\{\beta_1,\dots,\beta_r\}
{ α 1 , … , α s } ≅ { β 1 , … , β r }
向量组的等价是向量组之间的一种关系。可以证明其具有以下三种性质:
( 1 ) 反身性。即任何一个向量组都与自身等价; ( 2 ) 对称性。即如果 α 1 , … , α s 与 β 1 , … , β r 等价,那么 β 1 , … , β r 与 α 1 , … , α s 等价; ( 3 ) 传递性。即如果 { α 1 , … , α s } ≅ { β 1 , … , β r } , { β 1 , … , β r } ≅ { γ 1 , … , γ t } , 那么 { α 1 , … , α s } ≅ { γ 1 , … , γ t } 。 \begin{aligned}
&(1)反身性。即任何一个向量组都与自身等价; \\
&(2)对称性。即如果\alpha_1,\dots,\alpha_s与\beta_1,\dots,\beta_r 等价,那么\beta_1,\dots,\beta_r与\alpha_1,\dots,\alpha_s等价; \\
&(3)传递性。即如果 \\
&\qquad \{\alpha_1,\dots,\alpha_s\}\cong\{\beta_1,\dots,\beta_r\},\{\beta_1,\dots,\beta_r\}\cong\{\gamma_1,\dots,\gamma_t\}, \\
&那么\qquad \qquad \qquad \{\alpha_1,\dots,\alpha_s\}\cong\{\gamma_1,\dots,\gamma_t\}。
\end{aligned}
( 1 ) 反身性。即任何一个向量组都与自身等价; ( 2 ) 对称性。即如果 α 1 , … , α s 与 β 1 , … , β r 等价,那么 β 1 , … , β r 与 α 1 , … , α s 等价; ( 3 ) 传递性。即如果 { α 1 , … , α s } ≅ { β 1 , … , β r } , { β 1 , … , β r } ≅ { γ 1 , … , γ t } , 那么 { α 1 , … , α s } ≅ { γ 1 , … , γ t } 。
3、命题1:向量组与它的极大线性无关组等价。
推论1:向量组的任意两个极大线性无关组等价。
推论2:β \beta β 可以由向量组α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 线性表出当且仅当β \beta β 可以由α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 的一个极大线性无关组线性表出。
4、引理1:设向量组β 1 , … , β r \beta_1,\dots,\beta_r β 1 , … , β r 可以由向量组α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 线性表出,如果r > s r>s r > s ,那么β 1 , … , β r \beta_1,\dots,\beta_r β 1 , … , β r 线性相关。
推论3:设向量组β 1 , … , β r \beta_1,\dots,\beta_r β 1 , … , β r 可以由向量组α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 线性表出,如果β 1 , … , β r \beta_1,\dots,\beta_r β 1 , … , β r 线性无关,那么r ⩽ s r\leqslant s r ⩽ s 。
推论4:等价的线性无关的向量组所含向量的个数相等。
推论5:向量组的任意两个极大线性无关组所含向量的个数相等。
5、定义3:向量组的极大线性无关组所含向量的个数称为这个向量组的秩 。
全由零向量组成的向量组的秩规定为0。
向量组α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 的秩记作r a n k { α 1 , … , α s } rank\{\alpha_1,\dots,\alpha_s\} r ank { α 1 , … , α s } 。
6、命题2:向量组α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 线性无关的充分必要条件是它的秩等于它所含向量的个数。
7、命题3:如果向量组(1)可以由向量组(2)线性表出,那么:(1)的秩⩽ \leqslant ⩽ (2)的秩
8、命题4:等价的向量组有相等的秩。(注意:秩相等的向量组不一定等价)
3.4 子空间的基与维数
1、定义1:设U是K n K^n K n 的一个子空间,如果α 1 , … , α r ∈ U \alpha_1,\dots,\alpha_r \in U α 1 , … , α r ∈ U ,并且满足下述两个条件:
( 1 ) α 1 , … , α r 线性无关, ( 2 ) U 中每一个向量都可以由 α 1 , … , α r 线性表出, \begin{aligned}
&(1)\alpha_1,\dots,\alpha_r线性无关,\\
&(2)U中每一个向量都可以由\alpha_1,\dots,\alpha_r线性表出,
\end{aligned}
( 1 ) α 1 , … , α r 线性无关, ( 2 ) U 中每一个向量都可以由 α 1 , … , α r 线性表出,
那么称α 1 , … , α r \alpha_1,\dots,\alpha_r α 1 , … , α r 是U的一个基 。
显然,ε 1 , … , ε n \varepsilon_1,\dots,\varepsilon_n ε 1 , … , ε n 是K n K^n K n 的一个基,称它为K n K^n K n 的标准基 。
2、定理1:K n K^n K n 的任一非零子空间U都有一个基。
3、定理2:K n K^n K n 的非零子空间U的任意两个基所含的向量的个数相等。
4、定义2:K n K^n K n 的非零子空间U的一个基所含向量的个数称为U的维数,记作d i m K U dim_K\, U d i m K U ,或者d i m U dim \, U d im U 。
零子空间的维数规定为0。
因为d i m K n = n dim \, K^n=n d im K n = n ,所以称K n K^n K n 为n维向量空间。
对于α = a 1 α 1 + ⋯ + a r α r \alpha=a_1\alpha_1+\dots+a_r\alpha_r α = a 1 α 1 + ⋯ + a r α r ,把有序数组( a 1 , … , a r ) (a_1,\dots,a_r ) ( a 1 , … , a r ) 称为α \alpha α 在基α 1 , … , α r \alpha_1,\dots,\alpha_r α 1 , … , α r 下的坐标 。
5、命题1:设d i m U = r dim \, U=r d im U = r ,则U中任意r+1个向量都线性相关。
6、命题2:设d i m U = r dim \, U=r d im U = r ,则U中任意r个线性无关的向量都是U的一个基。
7、命题3:设d i m U = r dim \, U=r d im U = r ,设α 1 , … , α r ∈ U \alpha_1,\dots,\alpha_r \in U α 1 , … , α r ∈ U 。如果U中每一个向量都可以由$\alpha_1,\dots,\alpha_r 线性表出,那么 线性表出,那么 线性表出,那么 \alpha_1,\dots,\alpha_r $是U的一个基。
8、命题4:设U和W都是K n K^n K n 的非零子空间,如果U ⊆ W U\subseteq W U ⊆ W ,那么d i m U ⩽ d i m W dim \, U \leqslant dim \, W d im U ⩽ d im W 。
9、命题5:设U和W是K n K^n K n 的两个非零子空间,且U ⊆ W U\subseteq W U ⊆ W ,如果d i m U = d i m W dim \, U = dim \, W d im U = d im W ,那么U = W U= W U = W 。
10、定理3:向量组α 1 , … , α s \alpha_1,\dots,\alpha_s α 1 , … , α s 的一个极大线性无关组是这个向量组生成的子空间< α 1 , … , α s > <\alpha_1,\dots,\alpha_s> < α 1 , … , α s > 的一个基,从而
d i m < α 1 , … , α s > = r a n k { α 1 , … , α s } . dim<\alpha_1,\dots,\alpha_s>=rank\{\alpha_1,\dots,\alpha_s\}.
d im < α 1 , … , α s >= r ank { α 1 , … , α s } .
3.5 矩阵的秩
1、定理1:阶梯型矩阵J的行秩与列秩相等,它们都等于J的非零行的个数;并且J的主元所在的列构成列向量的一个极大线性无关组。
2、定理2:矩阵的初等行变换不改变矩阵的行秩。
3、定理3:矩阵的初等行变换不改变矩阵的列向量组的线性相关性,从而不改变矩阵的列秩。
4、定理4:任一矩阵A的行秩等于它的列秩。
5、定义1:矩阵A的行秩与列秩统称为A的秩 ,记作r a n k ( A ) rank (A) r ank ( A ) 。
6、推论1:设矩阵A经过初等行变换化成阶梯型矩阵J,则A的秩等于J的非零行个数。设J的主元所在的列是第j 1 , j 2 , … , j r j_1,j_2,\dots,j_r j 1 , j 2 , … , j r 列,则A的第j 1 , j 2 , … , j r j_1,j_2,\dots,j_r j 1 , j 2 , … , j r 列构成A的列向量组的一个极大线性无关组。
7、推论2:矩阵的初等列变换不改变矩阵的秩。
8、定理5:任一非零矩阵的秩等于它的不为零的子式的最高阶数。
9、推论3:设s × n s\times n s × n 矩阵A的秩为r,则A的不等于零的r阶子式所在的列(行)构成A的列(行)向量组的一个极大线性无关组。
10、推论4:n级矩阵A满秩的充分必要条件是∣ A ∣ ≠ 0 |A|\not=0 ∣ A ∣ = 0 。
3.6 线性方程组有解的充分必要条件
1、定理1(线性方程组有解判别定理):数域K上线性方程组
x 1 α 1 + ⋯ + x n α n = β (1) x_1\alpha_1+\dots+x_n\alpha_n=\beta \tag{1}
x 1 α 1 + ⋯ + x n α n = β ( 1 )
有解的充分必要条件是:它的系数矩阵与增广矩阵的秩相等。
2、定理2:数域K上n元线性方程组(1)有解时,如果它的系数矩阵等于n,那么方程组(1)有唯一解;如果A的秩小于n,那么方程组(1)有无穷多个解。
推论1:齐次线性方程组有非零解的充分必要条件是:它的系数矩阵的秩小于未知量的个数。
3.7 齐次线性方程组的解集的结构
数域K上n元齐次线性方程组
x 1 α 1 + ⋯ + x n α n = 0 (1) x_1\alpha_1+\dots+x_n\alpha_n=\bold 0\tag{1}
x 1 α 1 + ⋯ + x n α n = 0 ( 1 )
的一个解是K n K^n K n 中一个向量,称它为齐次线性方程组(1)的一个解向量 。齐次线性方程组(1)的解集W是K n K^n K n 的一个非空子集。
性质1:若γ , δ ∈ W \gamma,\delta \in W γ , δ ∈ W ,则γ + δ ∈ W . \gamma+\delta \in W. γ + δ ∈ W .
性质2:若 γ ∈ W , k ∈ K , 则 k γ ∈ W . 若\gamma \in W,k \in K,则k\gamma \in W. 若 γ ∈ W , k ∈ K , 则 kγ ∈ W .
由上述得,齐次线性方程组(1)的解集W是K n K^n K n 的一个子空间,称它为方程组(1)的解空间 。如果方程组(1)的系数矩阵A的秩等于n,那么W = { 0 } W=\{\bold 0 \} W = { 0 } 。如果r a n k ( A ) < n rank(A)<n r ank ( A ) < n ,那么W是非零子空间。从而W有基。把解空间W的一个基称为齐次线性方程组(1)的一个基础解系 ,即:
定义1:齐次线性方程组(1)有非零解时,如果它的有限多个解η 1 , η 2 , … , η t \eta_1,\eta_2,\dots,\eta_t η 1 , η 2 , … , η t 满足:
( 1 ) η 1 , η 2 , … , η t 线性无关; ( 2 ) 齐次线性方程组( 1 )的每一个解都可以由 η 1 , η 2 , … , η t 线性表出, \begin{aligned}
&(1)\eta_1,\eta_2,\dots,\eta_t 线性无关;\\
&(2)齐次线性方程组(1)的每一个解都可以由\eta_1,\eta_2,\dots,\eta_t 线性表出,
\end{aligned}
( 1 ) η 1 , η 2 , … , η t 线性无关; ( 2 ) 齐次线性方程组( 1 )的每一个解都可以由 η 1 , η 2 , … , η t 线性表出,
那么称η 1 , η 2 , … , η t \eta_1,\eta_2,\dots,\eta_t η 1 , η 2 , … , η t 是齐次线性方程组(1)的一个基础解系 。其解集W表示为:
W = { k 1 η 1 + k 2 η 2 + ⋯ + k t η t ∣ k i ∈ K , i = 1 , 2 , … , t } . W=\{k_1\eta_1+k_2\eta_2+\dots+k_t\eta_t \,|\,k_i \in K,i=1,2,\dots,t\}.
W = { k 1 η 1 + k 2 η 2 + ⋯ + k t η t ∣ k i ∈ K , i = 1 , 2 , … , t } .
通常也说齐次线性方程组(1)的全部解是:
k 1 η 1 + k 2 η 2 + ⋯ + k t η t , k 1 , k 2 , … , k i ∈ K k_1\eta_1+k_2\eta_2+\dots+k_t\eta_t \, ,\,k_1,k_2,\dots,k_i \in K
k 1 η 1 + k 2 η 2 + ⋯ + k t η t , k 1 , k 2 , … , k i ∈ K
定理1:数域K上n元齐次线性方程组的解空间W的维数为
d i m W = n − r a n k ( A ) , (2) dim \, W=n-rank(A),\tag{2}
d im W = n − r ank ( A ) , ( 2 )
其中A是方程组的系数矩阵。从而当齐次线性方程组(1)有非零解时,它的每个基础解系所含解向量的个数都等于n − r a n k ( A ) n-rank(A) n − r ank ( A ) 。
3.8 非齐次线性方程组的解集的结构
对于数域K上n元非齐次线性方程组
x 1 α 1 + ⋯ + x n α n = β (1) x_1\alpha_1+\dots+x_n\alpha_n=\beta \tag{1}
x 1 α 1 + ⋯ + x n α n = β ( 1 )
设其解集为U。为此考虑相应的齐次线性方程组
x 1 α 1 + ⋯ + x n α n = 0 (2) x_1\alpha_1+\dots+x_n\alpha_n=\bold 0\tag{2}
x 1 α 1 + ⋯ + x n α n = 0 ( 2 )
称它为非齐次线性方程组(1)的导出组 。导出组的解空间用W表示。
性质1:若γ , δ ∈ U \gamma,\delta \in U γ , δ ∈ U ,则γ − δ ∈ W . \gamma-\delta \in W. γ − δ ∈ W .
性质2:若 γ ∈ U , η ∈ W , 则 γ + η ∈ U . 若\gamma \in U,\eta \in W,则\gamma+\eta \in U. 若 γ ∈ U , η ∈ W , 则 γ + η ∈ U .
定理1:如果数域K上n元非齐次线性方程组(1)有解,那么它的解集U为
U = { γ 0 + η ∣ η ∈ W } , (3) U=\{\gamma_0+\eta \, | \, \eta \in W\}, \tag{3}
U = { γ 0 + η ∣ η ∈ W } , ( 3 )
其中γ 0 \gamma_0 γ 0 是非齐次线性方程组(1)的一个解(称γ 0 \gamma_0 γ 0 是特解 ),W是方程组(1)的导出组的解空间。
我们把集合{ γ 0 + η ∣ η ∈ W } \{\gamma_0+\eta \, | \, \eta \in W\} { γ 0 + η ∣ η ∈ W } 记作γ 0 + W \gamma_0+W γ 0 + W 。称它是一个W型的线性流形 (或子空间W的一个陪集 ),把d i m W dim\,W d im W 称为线性流形γ 0 + W \gamma_0+W γ 0 + W 的维数。
注:U不是子空间,因为U对于加法和数乘都不封闭。
推论1:如果n元非齐次线性方程组(1)有解,那么它的解唯一的充分必要条件是:它的导出组(2)只有零解。
4 矩阵的运算
4.1 矩阵的运算
1、数域K上两个矩阵称为相等 ,如果它们的行数相等,列数也相等,并且它们的所有元素对应相等。
2、定义1:设A = ( a i j ) , B = ( b i j ) A=(a_{ij}),B=(b_{ij}) A = ( a ij ) , B = ( b ij ) 都是数域K上s × n s \times n s × n 矩阵,令
C = ( a i j + b i j ) s × n , C=(a_{ij}+b_{ij})_{s \times n},
C = ( a ij + b ij ) s × n ,
则称矩阵C是矩阵A与B的和,记作C = A + B C=A+B C = A + B 。
3、定义2:设A = ( a i j ) A=(a_{ij}) A = ( a ij ) 是数域K上s × n s \times n s × n 矩阵,k ∈ K k\in K k ∈ K ,令
M = ( k a i j ) s × n , M=(ka_{ij})_{s \times n},
M = ( k a ij ) s × n ,
则称矩阵M是k与矩阵A的数量乘积 ,记作M = k A M=kA M = k A 。
4、设A = ( a i j ) A=(a_{ij}) A = ( a ij ) ,矩阵( − a i j ) (-a_{ij}) ( − a ij ) 称为A的负矩阵,记作—A。容易验证,矩阵的加法与数量乘法运算满足类似于n维向量的加法与数量乘法所满足的8条运算法则。并可由负矩阵概念定义矩阵减法运算。
5、定义3:设A = ( a i j ) s × n A=(a_{ij})_{s \times n} A = ( a ij ) s × n ,B = ( b i j ) n × m B=(b_{ij})_{n \times m} B = ( b ij ) n × m ,令
C = ( c i j ) s × m , C=(c_{ij})_{s \times m},
C = ( c ij ) s × m ,
其中
c i j = a i 1 b 1 j + a i 2 b 2 j + ⋯ + a i n b n j = ∑ k = 1 n a i k b k j , i = 1 , 2 , … , s ; j = 1 , 2 , … , m . c_{ij}=a_{i1}b_{1j}+a_{i2}b_{2j}+\dots+a_{in}b_{nj}=\sum_{k=1}^n a_{ik}b_{kj}\, ,\,
i=1,2,\dots,s;j=1,2,\dots,m.
c ij = a i 1 b 1 j + a i 2 b 2 j + ⋯ + a in b nj = k = 1 ∑ n a ik b kj , i = 1 , 2 , … , s ; j = 1 , 2 , … , m .
则称矩阵C为矩阵A与矩阵B的乘积,记作C = A B C=AB C = A B 。
注:
(1)只有左矩阵的列数与右矩阵的行数相同的两个矩阵才能相乘;
(2)乘积矩阵的( i , j ) (i,j) ( i , j ) 元等于左矩阵的第i i i 行与右矩阵的第j j j 列的对应元素的乘积之和;
(3)乘积矩阵的行数等于左矩阵的行数,乘积矩阵的列数等于右矩阵的列数。
6、对于A B = 0 AB=0 A B = 0 ,若B ≠ 0 B\not=0 B = 0 ,则称A是一个左零因子 ,若A ≠ 0 A\not=0 A = 0 ,则称B是是一个右零因子 ,左零因子和右零因子统称为零因子 。显然,零矩阵是零因子,称为平凡的零因子 。
7、矩阵的乘法适合结合律 和左右分配律 。另与数量乘法一起满足:k ( A B ) = ( k A ) B = A ( k B ) k(AB)=(kA)B=A(kB) k ( A B ) = ( k A ) B = A ( k B ) 。
8、主对角线上元素都是1,其余元素为0的n级矩阵称为n级单位矩阵 ,记作I n I_n I n ,或简记I I I 。k I kI k I 称为数量矩阵 。
9、若A B = B A AB=BA A B = B A ,则称A与B可交换 。数量矩阵与任一同级矩阵可交换。
10、由于矩阵的乘法适合结合律,因此可定义n级矩阵A的非负整数次幂:
A m = def A ⋅ A ⋅ … ⋅ A , m ∈ Z + ; A 0 = def I . \begin{aligned}
&A^m\xlongequal{\text{def}}A\cdot A\cdot \ldots\cdot A,\,m\in Z^+;\\
&A^0\xlongequal{\text{def}}I.
\end{aligned}
A m def A ⋅ A ⋅ … ⋅ A , m ∈ Z + ; A 0 def I .
容易看出,对于任意自然数k , l k,l k , l 有:
A k A l = A k + l , ( A k ) l = A k l . A^kA^l=A^{k+l},\,(A^k)^l=A^{kl}.
A k A l = A k + l , ( A k ) l = A k l .
注:由于矩阵乘法不满足交换律,故一般来说,( A B ) k ≠ A k B k (AB)^k\not=A^kB^k ( A B ) k = A k B k 。
11、对于矩阵转置有:
( 1 ) ( A + B ) ′ = A ′ + B ′ ; ( 2 ) ( k A ) ′ = k A ′ ; ( 3 ) ( A B ) ′ = B ′ A ′ . \begin{aligned}
(1)\qquad&(A+B)'=A'+B';\\
(2)\qquad&(kA)'=kA';\\
(3)\qquad&(AB)'=B'A'.
\end{aligned}
( 1 ) ( 2 ) ( 3 ) ( A + B ) ′ = A ′ + B ′ ; ( k A ) ′ = k A ′ ; ( A B ) ′ = B ′ A ′ .
4.2 特殊矩阵
1、对角矩阵
定义1:主对角线以外的元素全为0的方阵称为对角矩阵 ,简记作:d i a g { d 1 , d 2 , … , d n } diag\{d_1,d_2,\dots,d_n\} d ia g { d 1 , d 2 , … , d n } 。
命题1:用一个对角矩阵左(右)乘一个矩阵A,就相当于用对角矩阵的主对角元分别去乘A的相应的行(列)。
2、基本矩阵
定义2:只有一个元素是1,其余元素全为0的矩阵称为基本矩阵 。( i , j ) (i,j) ( i , j ) 元为1的基本矩阵记作E i j E_{ij} E ij 。故:
A = ( a i j ) s × n = [ a 11 a 12 . . . a 1 n a 21 a 22 . . . a 2 n ⋮ ⋮ ⋮ a s 1 a s 2 . . . a s n ] = a 11 E 11 + a 12 E 12 + ⋯ + a s n E s n = ∑ i = 1 s ∑ j = 1 n a i j E i j . A=(a_{ij})_{s \times n}=\begin{bmatrix}
a_{11} & a_{12} & ... & a_{1n} \\
a_{21} & a_{22} & ... & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{s1} & a_{s2} & ... & a_{sn}
\end{bmatrix}=a_{11}E_{11}+a_{12}E_{12}+\dots+a_{sn}E_{sn}=\sum_{i=1}^s\sum_{j=1}^n a_{ij}E_{ij}.
A = ( a ij ) s × n = a 11 a 21 ⋮ a s 1 a 12 a 22 ⋮ a s 2 ... ... ... a 1 n a 2 n ⋮ a s n = a 11 E 11 + a 12 E 12 + ⋯ + a s n E s n = i = 1 ∑ s j = 1 ∑ n a ij E ij .
命题2:用E i j E_{ij} E ij 左乘一个矩阵A,就相当于把A的第j行搬到第i行的位置,而乘积矩阵的其余行全为零行;用E i j E_{ij} E ij 右乘一个矩阵A,就相当于把A的第j列搬到第i列的位置,而乘积矩阵的其余列全为零列。故:
E i j E k l = { E i l 当 k = j ; 0 当 k ≠ j . E i j A E k l = a j k E i l . \begin{aligned}
&E_{ij}E_{kl}= \begin{cases}
E_{il}&当k=j; \\
0&当k\not=j.
\end{cases} \\
&E_{ij}AE_{kl}=a_{jk}E_{il}.
\end{aligned}
E ij E k l = { E i l 0 当 k = j ; 当 k = j . E ij A E k l = a jk E i l .
3、上(下)三角矩阵
定义3:主对角线下(上)方元素全为0的方阵称为上(下)三角矩阵。
A为上三角矩阵的充分必要条件:
a i j = 0 , 当 i > j . A = ∑ i = 1 n ∑ j = 1 n a i j E i j . a_{ij}=0,当i>j.\, A=\sum_{i=1}^n\sum_{j=1}^n a_{ij}E_{ij}.
a ij = 0 , 当 i > j . A = i = 1 ∑ n j = 1 ∑ n a ij E ij .
命题3:两个n级上三角矩阵A与B的乘积仍为上三角矩阵,并且AB的主对角线元素等于A与B的相应主对角元的乘积。两个n级下三角矩阵A与B的乘积仍为下三角矩阵,并且AB的主对角线元素等于A与B的相应主对角元的乘积。
4、初等矩阵
定义4:由单位矩阵经过一次初等行(列)变换得到的矩阵称为初等矩阵 。容易得出,初等矩阵只有下面三种类型:
I → ( j ) + ( i ) ⋅ k P ( j , i ( k ) ) , I → ( i , j ) P ( i , j ) , I → ( i ) ⋅ c P ( i ( c ) ) , c ≠ 0 ; \begin{aligned}
&I\xrightarrow{(j)+(i)\cdot k}P(j,i(k)),\\
&I\xrightarrow{(i,j)}P(i,j),\\
&I\xrightarrow{(i)\cdot c}P(i(c)),\, c\not=0;
\end{aligned}
I ( j ) + ( i ) ⋅ k P ( j , i ( k )) , I ( i , j ) P ( i , j ) , I ( i ) ⋅ c P ( i ( c )) , c = 0 ;
设A是一个s × n s \times n s × n 矩阵,它的行向量组是γ 1 , γ 2 , … , γ s \gamma_1,\gamma_2,\dots,\gamma_s γ 1 , γ 2 , … , γ s ;列向量组是α 1 , α 2 , … , α n \alpha_1,\alpha_2,\dots,\alpha_n α 1 , α 2 , … , α n 。则
P ( j , i ( k ) ) A = [ 1 ⋱ 1 ⋮ ⋱ k … 1 ⋱ 1 ] [ γ 1 γ 2 ⋮ γ s ] = [ γ 1 ⋮ γ i ⋮ k γ i + γ j ⋮ γ s ] , A P ( j , i ( k ) ) = ( α 1 , α 2 , … , α n ) [ 1 ⋱ 1 ⋮ ⋱ k … 1 ⋱ 1 ] = ( α 1 , … , α i + k α j , … , α j , … , α n ) \begin{aligned}
&P(j,i(k))A=\begin{bmatrix}
1 & & & & & & \\
&\ddots& & & & & \\
& & 1 & & & & \\
& &\vdots&\ddots& & & \\
& & k &\dots &1 & & \\
& & & & &\ddots& \\
& & & & & & 1
\end{bmatrix}
\begin{bmatrix}
\gamma_1 \\ \gamma_2 \\ \vdots \\ \gamma_s
\end{bmatrix}=
\begin{bmatrix}
\gamma_1 \\ \vdots \\ \gamma_i \\ \vdots \\ k\gamma_i+\gamma_j \\ \vdots \\ \gamma_s
\end{bmatrix} ,\\
&AP(j,i(k))=(\alpha_1,\alpha_2,\dots,\alpha_n)\begin{bmatrix}
1 & & & & & & \\
&\ddots& & & & & \\
& & 1 & & & & \\
& &\vdots&\ddots& & & \\
& & k &\dots &1 & & \\
& & & & &\ddots& \\
& & & & & & 1
\end{bmatrix}=(\alpha_1,\dots,\alpha_i+k\alpha_j,\dots,\alpha_j,\dots,\alpha_n)
\end{aligned}
P ( j , i ( k )) A = 1 ⋱ 1 ⋮ k ⋱ … 1 ⋱ 1 γ 1 γ 2 ⋮ γ s = γ 1 ⋮ γ i ⋮ k γ i + γ j ⋮ γ s , A P ( j , i ( k )) = ( α 1 , α 2 , … , α n ) 1 ⋱ 1 ⋮ k ⋱ … 1 ⋱ 1 = ( α 1 , … , α i + k α j , … , α j , … , α n )
由上诉看出:
用 P ( j , i ( k ) ) 左乘 A ,就相当于把 A 的第 i 行的 k 倍加到第 j 行上,其余行不变; 用 P ( j , i ( k ) ) 右乘 A ,就相当于把 A 的第 j 列的 k 倍加到第 i 列上,其余列不变; 用 P ( i , j ) 左(右)乘 A ,就相当于把 A 的第 i 行(列)与第 j 行(列)互换,其余行(列)不变; 用 P ( i ( c ) ) ( c ≠ 0 ) 左(右)乘 A ,就相当于用 c 乘 A 的第 i 行(列),其余行(列)不变。 \begin{aligned}
&用P(j,i(k))左乘A,就相当于把A的第i行的k倍加到第j行上,其余行不变;\\
&用P(j,i(k))右乘A,就相当于把A的第j列的k倍加到第i列上,其余列不变;\\
&用P(i,j)左(右)乘A,就相当于把A的第i行(列)与第j行(列)互换,其余行(列)不变;\\
&用P(i(c))(c\not=0)左(右)乘A,就相当于用c乘A的第i行(列),其余行(列)不变。
\end{aligned}
用 P ( j , i ( k )) 左乘 A ,就相当于把 A 的第 i 行的 k 倍加到第 j 行上,其余行不变; 用 P ( j , i ( k )) 右乘 A ,就相当于把 A 的第 j 列的 k 倍加到第 i 列上,其余列不变; 用 P ( i , j ) 左(右)乘 A ,就相当于把 A 的第 i 行(列)与第 j 行(列)互换,其余行(列)不变; 用 P ( i ( c )) ( c = 0 ) 左(右)乘 A ,就相当于用 c 乘 A 的第 i 行(列),其余行(列)不变。
定理1:用初等矩阵左(右)乘一个矩阵A,就相当于A作了一次相应的初等行(列)变换。
5、对称矩阵
定义5:一个矩阵A如果满足A ′ = A A'=A A ′ = A ,那么称A是对称矩阵 。
命题4:设A、B都是数域K上的n级对称矩阵,则A + B , k A ( k ∈ K ) A+B,kA(k\in K) A + B , k A ( k ∈ K ) 都是对称矩阵。
命题5:设A、B都是数域K上的n级对称矩阵,则AB为对称矩阵的充分必要条件是A与B可交换。
6、斜对称矩阵
定义6:一个矩阵A如果满足A ′ = − A A'=-A A ′ = − A ,那么称A是斜对称矩阵 。
命题6:数域K上奇数级斜对称矩阵的行列式等于0。
4.3 矩阵乘积的秩与行列式
1、定理1:设A = ( a i j ) s × n , B = ( b i j ) n × m ,则: r a n k ( A B ) ⩽ m i n { r a n k ( A ) , r a n k ( B ) } . A=(a_{ij})_{s \times n},B=(b_{ij})_{n \times m},则:rank(AB)\leqslant min\{rank(A),rank(B)\}. A = ( a ij ) s × n , B = ( b ij ) n × m ,则: r ank ( A B ) ⩽ min { r ank ( A ) , r ank ( B )} .
2、定理2:设A = ( a i j ) n × n , B = ( b i j ) n × n ,则: ∣ A B ∣ = ∣ A ∣ ∣ B ∣ . A=(a_{ij})_{n \times n},B=(b_{ij})_{n \times n},则:|AB|=|A||B|. A = ( a ij ) n × n , B = ( b ij ) n × n ,则: ∣ A B ∣ = ∣ A ∣∣ B ∣.
3、定理3(Binet-Cauchy公式):A = ( a i j ) s × n , B = ( b i j ) n × s , A=(a_{ij})_{s \times n},B=(b_{ij})_{n \times s}, A = ( a ij ) s × n , B = ( b ij ) n × s ,
( 1 ) 如果 s > n ,那么 ∣ A B ∣ = 0 ; ( 2 ) 如果 s ⩽ n ,那么 ∣ A B ∣ 等于 A 的所有 s 阶子式与 B 的相应 s 阶子式的乘积之和,即 ∣ A B ∣ = ∑ 1 ⩽ v 1 < v 2 < ⋯ < v s ⩽ n A ( 1 , 2 , … , s v 1 , v 2 , … , v s ) ⋅ B ( v 1 , v 2 , … , v s 1 , 2 , … , s ) . \begin{aligned}
&(1)如果s>n,那么|AB|=0;\\
&(2)如果s\leqslant n,那么|AB|等于A的所有s阶子式与B的相应s阶子式的乘积之和,即\\
&|AB|=\sum_{1\leqslant v_1<v_2<\dots<v_s\leqslant n} A\begin{pmatrix}
1,2,\dots,s \\
v_1,v_2,\dots,v_s
\end{pmatrix}\cdot B\begin{pmatrix}
v_1,v_2,\dots,v_s \\
1,2,\dots,s
\end{pmatrix}.
\end{aligned}
( 1 ) 如果 s > n ,那么 ∣ A B ∣ = 0 ; ( 2 ) 如果 s ⩽ n ,那么 ∣ A B ∣ 等于 A 的所有 s 阶子式与 B 的相应 s 阶子式的乘积之和,即 ∣ A B ∣ = 1 ⩽ v 1 < v 2 < ⋯ < v s ⩽ n ∑ A ( 1 , 2 , … , s v 1 , v 2 , … , v s ) ⋅ B ( v 1 , v 2 , … , v s 1 , 2 , … , s ) .
4、命题1:设A = ( a i j ) s × n , B = ( b i j ) n × s ,设正整数 r ⩽ s A=(a_{ij})_{s \times n},B=(b_{ij})_{n \times s},设正整数r\leqslant s A = ( a ij ) s × n , B = ( b ij ) n × s ,设正整数 r ⩽ s ,
( 1 ) 如果 r > n ,那么 A B 的所有 r 阶子式都等于 0 ; ( 2 ) 如果 r ⩽ n ,那么 A B 的任一 r 阶子式为 A B ( i 1 , i 2 , … , i r j 1 , j 2 , … , j r ) = ∑ 1 ⩽ v 1 < v 2 < ⋯ < v r ⩽ n A ( i 1 , i 2 , … , i r v 1 , v 2 , … , v r ) ⋅ B ( v 1 , v 2 , … , v r j 1 , j 2 , … , j r ) . \begin{aligned}
&(1)如果r>n,那么AB的所有r阶子式都等于0;\\
&(2)如果r\leqslant n,那么AB的任一r阶子式为\\
&AB\begin{pmatrix}
i_1,i_2,\dots,i_r \\
j_1,j_2,\dots,j_r
\end{pmatrix}=\sum_{1\leqslant v_1<v_2<\dots<v_r\leqslant n} A\begin{pmatrix}
i_1,i_2,\dots,i_r \\
v_1,v_2,\dots,v_r
\end{pmatrix}\cdot B\begin{pmatrix}
v_1,v_2,\dots,v_r \\
j_1,j_2,\dots,j_r
\end{pmatrix}.
\end{aligned}
( 1 ) 如果 r > n ,那么 A B 的所有 r 阶子式都等于 0 ; ( 2 ) 如果 r ⩽ n ,那么 A B 的任一 r 阶子式为 A B ( i 1 , i 2 , … , i r j 1 , j 2 , … , j r ) = 1 ⩽ v 1 < v 2 < ⋯ < v r ⩽ n ∑ A ( i 1 , i 2 , … , i r v 1 , v 2 , … , v r ) ⋅ B ( v 1 , v 2 , … , v r j 1 , j 2 , … , j r ) .
5、矩阵A的一个子式如果行指标与列指标相同,那么称它为A的一个主子式 。
4.4 可逆矩阵
1、定义1:对于数域K上矩阵A,如果存在数域K上矩阵B,使得
A B = B A = I (1) AB=BA=I \tag{1}
A B = B A = I ( 1 )
那么称A是可逆矩阵 (或非奇异矩阵 )。
2、定义2:如果A是可逆矩阵,那么适合(1)式的矩阵B称为A的逆矩阵 ,记作A − 1 A^{-1} A − 1 。A − 1 A^{-1} A − 1 是唯一的。
3、定理1:数域K上n级矩阵A可逆的充分必要条件是∣ A ∣ ≠ 0 |A|\not=0 ∣ A ∣ = 0 。当A可逆时,
A − 1 = 1 ∣ A ∣ A ∗ . (2) A^{-1}=\frac 1 {|A|} A^*. \tag{2}
A − 1 = ∣ A ∣ 1 A ∗ . ( 2 )
称A ∗ A^{*} A ∗ 为A的伴随矩阵 。满足A A ∗ = A ∗ A = ∣ A ∣ I AA^{*}=A^{*}A=|A|I A A ∗ = A ∗ A = ∣ A ∣ I 。
数域K上n级矩阵A可逆的充分必要条件汇总:
数域 K 上 n 级矩阵 A 可逆 ⟺ ∣ A ∣ ≠ 0 ⟺ A 为满秩矩阵 ⟺ A 的行(列)向量组线性无关 ⟺ A 的行(列)向量组为 K n 的一个基 ⟺ A 的行(列)空间等于 K n ⟺ A 可以表示成一些初等矩阵的乘积。 \begin{aligned}
&数域K上n级矩阵A可逆 \\
\iff&|A|\not=0\\
\iff&A为满秩矩阵\\
\iff&A的行(列)向量组线性无关 \\
\iff&A的行(列)向量组为K^{n}的一个基\\
\iff&A的行(列)空间等于K^{n}\\
\iff&A可以表示成一些初等矩阵的乘积。
\end{aligned}
⟺ ⟺ ⟺ ⟺ ⟺ ⟺ 数域 K 上 n 级矩阵 A 可逆 ∣ A ∣ = 0 A 为满秩矩阵 A 的行(列)向量组线性无关 A 的行(列)向量组为 K n 的一个基 A 的行(列)空间等于 K n A 可以表示成一些初等矩阵的乘积。
命题1:设A与B都是数域K上的n级矩阵,如果A B = I AB=I A B = I ,那么A与B都是可逆矩阵,并且A − 1 = B , B − 1 = A A^{-1}=B,B^{-1}=A A − 1 = B , B − 1 = A 。
4、可逆矩阵的性质:
性质 1 :单位矩阵 I 可逆,且 I − 1 = I 。 性质 2 :如果 A 可逆,那么 A − 1 也可逆,且 ( A − 1 ) − 1 = A 。 性质 3 :如果 n 级矩阵 A 、 B 都可逆,那么 A B 也可逆,并且 ( A B ) − 1 = B − 1 A − 1 。推广: ( A 1 A 2 … A s ) − 1 = A s − 1 … A 2 − 1 A 1 − 1 。 性质 4 :如果 A 可逆,那么 A ′ 也可逆,并且 ( A ′ ) − 1 = ( A − 1 ) ′ 。 性质 5 :可逆矩阵经过初等行变换化成的简化行阶梯形矩阵一定是单位矩阵。 性质 6 :矩阵 A 可逆的充分必要条件是它可以表示成一些初等矩阵的乘积。 性质 7 :用一个可逆矩阵左(右)乘一个矩阵 A ,不改变 A 的秩。 \begin{aligned}
&性质1:单位矩阵I可逆,且I^{-1}=I。\\
&性质2:如果A可逆,那么A^{-1}也可逆,且(A^{-1})^{-1}=A。\\
&性质3:如果n级矩阵A、B都可逆,那么AB也可逆,并且(AB)^{-1}=B^{-1}A^{-1}。推广:(A_1A_2\dots A_s)^{-1}=A_s^{-1}\dots A_2^{-1}A_1^{-1}。\\
&性质4:如果A可逆,那么A'也可逆,并且(A')^{-1}=(A^{-1})'。\\
&性质5:可逆矩阵经过初等行变换化成的简化行阶梯形矩阵一定是单位矩阵。\\
&性质6:矩阵A可逆的充分必要条件是它可以表示成一些初等矩阵的乘积。\\
&性质7:用一个可逆矩阵左(右)乘一个矩阵A,不改变A的秩。
\end{aligned}
性质 1 :单位矩阵 I 可逆,且 I − 1 = I 。 性质 2 :如果 A 可逆,那么 A − 1 也可逆,且 ( A − 1 ) − 1 = A 。 性质 3 :如果 n 级矩阵 A 、 B 都可逆,那么 A B 也可逆,并且 ( A B ) − 1 = B − 1 A − 1 。推广: ( A 1 A 2 … A s ) − 1 = A s − 1 … A 2 − 1 A 1 − 1 。 性质 4 :如果 A 可逆,那么 A ′ 也可逆,并且 ( A ′ ) − 1 = ( A − 1 ) ′ 。 性质 5 :可逆矩阵经过初等行变换化成的简化行阶梯形矩阵一定是单位矩阵。 性质 6 :矩阵 A 可逆的充分必要条件是它可以表示成一些初等矩阵的乘积。 性质 7 :用一个可逆矩阵左(右)乘一个矩阵 A ,不改变 A 的秩。
5、初等变换法 求逆矩阵:
( A , I ) → 初等行变换 ( I , A − 1 ) (A,I)\xrightarrow{\text{初等行变换}}(I,A^{-1})
( A , I ) 初等行变换 ( I , A − 1 )
4.5 矩阵的分块
1、对于分块矩阵A = [ A 1 A 2 A 3 A 4 ] , A ′ = [ A 1 ′ A 3 ′ A 2 ′ A 4 ′ ] A=\begin{bmatrix}A_1&A_2\\A_3&A_4 \end{bmatrix},A'=\begin{bmatrix}A_1'&A_3'\\A_2'&A_4' \end{bmatrix} A = [ A 1 A 3 A 2 A 4 ] , A ′ = [ A 1 ′ A 2 ′ A 3 ′ A 4 ′ ] 。
2、分块矩阵相乘需满足下列条件:
( 1 ) 左矩阵的列组数等于右矩阵的行组数; ( 2 ) 左矩阵每个列组所含列数等于右矩阵相应行组所含行数。 \begin{aligned}
&(1)左矩阵的列组数等于右矩阵的行组数;\\
&(2)左矩阵每个列组所含列数等于右矩阵相应行组所含行数。
\end{aligned}
( 1 ) 左矩阵的列组数等于右矩阵的行组数; ( 2 ) 左矩阵每个列组所含列数等于右矩阵相应行组所含行数。
3、命题1:设 A 是 s × n 矩阵, B 是 n × m 矩阵, B 的列向量组为 β 1 , β 2 , … , β m 。则 设A是s \times n矩阵,B是n \times m矩阵,B的列向量组为\beta_1,\beta_2,\dots,\beta_m。则 设 A 是 s × n 矩阵, B 是 n × m 矩阵, B 的列向量组为 β 1 , β 2 , … , β m 。则
A B = A ( β 1 , β 2 , … , β m ) = ( A β 1 , A β 2 , … , A β m ) . AB=A(\beta_1,\beta_2,\dots,\beta_m)=(A\beta_1,A\beta_2,\dots,A\beta_m).
A B = A ( β 1 , β 2 , … , β m ) = ( A β 1 , A β 2 , … , A β m ) .
推论1:设 A s × n ≠ 0 , B n × m 的列向量组是 β 1 , β 2 , … , β m 。则 设A_{s \times n}\not=0,B_{n \times m}的列向量组是\beta_1,\beta_2,\dots,\beta_m。则 设 A s × n = 0 , B n × m 的列向量组是 β 1 , β 2 , … , β m 。则
A B = 0 ⟺ β 1 , β 2 , … , β m 都是齐次线性方程组 A X = 0 的解。 AB=\bold 0\iff\beta_1,\beta_2,\dots,\beta_m 都是齐次线性方程组AX=\bold 0的解。
A B = 0 ⟺ β 1 , β 2 , … , β m 都是齐次线性方程组 A X = 0 的解。
推论2:设 A s × n ≠ 0 , B n × m 的列向量组是 β 1 , β 2 , … , β m ; C s × m 的列向量组是 δ 1 , δ 2 , … , δ m 。则 设A_{s \times n}\not=0,B_{n \times m}的列向量组是\beta_1,\beta_2,\dots,\beta_m;C_{s \times m}的列向量组是\delta_1,\delta_2,\dots,\delta_m。则 设 A s × n = 0 , B n × m 的列向量组是 β 1 , β 2 , … , β m ; C s × m 的列向量组是 δ 1 , δ 2 , … , δ m 。则
A B = C ⟺ β i 是线性方程组 A X = δ i 的一个解, i = 1 , 2 , … , m . AB=C\iff\beta_i是线性方程组AX=\delta_i的一个解,i=1,2,\dots,m.
A B = C ⟺ β i 是线性方程组 A X = δ i 的一个解, i = 1 , 2 , … , m .
4、分块矩阵的初等行变换:
( 1 ) 把一个块行的左 P 倍( P 是矩阵)加到另一个块行上,如 [ A 1 A 2 A 3 A 4 ] → ( 2 ) + P ⋅ ( 1 ) [ A 1 A 2 P A 1 + A 3 P A 2 + A 4 ] ; ( 2 ) 互换两个块行的位置; ( 3 ) 用一个可逆矩阵左乘某一块行(为的是可以把所得到的分块矩阵变回原来的分块矩阵)。 \begin{aligned}
&(1)把一个块行的左P倍(P是矩阵)加到另一个块行上,如\\
&\qquad \begin{bmatrix}A_1&A_2\\A_3&A_4 \end{bmatrix}\xrightarrow{(2)+P\cdot (1)}
\begin{bmatrix}A_1&A_2\\PA_1+A_3&PA_2+A_4 \end{bmatrix};\\
&(2)互换两个块行的位置;\\
&(3)用一个可逆矩阵左乘某一块行(为的是可以把所得到的分块矩阵变回原来的分块矩阵)。
\end{aligned}
( 1 ) 把一个块行的左 P 倍( P 是矩阵)加到另一个块行上,如 [ A 1 A 3 A 2 A 4 ] ( 2 ) + P ⋅ ( 1 ) [ A 1 P A 1 + A 3 A 2 P A 2 + A 4 ] ; ( 2 ) 互换两个块行的位置; ( 3 ) 用一个可逆矩阵左乘某一块行(为的是可以把所得到的分块矩阵变回原来的分块矩阵)。
类似的有分块矩阵的初等列变换。
把单位矩阵分块,并经过一次分块矩阵的初等行(列)变换得到的矩阵称为分块初等矩阵 。
5、分块对角矩阵:d i a g { A 1 , A 2 , … , A s } , 其中 A i 是方阵 , i = 1 , 2 , … , s . diag\{A_1,A_2,\dots,A_s\},其中A_i是方阵,i=1,2,\dots,s. d ia g { A 1 , A 2 , … , A s } , 其中 A i 是方阵 , i = 1 , 2 , … , s .
6、分块上(下)三角矩阵 :主对角线上子矩阵都是方阵,而位于主对角线上(下)方的所有矩阵都为0。
性质:∣ A 0 C B ∣ = ∣ A ∣ ∣ B ∣ . \begin{vmatrix} A&0\\C&B\end{vmatrix}=|A||B|. A C 0 B = ∣ A ∣∣ B ∣.
7、命题2:设 A 、 B 分别是 s × n 、 n × s 矩阵,则 设A、B分别是s \times n、n \times s矩阵,则 设 A 、 B 分别是 s × n 、 n × s 矩阵,则
( 1 ) ∣ I n B A I s ∣ = ∣ I s − A B ∣ ; ( 2 ) ∣ I n B A I s ∣ = ∣ I n − B A ∣ ; ( 3 ) ∣ I s − A B ∣ = ∣ I n − B A ∣ . \begin{aligned}
&(1)\begin{vmatrix} I_n&B\\ A&I_s\end{vmatrix}=|I_s-AB|;\\
&(2)\begin{vmatrix} I_n&B\\ A&I_s\end{vmatrix}=|I_n-BA|;\\
&(3)|I_s-AB|=|I_n-BA|.
\end{aligned}
( 1 ) I n A B I s = ∣ I s − A B ∣ ; ( 2 ) I n A B I s = ∣ I n − B A ∣ ; ( 3 ) ∣ I s − A B ∣ = ∣ I n − B A ∣.
8、命题3:设 A = [ A 1 A 3 0 A 2 ] ,其中 A 1 , A 2 都是方阵。则 A 可逆当且仅当 A 1 , A 2 都可逆,此时 设A=\begin{bmatrix}A_1&A_3\\0&A_2 \end{bmatrix},其中A_1,A_2都是方阵。则A可逆当且仅当A_1,A_2都可逆,此时 设 A = [ A 1 0 A 3 A 2 ] ,其中 A 1 , A 2 都是方阵。则 A 可逆当且仅当 A 1 , A 2 都可逆,此时
A − 1 = [ A 1 − 1 − A 1 − 1 A 3 A 2 − 1 0 A 2 − 1 ] . A^{-1}=\begin{bmatrix}A_1^{-1}&-A_1^{-1}A_3A_2^{-1}\\0&A_2^{-1} \end{bmatrix}.
A − 1 = [ A 1 − 1 0 − A 1 − 1 A 3 A 2 − 1 A 2 − 1 ] .
4.6 正交矩阵⋅ \cdot ⋅ 欧几里得空间R n R^n R n
1、定义1:实数域上的n级矩阵A如果满足:A A ′ = I AA'=I A A ′ = I ,那么称A是正交矩阵。
命题1:实数域上的n级矩阵A是正交矩阵
⟺ A A ′ = I ⟺ A 可逆,且 A − 1 = A ′ ⟺ A ′ A = I \begin{aligned}
&\iff AA'=I\\
&\iff A可逆,且A^{-1}=A'\\
&\iff A'A=I
\end{aligned}
⟺ A A ′ = I ⟺ A 可逆,且 A − 1 = A ′ ⟺ A ′ A = I
正交矩阵具有下列性质:
( 1 ) I 是正交矩阵; ( 2 ) 若 A 和 B 是正交矩阵,则 A B 也是正交矩阵; ( 3 ) 若 A 是正交矩阵,则 A − 1 (即 A ′ )也是正交矩阵; ( 4 ) 若 A 是正交矩阵,则 ∣ A ∣ = 1 或 − 1 。 \begin{aligned}
&(1)I是正交矩阵;\\
&(2)若A和B是正交矩阵,则AB也是正交矩阵;\\
&(3)若A是正交矩阵,则A^{-1}(即A')也是正交矩阵;\\
&(4)若A是正交矩阵,则|A|=1或-1。
\end{aligned}
( 1 ) I 是正交矩阵; ( 2 ) 若 A 和 B 是正交矩阵,则 A B 也是正交矩阵; ( 3 ) 若 A 是正交矩阵,则 A − 1 (即 A ′ )也是正交矩阵; ( 4 ) 若 A 是正交矩阵,则 ∣ A ∣ = 1 或 − 1 。
命题2:设实数域上n级矩阵A的行向量组为γ 1 , … , γ n \gamma_1,\dots,\gamma_n γ 1 , … , γ n ;列向量组为α 1 , … , α n \alpha_1,\dots,\alpha_n α 1 , … , α n 。则
( 1 ) A 为正交矩阵当且仅当 A 的行向量组满足: γ i γ j ′ = { 1 , 当 i = j , 0 , 当 i ≠ j ; ( 1 ) A 为正交矩阵当且仅当 A 的列向量组满足: α i ′ α j = { 1 , 当 i = j , 0 , 当 i ≠ j . \begin{aligned}
&(1)A为正交矩阵当且仅当A的行向量组满足:\gamma_i\gamma_j'=\begin{cases}1,\qquad 当i=j,\\0,\qquad 当i\not=j;\end{cases}\\
&(1)A为正交矩阵当且仅当A的列向量组满足:\alpha_i'\alpha_j=\begin{cases}1,\qquad 当i=j,\\0,\qquad 当i\not=j.\end{cases}
\end{aligned}
( 1 ) A 为正交矩阵当且仅当 A 的行向量组满足: γ i γ j ′ = { 1 , 当 i = j , 0 , 当 i = j ; ( 1 ) A 为正交矩阵当且仅当 A 的列向量组满足: α i ′ α j = { 1 , 当 i = j , 0 , 当 i = j .
引用Kronecker记号δ i j , δ i j = { 1 , 当 i = j , 0 , 当 i ≠ j . \delta_{ij},\delta_{ij}=\begin{cases}1,\qquad 当i=j,\\0,\qquad 当i\not=j.\end{cases} δ ij , δ ij = { 1 , 当 i = j , 0 , 当 i = j . 。故命题2可简记为:
( 1 ) γ i γ j ′ = δ i j , 1 ⩽ i , j ⩽ n ; ( 2 ) α i ′ α j = δ i j , 1 ⩽ i , j ⩽ n ; \begin{aligned}
&(1)\gamma_i\gamma_j'=\delta_{ij},1\leqslant i,j\leqslant n; \\
&(2)\alpha_i'\alpha_j=\delta_{ij},1\leqslant i,j\leqslant n;
\end{aligned}
( 1 ) γ i γ j ′ = δ ij , 1 ⩽ i , j ⩽ n ; ( 2 ) α i ′ α j = δ ij , 1 ⩽ i , j ⩽ n ;
2、定义2:在 R n 中,任给 α = ( a 1 , a 2 , … , a n ) , β = ( b 1 , b 2 , … , b n ) ,规定 在R^n中,任给\alpha=(a_1,a_2,\dots,a_n),\beta=(b_1,b_2,\dots,b_n),规定 在 R n 中,任给 α = ( a 1 , a 2 , … , a n ) , β = ( b 1 , b 2 , … , b n ) ,规定
( α , β ) = def a 1 b 1 + a 2 b 2 + ⋯ + a n b n , (1) (\alpha,\beta)\xlongequal{\text{def}}a_1b_1+a_2b_2+\dots+a_nb_n,\tag{1}
( α , β ) def a 1 b 1 + a 2 b 2 + ⋯ + a n b n , ( 1 )
这个二元实值函数( α , β ) 称为 R n (\alpha,\beta)称为R^n ( α , β ) 称为 R n 的一个内积 (通常也称为标准内积 )。(1)式可写为( α , β ) = α β ′ (\alpha,\beta)=\alpha\beta' ( α , β ) = α β ′ .
可验证R n R^n R n 的标准内积具有以下性质:
( 1 ) ( α , β ) = ( β , α ) ,对称性 ( 2 ) ( α + γ , β ) = ( α , β ) + ( γ , β ) ,线性性 1 ( 3 ) ( k α , β ) = k ( α , β ) ,线性性 2 ( 4 ) ( α , α ) ⩾ 0 ,等号成立当且仅当 α = 0 。(正定性) \begin{aligned}
&(1)(\alpha,\beta)=(\beta,\alpha),对称性\\
&(2)(\alpha+\gamma,\beta)=(\alpha,\beta)+(\gamma,\beta),线性性1\\
&(3)(k\alpha,\beta)=k(\alpha,\beta),线性性2\\
&(4)(\alpha,\alpha)\geqslant 0,等号成立当且仅当\alpha=\bold 0。(正定性)
\end{aligned}
( 1 ) ( α , β ) = ( β , α ) ,对称性 ( 2 ) ( α + γ , β ) = ( α , β ) + ( γ , β ) ,线性性 1 ( 3 ) ( k α , β ) = k ( α , β ) ,线性性 2 ( 4 ) ( α , α ) ⩾ 0 ,等号成立当且仅当 α = 0 。(正定性)
定义了内积之后,n维向量空间R n R^n R n 就被称为一个欧几里得空间 。
在欧几里得空间R n R^n R n 中规定向量α 的长度: ∣ α ∣ = def ( α , α ) . \alpha 的长度:|\alpha|\xlongequal{\text{def}}\sqrt{(\alpha,\alpha)}. α 的长度: ∣ α ∣ def ( α , α ) .
长度为1的向量称为单位向量,把非零向量α \alpha α 乘以1 ∣ α ∣ \frac 1 {|\alpha|} ∣ α ∣ 1 称为把**α \alpha α 单位化**。
如果( α , β ) = 0 (\alpha,\beta)=0 ( α , β ) = 0 ,那么称α 与 β \alpha与\beta α 与 β 是正交 的,记作α ⊥ β \alpha \bot \beta α ⊥ β 。非零向量组成的向量组如果向量两两正交,则称为正交向量组 。类似可定义正交单位向量组 。
命题3:欧几里得空间R n R^n R n 中,正交向量组一定是线性无关的。
根据命题3得,欧几里得空间R n R^n R n 中,n个向量组成的正交向量组一定是R n R^n R n 的一个基,称它为正交基 。n个单位向量组成的向量组称为标准正交基 。
命题4:实数域上n级矩阵A是正交矩阵的充分必要条件为:A的行(列)向量组是欧几里得空间R n R^n R n 的一个标准正交基。
3、定理1:设 α 1 , … , α s 是欧几里得空间 R n 中一个线性无关的向量组,令 设\alpha_1,\dots,\alpha_s是欧几里得空间R^n中一个线性无关的向量组,令 设 α 1 , … , α s 是欧几里得空间 R n 中一个线性无关的向量组,令
β 1 = α 1 β 2 = α 2 − ( α 2 , β 1 ) ( β 1 , β 1 ) β 1 , … β s = α s − ∑ j = 1 s − 1 ( α s , β j ) ( β j , β j ) β j , (2) \begin{aligned}
&\beta_1=\alpha_1\\
&\beta_2=\alpha_2-\frac {(\alpha_2,\beta_1)} {(\beta_1,\beta_1)} \beta_1,\\
&\dots\\
&\beta_s=\alpha_s-\sum_{j=1}^{s-1} \frac {(\alpha_s,\beta_j)} {(\beta_j,\beta_j)} \beta_j,
\end{aligned}\tag{2}
β 1 = α 1 β 2 = α 2 − ( β 1 , β 1 ) ( α 2 , β 1 ) β 1 , … β s = α s − j = 1 ∑ s − 1 ( β j , β j ) ( α s , β j ) β j , ( 2 )
则 β 1 , β 2 , … , β s 是正交向量组,并且 β 1 , β 2 , … , β s 与 α 1 , … , α s 等价。 则\beta_1,\beta_2,\dots,\beta_s是正交向量组,并且\beta_1,\beta_2,\dots,\beta_s与\alpha_1,\dots,\alpha_s等价。 则 β 1 , β 2 , … , β s 是正交向量组,并且 β 1 , β 2 , … , β s 与 α 1 , … , α s 等价。
定理1称为施密特(Schmidt)正交化过程 。只要再进行单位化,就能得到正交单位向量组,即R n R^n R n 的标准正交基。
4.7 从K n 到 K s K^n到K^s K n 到 K s 的线性映射
1、定义1:设S 和 S ′ S和S' S 和 S ′ 是两个集合,如果存在一个对应法则f f f ,使得集合S S S 中每一个元素a,都有集合S ′ S' S ′ 中唯一确定的元素b与之对应,那么称f f f 是集合S S S 到S ′ S' S ′ 的一个映射 ,记作
f : S → S ′ a ↦ b , \begin{aligned}
f:&S\rightarrow S'\\&a\mapsto b,
\end{aligned}
f : S → S ′ a ↦ b ,
其中,b称为a在f f f 下的象 ,a称为b在f f f 下的一个原象 。b在f f f 下的原象集 记作f − 1 ( b ) 。 f^{-1}(b)。 f − 1 ( b ) 。 a在f f f 下的象用符号f ( a ) f(a) f ( a ) 或f a fa f a 表示,于是映射f f f 也可以记成
f ( a ) = b , a ∈ S f(a)=b,a\in S
f ( a ) = b , a ∈ S
2、设f f f 是集合S到集合S’的一个映射,则把S叫做映射f f f 的定义域 ,把S’叫做f f f 的陪域 。S的所有元素在f f f 下的象组成的集合叫做f f f 的值域 或**f f f 的象**,记作f ( S ) f(S) f ( S ) 或Imf f f 。即
f ( S ) = Im f = def { f ( a ) ∣ a ∈ S } = { b ∈ S ′ ∣ 存在 a ∈ S 使 f ( a ) = b } . f(S)=\text{Im}f\xlongequal{\text{def}}\{f(a)\,|\,a\in S\}=\{b\in S'\,|\,存在a\in S使f(a)=b\}.
f ( S ) = Im f def { f ( a ) ∣ a ∈ S } = { b ∈ S ′ ∣ 存在 a ∈ S 使 f ( a ) = b } .
3、设f f f 是集合S到集合S’的一个映射,如果f ( S ) = S ′ f(S)=S' f ( S ) = S ′ ,那么称f f f 是满射 (或f f f 是S到S’上的映射)。f f f 是满射当且仅当f f f 的陪域中每一个元素都有至少一个原象。
如果映射f f f 的定义域S中不同的元素的象也不同,那么称f f f 是单射 (或f f f 是一对一映射)。f f f 是单射当且仅当从a 1 , a 2 ∈ S a_1,a_2\in S a 1 , a 2 ∈ S 且f ( a 1 ) = f ( a 2 ) f(a_1)=f(a_2) f ( a 1 ) = f ( a 2 ) 可以推出a 1 = a 2 。 a_1=a_2。 a 1 = a 2 。
如果映射f f f 既是单射,又是满射,那么称f f f 是双射 (或f f f 是S到S’的一个一一对应)。f f f 是双射当且仅当陪域中每一个元素都有唯一的一个原象。
映射f f f 与映射g g g 称为相等 ,如果他们的定义域相等,陪域相等,并且对应法则相同。(即 ∀ x ∈ S , 有 f ( x ) = g ( x ) 即\forall x\in S,有f(x)=g(x) 即 ∀ x ∈ S , 有 f ( x ) = g ( x ) )。
集合S到自身的一个映射,通常称为S上的一个变换 。
4、定义2:映射f : S → S f:S\rightarrow S f : S → S ,如果把S中每一个元素对应到它自身,即∀ x ∈ S , 有 f ( x ) = x \forall x\in S,有f(x)=x ∀ x ∈ S , 有 f ( x ) = x ,那么称f f f 是恒等映射 (或S上的恒等变换 ),记作:1 s 1_s 1 s 。
5、定义3:相继施行映射g : S → S ′ 和 f : S ′ → S ′ ′ ,得到 S 到 S ′ ′ g:S\rightarrow S'和f:S'\rightarrow S'',得到S到S'' g : S → S ′ 和 f : S ′ → S ′′ ,得到 S 到 S ′′ 的一个映射,称为f 与 g f与g f 与 g 的乘积 (或合成 ),记作f g fg f g 。即
( f g ) ( a ) = def f ( g ( a ) ) , ∀ a ∈ S . (fg)(a)\xlongequal{\text{def}}f(g(a)),\forall a\in S.
( f g ) ( a ) def f ( g ( a )) , ∀ a ∈ S .
定理1:映射的乘法适合结合律。即如果h : S → S ′ , g : S ′ → S ′ ′ , f : S ′ ′ → S ′ ′ ′ h:S\rightarrow S',g:S'\rightarrow S'',f:S''\rightarrow S''' h : S → S ′ , g : S ′ → S ′′ , f : S ′′ → S ′′′ ,那么f ( g h ) = ( f g ) h . f(gh)=(fg)h. f ( g h ) = ( f g ) h .
注意映射的乘法不适合交换律,但对于f : S → S ′ , 有 f 1 s = 1 s f = f . f:S\rightarrow S',有f1_s=1_sf=f. f : S → S ′ , 有 f 1 s = 1 s f = f .
6、定义4:设f : S → S ′ f:S\rightarrow S' f : S → S ′ ,如果存在一个映射g : S ′ → S 使得 f g = g f = 1 s g:S'\rightarrow S使得fg=gf=1_s g : S ′ → S 使得 f g = g f = 1 s ,那么称映射f f f 是可逆的,此时称g 是 f g是f g 是 f 的一个逆映射 。
定理2:映射f : S → S ′ f:S\rightarrow S' f : S → S ′ 是可逆的充分必要条件为f f f 是双射。
7、定义5:数域K上的向量空间K n 到 K s K^n 到K^s K n 到 K s 的一个映射σ \sigma σ 如果保持加法和数量乘法,即∀ α , β ∈ K n , k ∈ K \forall \alpha,\beta \in K^n,k\in K ∀ α , β ∈ K n , k ∈ K ,有
σ ( α + β ) = σ ( α ) + σ ( β ) , σ ( k α ) = k σ ( α ) , \begin{aligned}
\sigma(\alpha+\beta)&=\sigma(\alpha)+\sigma(\beta),\\
\sigma(k\alpha)&=k\sigma(\alpha),
\end{aligned}
σ ( α + β ) σ ( k α ) = σ ( α ) + σ ( β ) , = kσ ( α ) ,
那么称σ 是 K n 到 K s \sigma是K^n 到K^s σ 是 K n 到 K s 的一个线性映射 。
设A是数域K上s × n s \times n s × n 矩阵,令
A : K n → K s α ↦ A α , (1) \begin{aligned}
A:&K^n\rightarrow K^s\\&\alpha\mapsto A\alpha,
\end{aligned}\tag{1}
A : K n → K s α ↦ A α , ( 1 )
则容易验证A是σ 是 K n 到 K s \sigma是K^n 到K^s σ 是 K n 到 K s 的一个线性映射。
事实1:数域K上n元线性方程组A X = β AX=\beta A X = β 有解
⟺ 存在 γ ∈ K n , 使得 A γ = β ⟺ 存在 γ ∈ K n , 使得 A ( γ ) = β ⟺ β ∈ Im A . \begin{aligned}
\iff&存在\gamma \in K^n,使得A\gamma=\beta\\
\iff&存在\gamma \in K^n,使得A(\gamma)=\beta\\
\iff&\beta \in \text{Im}A.
\end{aligned}
⟺ ⟺ ⟺ 存在 γ ∈ K n , 使得 A γ = β 存在 γ ∈ K n , 使得 A ( γ ) = β β ∈ Im A .
事实2:设数域K上s × n s \times n s × n 矩阵A的列向量组是α 1 , … , α n \alpha_1,\dots,\alpha_n α 1 , … , α n ,则
β ∈ Im A ⟺ 线性方程组 A X = β 有解 ⟺ β ∈ < α 1 , … , α n > . \begin{aligned}
&\beta\in \text{Im}A\\
\iff&线性方程组AX=\beta有解\\
\iff&\beta \in <\alpha_1,\dots,\alpha_n>.
\end{aligned}
⟺ ⟺ β ∈ Im A 线性方程组 A X = β 有解 β ∈< α 1 , … , α n > .
因此Im A = < α 1 , … , α n > \qquad \text{Im}A=<\alpha_1,\dots,\alpha_n> Im A =< α 1 , … , α n >
即,由(1)式定义的映射A的象(值域)等于矩阵A的列空间,从而ImA A A 是K s K^s K s 的一个子空间。
事实3:设数域K上齐次线性方程组A X = 0 AX=\bold 0 A X = 0 的解空间是W,则
η ∈ W ⟺ A η = 0 ⟺ A ( η ) = 0. \eta \in W \iff A\eta=\bold 0 \iff A(\eta)=\bold 0.
η ∈ W ⟺ A η = 0 ⟺ A ( η ) = 0 .
8、定义6:设σ 是 K n 到 K s \sigma 是K^n到K^s σ 是 K n 到 K s 的一个映射,K n K^n K n 的一个子集{ α ∈ K n ∣ σ ( α ) = 0 } \{\alpha \in K^n|\sigma(\alpha)=\bold 0\} { α ∈ K n ∣ σ ( α ) = 0 } 称为σ \sigma σ 的核 ,记作:Ker σ \sigma σ
容易验证Ker σ \sigma σ 是K n K^n K n 的一个子空间。
由(1)式定义的线性映射A的核等于齐次线性方程组A X = 0 AX=\bold 0 A X = 0 的解空间。即:Ker σ = W \sigma=W σ = W
综上,有:
d i m Ker A + d i m Im A = d i m K n . dim \,\text{Ker}\,A+dim\,\text{Im}\,A=dim\,K^n.
d im Ker A + d im Im A = d im K n .
5 矩阵的相抵与相似
5.1 等价关系与集合的划分
1、设S,M是两个集合,则集合 { ( a , b ) ∣ a ∈ S , b ∈ W } \{(a,b)|a \in S,b \in W\} {( a , b ) ∣ a ∈ S , b ∈ W } 称为S与M的笛卡儿积 ,记作:S × M S \times M S × M 。
2、定义1:设S是一个非空集合,我们把S × S S \times S S × S 的一个子集W叫做S上的一个二元关系 。如果a , b ) ∈ W a,b)\in W a , b ) ∈ W ,那么称a与b有W关系;反之没有W关系。当a与b有W关系时,记作aWb,或a ∼ b a\sim b a ∼ b 。
3、定义2:集合S上的一个二元关系∼ \sim ∼ 如果具有下述性质:∀ a , b , c ∈ S \forall a,b,c\in S ∀ a , b , c ∈ S ,有
( 1 ) a ∼ a (反身性); ( 2 ) a ∼ b ⟹ b ∼ a (对称性); ( 3 ) a ∼ b 且 b ∼ c ⟹ a ∼ c (传递性)。 \begin{aligned}
&(1)a\sim a &(反身性);\\
&(2)a\sim b\implies b\sim a& (对称性);\\
&(3)a\sim b且b\sim c \implies a\sim c &(传递性)。
\end{aligned}
( 1 ) a ∼ a ( 2 ) a ∼ b ⟹ b ∼ a ( 3 ) a ∼ b 且 b ∼ c ⟹ a ∼ c (反身性); (对称性); (传递性)。
那么称∼ \sim ∼ 是S上的一个等价关系 。
4、定义3:设∼ \sim ∼ 是S上的一个等价关系,a ∈ S a\in S a ∈ S ,令
a ˉ = def { x ∈ S ∣ x ∼ a } , \bar{a}\xlongequal{\text{def}}\{x\in S|x\sim a\},
a ˉ def { x ∈ S ∣ x ∼ a } ,
则称a ˉ \bar{a} a ˉ 是由a a a 确定的等价类 。
事实1:a ∈ a ˉ 于是也把 a ˉ 称为 a 的等价类。 a\in \bar{a}于是也把\bar{a}称为a的等价类。 a ∈ a ˉ 于是也把 a ˉ 称为 a 的等价类。
事实2:x ∈ b a r a ⟺ x ∼ a . x\in bar{a}\iff x\sim a. x ∈ ba r a ⟺ x ∼ a .
事实3:x ˉ = y ˉ ⟺ x ∼ y . \bar{x}=\bar{y}\iff x\sim y. x ˉ = y ˉ ⟺ x ∼ y .
5、定理1:设∼ \sim ∼ 是集合S上的一个等价关系,任取a , b ∈ S a,b\in S a , b ∈ S ,则a ˉ = b ˉ \bar{a}=\bar{b} a ˉ = b ˉ 或者a ˉ ∩ b ˉ = ∅ \bar{a}\cap\bar{b}=\varnothing a ˉ ∩ b ˉ = ∅ .
6、定义4:如果集合S是一些非空子集S i ( i ∈ I ,这里 I 表示指标集) S_i(i\in I,这里I表示指标集) S i ( i ∈ I ,这里 I 表示指标集) 的并集,并且其中不相等的子集一定不相交,那么称集合{ S i ∣ i ∈ I } \{S_i|i\in I\} { S i ∣ i ∈ I } 是S的一个划分 ,记作:π ( S ) \pi(S) π ( S ) 。
7、定理2:设∼ \sim ∼ 是集合S上的一个等价关系,则所有等价类组成的集合是S的一个划分,记作:π ∼ ( S ) \pi_\sim(S) π ∼ ( S ) 。
8、定义5:设∼ \sim ∼ 是集合S上的一个等价关系。由所有等价类组成的集合称为S对于关系∼ \sim ∼ 的商集 ,记作:S / ∼ S/\sim S / ∼ 。
5.2 矩阵的相抵
1、定义1:对于数域K上s × n s \times n s × n 矩阵A和B,如果从A经过一系列初等行变换和初等列变换能变成矩阵B,那么称A与B是相抵 的,记作:A ∼ 相抵 B A\overset{相抵}{\sim}B A ∼ 相抵 B 。
容易验证相抵是M s × n ( K ) M_{s \times n}(K) M s × n ( K ) 上的一个等价关系。在相抵关系下,矩阵A的等价类称为A的相抵类 。
事实1:数域K上s × n s \times n s × n 矩阵A和B相抵
⟺ A 可以经过初等行变换和初等列变换变成 B , ⟺ 存在 K 上 s 级初等矩阵 P 1 , P 2 , … , P t 与 n 级初等矩阵 Q 1 , Q 2 , … , Q m ,使得 P t … P 2 P 1 A Q 1 Q 2 … Q m = B . ⟺ 存在 K 上 s 级可逆矩阵 P 与 n 级可逆矩阵 Q ,使得: P A Q = B . ( 1 ) \begin{aligned}
\iff&A可以经过初等行变换和初等列变换变成B,\\
\iff&存在K上s级初等矩阵P_1,P_2,\dots,P_t与n级初等矩阵Q_1,Q_2,\dots,Q_m,使得\\
&P_t\dots P_2P_1AQ_1Q_2\dots Q_m=B.\\
\iff&存在K上s级可逆矩阵P与n级可逆矩阵Q,使得:\\
&PAQ=B.&(1)
\end{aligned}
⟺ ⟺ ⟺ A 可以经过初等行变换和初等列变换变成 B , 存在 K 上 s 级初等矩阵 P 1 , P 2 , … , P t 与 n 级初等矩阵 Q 1 , Q 2 , … , Q m ,使得 P t … P 2 P 1 A Q 1 Q 2 … Q m = B . 存在 K 上 s 级可逆矩阵 P 与 n 级可逆矩阵 Q ,使得: P A Q = B . ( 1 )
2、定理1:设数域K上s × n s \times n s × n 矩阵A的秩为r。如果r > 0 r>0 r > 0 ,那么A相抵于下述形式的矩阵:
( I r 0 0 0 ) , (2) \begin{pmatrix}
I_r&0\\
0&0
\end{pmatrix},\tag{2}
( I r 0 0 0 ) , ( 2 )
称矩阵(2)为A的相抵标准形 ;如果r=0,那么A相抵于零矩阵,此时称A的相抵标准形是零矩阵。
3、定理2:数域K上s × n s \times n s × n 矩阵A和B相抵当且仅当它们的秩相等。
4、推论1:设数域K上s × n s \times n s × n 矩阵A的秩为r ( r > 0 ) r(r>0) r ( r > 0 ) ,则存在K上的s级、n级可逆矩阵P、Q,使得
A = P ( I r 0 0 0 ) Q . (3) A=P\begin{pmatrix}I_r&0\\0&0\end{pmatrix}Q.\tag{3}
A = P ( I r 0 0 0 ) Q . ( 3 )
5.3 广义逆矩阵
1、定理1:设A是数域K上s × n s \times n s × n 非零矩阵,则矩阵方程
A X A = A (1) AXA=A\tag{1}
A X A = A ( 1 )
一定有解。如果t a n k ( A ) = r tank(A)=r t ank ( A ) = r ,并且
A = P ( I r 0 0 0 ) Q . (2) A=P\begin{pmatrix}I_r&0\\0&0\end{pmatrix}Q.\tag{2}
A = P ( I r 0 0 0 ) Q . ( 2 )
其中P、Q分别是K上s级、n级可逆矩阵,那么矩阵方程(2)的通解为
X = Q − 1 ( I r B C D ) P − 1 (3) X=Q^{-1}\begin{pmatrix}I_r&B\\C&D\end{pmatrix}P_{-1}\tag{3}
X = Q − 1 ( I r C B D ) P − 1 ( 3 )
其中B、C、D分别是数域K上任意的r × ( s − r ) , ( n − r ) × r , ( n − r ) × ( s − r ) r \times (s-r),(n-r) \times r,(n-r)\times (s-r) r × ( s − r ) , ( n − r ) × r , ( n − r ) × ( s − r ) 矩阵。
2、定义1:设A是数域K上s × n s \times n s × n 矩阵,矩阵方程AXA=A的每一个解都称为A的一个广义逆矩阵 ,简称A的广义逆 ,用A − A^- A − 表示A的任意一个广义逆。
任意一个s × n s \times n s × n 矩阵都是0 s × n 0_{s \times n} 0 s × n 的广义逆。
3、定理2(非齐次线性方程组的相容定理):非齐次线性方程组A X = β AX=\beta A X = β 有解的充分必要条件是:
β = A A − β . (4) \beta=AA^-\beta.\tag{4}
β = A A − β . ( 4 )
4、定理3(非齐次线性方程组的解的结构定理):非齐次线性方程组A X = β AX=\beta A X = β 有解时,它的通解为:
X = A − β . (5) X=A^-\beta.\tag{5}
X = A − β . ( 5 )
5、定理4(齐次线性方程组的解的结构定理):数域K上n元齐次线性方程组AX=0 的通解为:
X = ( I n − A − A ) Z . (6) X=(I_n-A^-A)Z.\tag{6}
X = ( I n − A − A ) Z . ( 6 )
其中A − A^- A − 是A的任意给定的一个广义逆,Z取遍K n K^n K n 中任意列向量。
推论1:设数域K上n元非齐次线性方程组A X = β AX=\beta A X = β 有解,则它的通解为
X = A − β + ( I n − A − A ) Z . (7) X=A^-\beta+(I_n-A^-A)Z.\tag{7}
X = A − β + ( I n − A − A ) Z . ( 7 )
其中A − A^- A − 是A的任意给定的一个广义逆,Z取遍K n K^n K n 中任意列向量。
6、定义2:设A是复数域上s × n s \times n s × n 矩阵,矩阵方程组
{ A X A = A X A X = X ( A X ) ∗ = A X ( X A ) ∗ = X A (8) \begin{cases}
AXA&=A\\
XAX&=X\\
(AX)^*&=AX\\
(XA)^*&=XA
\end{cases}\tag{8}
⎩ ⎨ ⎧ A X A X A X ( A X ) ∗ ( X A ) ∗ = A = X = A X = X A ( 8 )
称为A的Penrose 方程组 ,它的解称为A的Moore-Penrose 广义逆 ,记作:A + A^+ A + 。(8)式中( A X ) ∗ (AX)^* ( A X ) ∗ 表示把AX的每个元素取共轭复数得到的矩阵再转置。
7、定理5:如果A是复数域上s × n s \times n s × n 非零矩阵,A的 Penrose 方程组总是有解,并且它的解唯一。设A=BC,其中B、C分别是列满秩与行满秩矩阵,则 Penrose 方程组的唯一解是
X = C ∗ ( C C ∗ ) − 1 ( B ∗ B ) − 1 B ∗ . (9) X=C^*(CC^*)^{-1}(B^*B)^{-1}B^*.\tag{9}
X = C ∗ ( C C ∗ ) − 1 ( B ∗ B ) − 1 B ∗ . ( 9 )
5.4 矩阵的相似
1、定义1:设A与B都是数域K上n级矩阵,如果存在数域K上一个n级可逆矩阵P,使得
P − 1 A P = B , (1) P^{-1}AP=B,\tag{1}
P − 1 A P = B , ( 1 )
那么称A与B是相似 的,记作:A ∼ B A\sim B A ∼ B 。
相似关系是一种等价关系,相似关系下的等价类称为相似类 。相似具有下列性质:
性质1:如果B 1 = P − 1 A 1 P , B 2 = P − 1 A 2 P B_1=P^{-1}A_1P,\,B_2=P^{-1}A_2P B 1 = P − 1 A 1 P , B 2 = P − 1 A 2 P ,那么
B 1 + B 2 = P − 1 ( A 1 + A 2 ) P , B 1 B 2 = P − 1 ( A 1 A 2 ) P , B 1 m = P − 1 A 1 m P , \begin{aligned}
B_1+B_2&=P^{-1}(A_1+A_2)P,\\
B_1B_2&=P^{-1}(A_1A_2)P,\\
B_1^m&=P^{-1}A_1^mP,
\end{aligned}
B 1 + B 2 B 1 B 2 B 1 m = P − 1 ( A 1 + A 2 ) P , = P − 1 ( A 1 A 2 ) P , = P − 1 A 1 m P ,
其中m是正整数。
性质2:相似的矩阵其行列式的值相等。
性质3:相似的矩阵或者都可逆,或者都不可逆;当他们可逆时,它们的你矩阵也相似。
性质4:相似的矩阵有相等的秩。
2、定义2:n级矩阵A = ( a i j ) A=(a_{ij}) A = ( a ij ) 的主对角线上元素的和称为A的迹 ,记作 tr(A)。即
t r ( A ) = a 11 + a 22 + ⋯ + a n n (2) tr(A)=a_{11}+a_{22+\dots+a_{nn}}\tag{2}
t r ( A ) = a 11 + a 22 + ⋯ + a nn ( 2 )
命题1:矩阵的迹具有下列性质:
t r ( A + B ) = t r ( A ) + t r ( B ) , t r ( k A ) = k ⋅ t r ( A ) , t r ( A B ) = t r ( B A ) . \begin{aligned}
tr(A+B)&=tr(A)+tr(B),\\
tr(kA)&=k\cdot tr(A),\\
tr(AB)&=tr(BA).
\end{aligned}
t r ( A + B ) t r ( k A ) t r ( A B ) = t r ( A ) + t r ( B ) , = k ⋅ t r ( A ) , = t r ( B A ) .
由此可见,矩阵的迹是从矩阵乘法的非交换性中提取的可交换的量。
性质5:相似的矩阵有相等的迹。
性质2、4、5表明:矩阵的行列式、秩、迹都是相似关系下的不变量,简称为相似不变量 。
3、如果n级矩阵A能够相似于一个对角矩阵,那么称A可对角化 。
定理1:数域K上n级矩阵可对角化的充分必要条件是,K n K^n K n 中有n个线性无关的列向量α 1 , α 2 , … , α n \alpha_1,\alpha_2,\dots,\alpha_n α 1 , α 2 , … , α n ,以及K中有n个数λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ 1 , λ 2 , … , λ n (它们之中有些可能相等),使得
A α i = λ i α i , i = 1 , 2 , … , n . (3) A\alpha_i=\lambda_i\alpha_i,\qquad i=1,2,\dots,n.\tag{3}
A α i = λ i α i , i = 1 , 2 , … , n . ( 3 )
这时,令P = ( α 1 , α 2 , … , α n ) P=(\alpha_1,\alpha_2,\dots,\alpha_n) P = ( α 1 , α 2 , … , α n ) ,则
P − 1 A P = d i a g { λ 1 , λ 2 , … , λ n } . (4) P^{-1}AP=diag\{\lambda_1,\lambda_2,\dots,\lambda_n\}.\tag{4}
P − 1 A P = d ia g { λ 1 , λ 2 , … , λ n } . ( 4 )
5.5 矩阵的特征值和特征向量
1、定义1:设A是数域K上n级矩阵,如果K n K^n K n 中有非零列向量α \alpha α ,使得
A α = λ 0 α , 且 λ 0 ∈ K , A\alpha=\lambda_0\alpha,且\lambda_0\in K,
A α = λ 0 α , 且 λ 0 ∈ K ,
那么称λ 0 \lambda_0 λ 0 是A的一个特征值 ,称向量α \alpha α 是A的属于特征值λ 0 \lambda_0 λ 0 的一个特征向量 。
如果α \alpha α 是A的属于特征值λ 0 \lambda_0 λ 0 的一个特征向量,那么显然,当k ≠ 0 时, k α k\not=0时,k\alpha k = 0 时, k α 也是A的属于特征值λ 0 \lambda_0 λ 0 的一个特征向量。
注意:零向量不是A的特征向量。
λ 0 是 A 的一个特征值, α 是 A 的属于 λ 0 的一个特征向量 ⟺ A α = λ 0 α , α ≠ 0 , λ 0 ∈ K ⟺ ( λ 0 I − A ) α = 0 , α ≠ 0 , λ 0 ∈ K ⟺ α 是齐次线性方程组 ( λ 0 I − A ) X = 0 的一个非零解, λ 0 ∈ K ⟺ ∣ λ 0 I − A ∣ = 0 , α 是 ( λ 0 I − A ) X = 0 的一个非零解, λ 0 ∈ K ⟺ λ 0 是多项式 ∣ λ I − A ∣ 在 K 中的一个根, α 是 ( λ 0 I − A ) X = 0 的一个非零解。 \begin{aligned}
&\lambda_0是A的一个特征值,\alpha是A的属于\lambda_0的一个特征向量\\
\iff&A\alpha=\lambda_0\alpha,\alpha\not=\bold 0,\lambda_0\in K\\
\iff&(\lambda_0I-A)\alpha=\bold 0,\alpha\not=\bold 0,\lambda_0\in K\\
\iff&\alpha 是齐次线性方程组(\lambda_0I-A)X=\bold 0的一个非零解,\lambda_0\in K\\
\iff&|\lambda_0I-A|=0,\alpha 是(\lambda_0I-A)X=\bold 0的一个非零解,\lambda_0\in K\\
\iff&\lambda_0是多项式|\lambda I-A|在K中的一个根,\alpha 是(\lambda_0I-A)X=\bold 0的一个非零解。
\end{aligned}
⟺ ⟺ ⟺ ⟺ ⟺ λ 0 是 A 的一个特征值, α 是 A 的属于 λ 0 的一个特征向量 A α = λ 0 α , α = 0 , λ 0 ∈ K ( λ 0 I − A ) α = 0 , α = 0 , λ 0 ∈ K α 是齐次线性方程组 ( λ 0 I − A ) X = 0 的一个非零解, λ 0 ∈ K ∣ λ 0 I − A ∣ = 0 , α 是 ( λ 0 I − A ) X = 0 的一个非零解, λ 0 ∈ K λ 0 是多项式 ∣ λ I − A ∣ 在 K 中的一个根, α 是 ( λ 0 I − A ) X = 0 的一个非零解。
把∣ λ I − A ∣ |\lambda I-A| ∣ λ I − A ∣ 称为A的特征多项式 。
2、定理1:设A是数域K上n级矩阵,则
( 1 ) λ 0 是 A 的一个特征值当且仅当 λ 0 是 A 的特征多项式 ∣ λ I − A ∣ 在 K 中的一个根; ( 2 ) α 是 A 的属于特征值 λ 0 的一个特征向量当且仅当 α 是齐次线性方程组 ( λ 0 I − A ) X = 0 的一个非零解。 \begin{aligned}
&(1)\lambda_0 是A的一个特征值当且仅当\lambda_0是A的特征多项式|\lambda I-A|在K中的一个根;\\
&(2)\alpha 是A的属于特征值\lambda_0的一个特征向量当且仅当\alpha是齐次线性方程组(\lambda_0I-A)X=\bold 0的一个非零解。
\end{aligned}
( 1 ) λ 0 是 A 的一个特征值当且仅当 λ 0 是 A 的特征多项式 ∣ λ I − A ∣ 在 K 中的一个根; ( 2 ) α 是 A 的属于特征值 λ 0 的一个特征向量当且仅当 α 是齐次线性方程组 ( λ 0 I − A ) X = 0 的一个非零解。
设λ 0 \lambda_0 λ 0 是A的一个特征值,把齐次线性方程组( λ 0 I − A ) X = 0 (\lambda_0I-A)X=\bold 0 ( λ 0 I − A ) X = 0 的解空间称为A的属于λ 0 \lambda_0 λ 0 的特征子空间 ,其中全部非零向量就是A的属于λ 0 \lambda_0 λ 0 的全部特征向量。
相似矩阵性质:
性质1:相似的矩阵具有相等的特征多项式。
性质2:相似的矩阵有相同的特征值(包括重复特征值数量,简称重数相同)。
由性质1、2看出,矩阵的特征多项式和特征值都是相似不变量。
命题1:设A是数域K上n级矩阵,则A的特征多项式∣ λ I − A ∣ |\lambda I-A| ∣ λ I − A ∣ 是一个n次多项式,λ n \lambda^n λ n 的系数是1,λ n − 1 \lambda^{n-1} λ n − 1 的系数是等于-tr(A),常数项为( − 1 ) n ∣ A ∣ , λ n − k (-1)^n|A|,\lambda^{n-k} ( − 1 ) n ∣ A ∣ , λ n − k 的系数为A的所有k阶主子式的和乘以( − 1 ) k , 1 ⩽ k < n (-1)^k,1\leqslant k<n ( − 1 ) k , 1 ⩽ k < n 。
3、定义2:设A是数域K上n级矩阵,λ 1 \lambda_1 λ 1 是A的一个特征值。把A的属于λ 1 \lambda_1 λ 1 的特征子空间的维数叫做特征值λ 1 \lambda_1 λ 1 的几何重数 ,而把λ 1 \lambda_1 λ 1 作为作为A的特征多项式的根的重数叫做λ 1 \lambda_1 λ 1 的代数重数 ,把代数重数简称为重数。
命题2:设λ 1 \lambda_1 λ 1 是数域K上n级矩阵A的一个特征值,则λ 1 \lambda_1 λ 1 的几何重数不超过它的代数重数。
5.6 矩阵可对角化的条件
1、定理1:数域K上n级矩阵A可对角化的充分必要条件是A有n个线性无关的特征向量α 1 , α 2 , … , α n \alpha_1,\alpha_2,\dots,\alpha_n α 1 , α 2 , … , α n ,此时
令 P = ( α 1 , α 2 , … , α n ) , 则 P − 1 A P = d i a g { λ 1 , λ 2 , … , λ n } , \begin{aligned}
&令&P&=(\alpha_1,\alpha_2,\dots,\alpha_n),\\
&则&P^{-1}AP&=diag\{\lambda_1,\lambda_2,\dots,\lambda_n \},
\end{aligned}
令 则 P P − 1 A P = ( α 1 , α 2 , … , α n ) , = d ia g { λ 1 , λ 2 , … , λ n } ,
其中λ i \lambda_i λ i 是α i \alpha_i α i 所属的特征值,i = 1 , 2 , … , n i=1,2,\dots,n i = 1 , 2 , … , n 。上述对角矩阵称为A 的相似标准形 ,除了主对角线上元素的排列次序外,A的相似标准形是唯一的。
2、定理2:设λ 1 , λ 2 \lambda_1,\lambda_2 λ 1 , λ 2 是数域K上n级矩阵A的不同的特征值,α 1 , α 2 , … , α s 与 β 1 , β 2 , … , β r \alpha_1,\alpha_2,\dots,\alpha_s与\beta_1,\beta_2,\dots,\beta_r α 1 , α 2 , … , α s 与 β 1 , β 2 , … , β r 分别是A的属于λ 1 , λ 2 \lambda_1,\lambda_2 λ 1 , λ 2 的线性无关的特征向量,则α 1 , α 2 , … , α s , β 1 , β 2 , … , β r \alpha_1,\alpha_2,\dots,\alpha_s,\beta_1,\beta_2,\dots,\beta_r α 1 , α 2 , … , α s , β 1 , β 2 , … , β r 线性无关。
3、定理3:设λ 1 , λ 2 , … , λ m \lambda_1,\lambda_2,\dots,\lambda_m λ 1 , λ 2 , … , λ m 是数域K上n级矩阵A的不同的特征值,α j 1 , … , α j r j \alpha_{j1},\dots,\alpha_{jr_j} α j 1 , … , α j r j 是A的属于λ j \lambda_j λ j 的线性无关的特征向量,j = 1 , 2 , … , m j=1,2,\dots,m j = 1 , 2 , … , m 。则向量组
α 11 , … , α a r 1 , … … , α m 1 , … , α m r m \alpha_{11},\dots,\alpha_{ar_1},\dots\dots,\alpha_{m1},\dots,\alpha_{mr_m}
α 11 , … , α a r 1 , …… , α m 1 , … , α m r m
线性无关。
推论1:n级矩阵A的属于不同特征值的特征向量是线性无关的。
4、定理4:数域K上n级矩阵A可对角化的充分必要条件是:A的属于不同特征值的特征子空间的维数之和等于n。
推论2:数域K上n级矩阵A如果有n个不同的特征值,那么A可对角化。
5、定理5:数域K上n级矩阵A可对角化的充分必要条件是:A的特征多项式的全部复根都属于K,并且A的每个特征值的几何重数等于它的代数重数。
5.7 实对称矩阵的对角化
1、定义1:实数域上的矩阵简称为实对称矩阵。
定理1:实对称矩阵的特征多项式的每一个复根都是实数,从而它们都是特征值。
2、定理2:实对称矩阵A的属于不同特征值的特征向量是正交的。
3、定义2:如果对于n级实矩阵A、B,存在一个n级正交矩阵T,使得T − 1 A T = B T^{-1}AT=B T − 1 A T = B ,那么称A正交相似 于B。
定理3:实对称矩阵一定正交相似于对角矩阵。
命题1:如果n级实矩阵A正交相似于一个对角矩阵D,那么A一定是对称矩阵。
命题2:两个n级实对称矩阵正交相似的充分必要条件是它们相似。
6 二次型⋅ \cdot ⋅ 矩阵的合同
6.1 二次型及其标准形
1、定义1:数域K上一个n元二次型 是系数在K中的n个变量的二次齐次多项式,它的一般形式是
f ( x 1 , x 2 , … , x n ) = a 11 x 1 2 + 2 a 12 x 1 x 2 + 2 a 13 x 1 x 3 + ⋯ + 2 a 1 n x 1 x n + a 22 x 2 2 + 2 a 23 x 2 x 3 + ⋯ + 2 a 2 n x 2 x n + ⋯ ⋯ ⋯ + a n n x n 2 (1) \begin{aligned}
&f(x_1,x_2,\dots,x_n)=&a_{11}x_1^2+2a_{12}x_1x_2+2a_{13}x_1x_3+\cdots+2a_{1n}x_1x_n&\\
&&+a_{22}x_2^2+2a_{23}x_2x_3+\cdots+2a_{2n}x_2x_n&\\
&&+\cdots\qquad\cdots\qquad\cdots\qquad&\\
&&+a_{nn}x_n^2
\end{aligned}\tag{1}
f ( x 1 , x 2 , … , x n ) = a 11 x 1 2 + 2 a 12 x 1 x 2 + 2 a 13 x 1 x 3 + ⋯ + 2 a 1 n x 1 x n + a 22 x 2 2 + 2 a 23 x 2 x 3 + ⋯ + 2 a 2 n x 2 x n + ⋯ ⋯ ⋯ + a nn x n 2 ( 1 )
(1)式也可以写成
f ( x 1 , x 2 , … , x n ) = ∑ i = 1 n ∑ j = 1 n a i j x i x j , (2) f(x_1,x_2,\dots,x_n)=\sum_{i=1}^n\sum_{j=1}^na_{ij}x_ix_j,\tag{2}
f ( x 1 , x 2 , … , x n ) = i = 1 ∑ n j = 1 ∑ n a ij x i x j , ( 2 )
其中a i j = a j i , 1 ⩽ i , j ⩽ n a_{ij}=a_{ji},1\leqslant i,j\leqslant n a ij = a ji , 1 ⩽ i , j ⩽ n 。把(2)式中的系数按原来顺序排成一个n级矩阵A:
A = [ a 11 a 12 a 13 ⋯ a 1 n a 21 a 22 a 23 ⋯ a 2 n ⋮ ⋮ ⋮ ⋮ a n 1 a n 2 a n 3 ⋯ a n n ] , (3) A=\begin{bmatrix}
a_{11}&a_{12}&a_{13}&\cdots&a_{1n}\\
a_{21}&a_{22}&a_{23}&\cdots&a_{2n}\\
\vdots&\vdots&\vdots&&\vdots\\
a_{n1}&a_{n2}&a_{n3}&\cdots&a_{nn}
\end{bmatrix},\tag{3}
A = a 11 a 21 ⋮ a n 1 a 12 a 22 ⋮ a n 2 a 13 a 23 ⋮ a n 3 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a nn , ( 3 )
则称A是二次型f ( x 1 , x 2 , … , x n ) f(x_1,x_2,\dots,x_n) f ( x 1 , x 2 , … , x n ) 的矩阵 ,它是对称矩阵。显然二次型f ( x 1 , x 2 , … , x n ) f(x_1,x_2,\dots,x_n) f ( x 1 , x 2 , … , x n ) 的矩阵是唯一的。令
X = [ x 1 x 2 ⋮ x n ] , (4) X=\begin{bmatrix}x_1\\x_2\\\vdots\\x_n \end{bmatrix},\tag{4}
X = x 1 x 2 ⋮ x n , ( 4 )
则二次型(1)可写成
f ( x 1 , x 2 , … , x n ) = X ′ A X , (5) f(x_1,x_2,\dots,x_n)=X'AX,\tag{5}
f ( x 1 , x 2 , … , x n ) = X ′ A X , ( 5 )
其中A是二次型f ( x 1 , x 2 , … , x n ) f(x_1,x_2,\dots,x_n) f ( x 1 , x 2 , … , x n ) 的矩阵。
令Y = ( y 1 , y 2 , ⋯ , y n ) ′ Y=(y_1,y_2,\cdots,y_n)' Y = ( y 1 , y 2 , ⋯ , y n ) ′ ,设C是数域K上的n级可逆矩阵,则关系式
X = C Y (6) X=CY\tag{6}
X = C Y ( 6 )
称为变量x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x 1 , x 2 , … , x n 到变量y 1 , y 2 , ⋯ , y n y_1,y_2,\cdots,y_n y 1 , y 2 , ⋯ , y n 的一个非退化线性变换 。
2、定义2:数域K上两个n元二次型X ′ A X 与 Y ′ B Y X'AX与Y'BY X ′ A X 与 Y ′ B Y ,如果存在一个非退化线性变换X = C Y X=CY X = C Y ,把X ′ A X 变成 Y ′ B Y X'AX变成Y'BY X ′ A X 变成 Y ′ B Y ,那么称二次型X ′ A X 与 Y ′ B Y X'AX与Y'BY X ′ A X 与 Y ′ B Y 等价 ,记作:X ′ A X ≅ Y ′ B Y X'AX\cong Y'BY X ′ A X ≅ Y ′ B Y 。
3、定义3:数域K上两个n级矩阵A与B,如果存在K上一个n级可逆矩阵C,使得
C ′ A C = B , (7) C'AC=B,\tag{7}
C ′ A C = B , ( 7 )
那么称A与B合同 ,记作:A ⋍ B A\backsimeq B A ⋍ B 。
4、命题1:数域K上两个n元二次型X ′ A X 与 Y ′ B Y X'AX与Y'BY X ′ A X 与 Y ′ B Y 等价当且仅当n级对称矩阵A与B合同。
5、合同关系下,A的等价类称为A的合同类 。
6、如果二次型X ′ A X X'AX X ′ A X 等价于一个只含平方项的二次型,那么这个只含平方项的二次型称为X ′ A X X'AX X ′ A X 的一个标准形 。
7、如果对称矩阵A合同于一个对角矩阵,那么这个对角矩阵称为A的一个合同标准形 。
8、命题2:实数域上n元二次型X ′ A X X'AX X ′ A X 有一个标准形为
λ 1 y 1 2 + λ 2 y 2 2 + ⋯ + λ n y n 2 , (8) \lambda_1y_1^2+\lambda_2y_2^2+\cdots+\lambda_ny_n^2,\tag{8}
λ 1 y 1 2 + λ 2 y 2 2 + ⋯ + λ n y n 2 , ( 8 )
其中λ 1 , λ 2 , ⋯ , λ n \lambda_1,\lambda_2,\cdots,\lambda_n λ 1 , λ 2 , ⋯ , λ n 是A的全部特征值。
9、如果T是正交矩阵,那么变量的替换X = T X X=TX X = TX 称为正交替换 。
10、引理1:设A、B都是数域K上n级矩阵,则A合同于B当且仅当A经过一系类成对初等行、列变换可以变成B,此时对I I I 只作其中的初等列变换得到的可逆矩阵C,就使得C ′ A C = B C'AC=B C ′ A C = B 。
定理1:数域K上任一对称矩阵都合同于一个对角矩阵。
11、定理2:数域K上任一n元二次型都等价于一个只含平方项的二次型。
命题3:数域K上n元二次型X ′ A X X'AX X ′ A X 的任一标准形中,系数不为0的平方项个数等于它的矩阵A的秩,这个秩也称为二次型X ′ A X X'AX X ′ A X 的秩 。
6.2 实二次型的规范型
n元二次型X ′ A X X'AX X ′ A X 经过一个适当的非退化线性替换X = C Y X=CY X = C Y 可以化成下述形式的标准形:
d 1 y 1 2 + ⋯ + d p y p 2 − d p + 1 y p + 1 2 − ⋯ − d r y r 2 , (1) d_1y_1^2+\cdots+d_py_p^2-d_{p+1}y_{p+1}^2-\cdots-d_ry_r^2,\tag{1}
d 1 y 1 2 + ⋯ + d p y p 2 − d p + 1 y p + 1 2 − ⋯ − d r y r 2 , ( 1 )
其中d i > 0 , i = 1 , 2 , ⋯ , r d_i>0,i=1,2,\cdots,r d i > 0 , i = 1 , 2 , ⋯ , r 。易知这个二次型的秩为r。再作一个非退化线性替换:
y i = 1 d i z i , i = 1 , 2 , ⋯ , r . y j = z j , j = r + 1 , ⋯ , n . (2) \begin{aligned}
y_i&=\frac 1 {\sqrt{d_i}}z_i,\qquad i=1,2,\cdots,r.\\
y_j&=z_j,\qquad j=r+1,\cdots,n.
\end{aligned}\tag{2}
y i y j = d i 1 z i , i = 1 , 2 , ⋯ , r . = z j , j = r + 1 , ⋯ , n . ( 2 )
则二次型(1)可变成
z 1 2 + ⋯ + z p 2 − z p + 1 2 − ⋯ − z r 2 . (3) z_1^2+\cdots+z_p^2-z_{p+1}^2-\cdots-z_r^2.\tag{3}
z 1 2 + ⋯ + z p 2 − z p + 1 2 − ⋯ − z r 2 . ( 3 )
因此二次型X ′ A X X'AX X ′ A X 有形如(2)式的一个标准形,称它为二次型X ′ A X X'AX X ′ A X 的规范形 ,它的特征是:只含平方项,且平方项的系数为1.-1或0;系数为1的平方项都在前面。实二次型X ′ A X X'AX X ′ A X 的规范形(2)被两个自然数p和r决定。
若X ′ A X X'AX X ′ A X 为复二次型,由于复数域负数可开根号,在经过形如(2)式的非线性退化过程可消去每项的正负性,从而得到下述形式标准形:
z 1 2 + z 2 2 + ⋯ + z r 2 . (4) z_1^2+z_2^2+\cdots+z_r^2.\tag{4}
z 1 2 + z 2 2 + ⋯ + z r 2 . ( 4 )
把这个标准形叫做复二次型X ′ A X X'AX X ′ A X 的规范形。它的特征是:只含平方项,且平方项的系数为1或0.显然,复二次型X ′ A X X'AX X ′ A X 的规范形完全由它的秩决定。
1、定理1(惯性定理):n元实二次型X ′ A X X'AX X ′ A X 的规范形是唯一的。
2、定义1:在实二次型X ′ A X X'AX X ′ A X 的规范形中,系数为+1的平方项个数为p称为X ′ A X X'AX X ′ A X 的正惯性指数 ,系数为-1的平方项个数r-1称为X ′ A X X'AX X ′ A X 的负惯性指数 ;正惯性指数减去负惯性指数所得的差2p-r称为X ′ A X X'AX X ′ A X 的符号差 。
命题1:两个n元实二次型等价
⟺ 它们的规范形相同 ⟺ 它们的秩相等,并且正惯性指数也相等。 \begin{aligned}
\iff&它们的规范形相同\\
\iff&它们的秩相等,并且正惯性指数也相等。
\end{aligned}
⟺ ⟺ 它们的规范形相同 它们的秩相等,并且正惯性指数也相等。
推论1:任一n级实对称矩阵A合同于对角矩阵d i a g { 1 , ⋯ , 1 , − 1 , ⋯ , − 1 , 0 , ⋯ , 0 } diag\{1,\cdots,1,-1,\cdots,-1,0,\cdots,0\} d ia g { 1 , ⋯ , 1 , − 1 , ⋯ , − 1 , 0 , ⋯ , 0 } ,其中1的个数等于X ′ A X X'AX X ′ A X 的正惯性指数,-1的个数等于X ′ A X X'AX X ′ A X 的负惯性指数(分别把它们称为A的正惯性指数和负惯性指数),这个对角矩阵称为A的合同规范形 。
推论2:两个n级实对称矩阵合同等价于:它们的秩相等,并且正惯性指数也相等。秩和正惯性指数是合同关系下的一组完全不变量。
3、定理2:复二次型X ′ A X X'AX X ′ A X 的规范形是唯一的。
命题2:两个n元复二次型等价
⟺ 它们的规范形相同 ⟺ 它们的秩相等。 \begin{aligned}
\iff&它们的规范形相同\\
\iff&它们的秩相等。
\end{aligned}
⟺ ⟺ 它们的规范形相同 它们的秩相等。
推论3:任一n级复对称矩阵A合同于对角阵:
( I r 0 0 0 ) , \begin{pmatrix}I_r&0\\0&0 \end{pmatrix},
( I r 0 0 0 ) ,
其中r=rank(A)。
推论4:两个n级复对称矩阵合同等价于:它们的秩相等。
6.3 正定二次型与正定矩阵
1、定义1:实二次型X ′ A X X'AX X ′ A X 称为正定 的,如果对于R n R^n R n 中任意非零列向量α \alpha α ,都有α ′ A α > 0 \alpha 'A\alpha>0 α ′ A α > 0 。
2、定理1:n元实二次型X ′ A X X'AX X ′ A X 是正定的当且仅当它的正惯性指数等于n。
推论1:n元实二次型X ′ A X X'AX X ′ A X 是正定的
⟺ 它的规范形为: y 1 2 + y 2 2 + ⋯ + y n 2 ⟺ 它的标准形中 n 个系数全大于 0 \begin{aligned}
\iff&它的规范形为:y_1^2+y_2^2+\cdots+y_n^2\\
\iff&它的标准形中n个系数全大于0
\end{aligned}
⟺ ⟺ 它的规范形为: y 1 2 + y 2 2 + ⋯ + y n 2 它的标准形中 n 个系数全大于 0
3、定义2:实对称矩阵A称为正定的,如果实二次型X ′ A X X'AX X ′ A X 是正定的。即对于R n R^n R n 中任意非零列向量α \alpha α ,有α ′ A α > 0 \alpha 'A\alpha>0 α ′ A α > 0 。
4、定理2:n级实对称矩阵A是正定的
⟺ A 的正惯性指数等于 n ⟺ A ⋍ I ⟺ A 的合同标准形中主对角元全大于 0 ⟺ A 的特征值全大于 0 \begin{aligned}
\iff&A的正惯性指数等于n\\
\iff&A\backsimeq I\\
\iff&A的合同标准形中主对角元全大于0\\
\iff&A的特征值全大于0
\end{aligned}
⟺ ⟺ ⟺ ⟺ A 的正惯性指数等于 n A ⋍ I A 的合同标准形中主对角元全大于 0 A 的特征值全大于 0
推论2:与正定矩阵合同的实对称矩阵也是正定矩阵。
推论3:与正定二次型等价的实二次型也是正定的,从而非退化线性替换不改变实二次型的正定性。
推论4:正定矩阵的行列式大于0.
5、定理3:实对称矩阵A是正定的充分必要条件是:A的所有顺序主子式全大于0。
推论5:实二次型X ′ A X X'AX X ′ A X 是正定的充分必要条件是:A的所有顺序主子式全大于0。
6、定义3:n元实二次型X ′ A X X'AX X ′ A X 称为是**半正定(负定,半负定)**的,如果对于R n R^n R n 中任意非零列向量α \alpha α ,有
α ′ A α ⩾ 0 ( α ′ A α < 0 , α ′ A α ⩽ 0 ) \alpha 'A\alpha\geqslant0(\alpha 'A\alpha<0,\alpha 'A\alpha\leqslant0)
α ′ A α ⩾ 0 ( α ′ A α < 0 , α ′ A α ⩽ 0 )
如果X ′ A X X'AX X ′ A X 既不是半正定的,又不是半负定的,那么称它是不定的 。
定义4:实对称矩阵A称为**半正定(负定,半负定,不定)的,如果实二次型X ′ A X X'AX X ′ A X 是 半正定(负定,半负定,不定)**的。
7、定理4:
( 1 ) n 元实二次型 X ′ A X 是半正定的 ⟺ ( 2 ) 它的正惯性指数等于它的秩 ⟺ ( 3 ) 它的规范形是 y 1 2 + y 2 2 + ⋯ + y n 2 ( 0 ⩽ r ⩽ n ) ⟺ ( 4 ) 它的标准形中 n 个系数全非负。 \begin{aligned}
&(1)n元实二次型X'AX是半正定的\\
\iff &(2)它的正惯性指数等于它的秩\\
\iff&(3)它的规范形是y_1^2+y_2^2+\cdots+y_n^2(0\leqslant r\leqslant n)\\
\iff&(4)它的标准形中n个系数全非负。
\end{aligned}
⟺ ⟺ ⟺ ( 1 ) n 元实二次型 X ′ A X 是半正定的 ( 2 ) 它的正惯性指数等于它的秩 ( 3 ) 它的规范形是 y 1 2 + y 2 2 + ⋯ + y n 2 ( 0 ⩽ r ⩽ n ) ( 4 ) 它的标准形中 n 个系数全非负。
推论6:
实对称矩阵 A 是半正定的 ⟺ A ⋍ ( I r 0 0 0 ) ,其中 r = r a n k ( A ) ⟺ A 的合同标准形中 n 个系数全非负 ⟺ A 的特征值全非负。 \begin{aligned}
&实对称矩阵A是半正定的\\
\iff&A\backsimeq \begin{pmatrix}I_r&0\\0&0\end{pmatrix},其中r=rank(A)\\
\iff&A的合同标准形中n个系数全非负\\
\iff&A的特征值全非负。
\end{aligned}
⟺ ⟺ ⟺ 实对称矩阵 A 是半正定的 A ⋍ ( I r 0 0 0 ) ,其中 r = r ank ( A ) A 的合同标准形中 n 个系数全非负 A 的特征值全非负。
8、定理5:实对称矩阵A是半正定的当且仅当A的所有主子式全非负。
9、定理6:实对称矩阵A负定的充分必要条件是:它的奇数阶顺序主子式全小于0,偶数阶顺序主子式全大于0。
10、何塞矩阵(略)。