3. Матрицы и определители.


3.1. Сложение и умножение матриц.


3.1.1. Пункт 2.5.4. оправдывает следуещее определение суммы и произведения матриц: если $A = (a_{ij})_{m\times n}\ , B = (b_{ij})_{m\times n}$, то $A+B\ =\ S\ =\ (s_{ij})_{m\times n}$, где $s_{ij}\ =\ a_{ij} +b_{ij}$ при всех i и j (при этом предполагается, что сложение элементов aij и bij определено); если $A\ =\ (a_{ij})_{m\times n},\ B\ =\ (b_{jk})_{n\times s}$ , то $AB\ =\ P\ =\ (p_{ik})_{m\times s}$ , где

\begin{displaymath}p_{ik}\ =\ a_{i1} b_{1k} +a_{i2} b_{2k} +...+a_{in} b_{nk}\end{displaymath}

при всех i и k (здесь тоже предполагается, что это выражение имеет смысл).


Примеры.


1. Пусть A -- матрица линейного отображения $\varphi$ пространства kn в km относительно стандартных баз. Тогда для любой строки $v\in k^n$ имеет место равенство $v\varphi\ =\ vA$.


2. Пусть V -- пространство над k с базой ${\cal V}\ =\
\{v_1 ,v_2 ,...,v_n \},\ U$ -- пространство над k с базой ${\cal U}\ =\
\{u_1 ,u_2 ,...,u_m \}$. Пусть A -- матрица линейного отображения $\varphi$ пространства V в U относительно этих баз и пусть

$v\ = \
\left[
\begin{array}{l}
v_1\\ v_2\\ ...\\ v_n
\end{array}
\right] ,...
...
u\ = \
\left[
\begin{array}{l}
u_1\\ u_2\\ ...\\ u_m
\end{array}
\right]$.
Тогда $v\varphi = Au$.


3. Линейная комбинация a1 v1 +a2 v2 +...+an vn равна

$(a_1,a_2,...,a_n)
\left[
\begin{array}{l}
v_1\\ v_2\\ ...\\ v_n
\end{array}
\right]$.
Отметим, что складываются матрицы одного размера, а умножаются матрицы, вообще говоря, разных, но согласованных размеров. Наиболее интересен и важен тот частный случай, когда рассматриваются $(n\times n)$-матрицы (такие матрицы называются квадратными и для них число n называется размерностью) над множеством, в котором определены операции сложения и умножения, близкие по своим алгебраическим свойствам к сложению и умножению чисел.


3.1.2. Напомним, что множество S относительно определенных на нем операций сложения и умножения называется кольцом, если эти операции удовлетворяют условиям:


(ЗС) если $x,y\in S$, то $x+y\in S$ (замкнутость S относительно сложения);


(ЗУ) если $x,y\in S$, то $x\cdot y\in S$ (замкнутость S относительно умножения);


(АС) если $x,y,z\in S$, то $(x+y)+z\ =\ x+(y+z)$ (ассоциативность сложения в S);


(СН) в S существует нулевой элемент, то есть такой элемент $n\in S$, что для любого $x\in S$ имеет место равенство:

\begin{displaymath}x+n\ =\ n+x\ =\ x\end{displaymath}

(существование нуля). Этот элемент единственный, его обозначают символом 0.


(СП) Для любого элемента a из S найдется такой элемент $x\in S$, что

\begin{displaymath}a+x\ =\ x+a\ =\ n\end{displaymath}

(существование противоположного элемента). Этот элемент обозначается как -a.


(АУ) если $x,y,z\in S$, то $(x\cdot y)\cdot z = x\cdot (y\cdot z)$ (ассоциативность умножения в S);


(КС) если $x,y\in S$, то $x+y\ =\ y+x$ (коммутативность сложения в S);


(ЛД) если $x,y,z\in S$, то $ x(y+z)\ =\ xy+xz$ (левая дистрибутивность);


(ПД) если $x,y,z\in S$, то $(x+y)\cdot z\ =\ xz+yz$ (правая дистрибутивность);


Теорема. Пусть S -- кольцо, $n\in$N. Тогда множество $M_n(S)\ =\ M_{n\times n}(S)$ всех квадратных матриц размерности n над S -- кольцо относительно операций сложения и умножения матриц.


Доказательство. Непосредственно проверяется, что если сложение и умножение в S удовлетворяет всем аксиомам, перечисленным выше, то и операции в Mn(S) удовлетворяют тому же списку аксиом. В частности, нулевой элемент в Mn(S) -- матрица $O\ =\
(o_{ij})_{n\times n}$ , где для всех i и $j\ o_{ij}\ =\ 0$; а противоположная матрица к матрице $(a_{ij})_{n\times n}$ равна $(-a_{ij})_{n\times n}$.


При $n\geq 2$ умножение в Mn(S) может быть некоммутативным, даже если S коммутативно. Например, $AB\ \neq\ BA$ для матриц

$A\ = \
\left[
\begin{array}{lr}
1&0\\ 1&1
\end{array}
\right] ,\
B = \
\left[
\begin{array}{lr}
1&1\\ 0&1
\end{array}
\right]$.
Упражнение. Пусть A и B -- матрицы (не обязательно квадратные и не обязательно одного размера) над одним и тем же кольцом. Если вертикальными и горизонтальными линиями матрицы A и B можно так рабить на прямоугольные куски $A_{ij},\ B_{ij}$ (их называют подматрицами или клетками соответствующих матриц):

\begin{displaymath}A\ = \
\left[
\begin{array}{lccr}
A_{11}&A_{12}&...&A_{1n}...
...ots&\vdots\\
A_{m1}&A_{m2}&...&A_{mn}
\end{array}
\right] ,\end{displaymath}


\begin{displaymath}B\ = \
\left[
\begin{array}{lccr}
B_{11}&B_{12}&...&B_{1s}...
...dots&\vdots\\
B_{n1}&B_{n2}&...&B_{ns}
\end{array}
\right],\end{displaymath}

что при всех $i\ =\ 1,2,...,m$ и $j\ =\ 1,2,...,s$ определена матрица

Pij = Ai1B1j+Ai2B2j+...+AinBnj,

то $AB\ =\ P\ =\ (P_{ij})_{m\times s}$. Доказать.


3.1.3. Поскольку любое поле является кольцом, множество всех квадратных матриц размерности n над полем k также является кольцом. Именно это кольцо будет подразумеваться в дальнейшем под Mn(k). Заметим, что это кольцо -- кольцо с единицей. Единицей служит уже встречавшаяся нам матрица $E\ =\ (e_{ij})\in M_n(k)$, где $e_{ii}\ =\ 1$ для всех i, а остальные eij равны 0. Пусть $r,s\in \{1,2,...,n\},\ r\neq s$, и пусть $a\in k$. Обозначим через Trs(a) матрицу $(t_{ij})\in M_n(k)$, где $t_{ii}\ =\ 1$ для всех $i,\ t_{rs}\ =\ a$, а остальные tij равны 0. Матрицу, равную одной из матриц Trs(a), назовем элементарной матрицей. Пусть теперь $a_1 ,a_2 ,...,a_n\in k$ и пусть

\begin{displaymath}D(a_1 ,a_2 ,...,a_n)\
=\ (d_{ij})\end{displaymath}

-- такая матрица из Mn(k), что $d_{ii}\ =\ a_i$ при всех $i,\ d_{ij} =0$ при $i\neq j$. Матрицу такого вида будем называть диагональной матрицей. Заметим, что единичная матрица E является и элементарной, и диагональной матрицей.


Теорема. Пусть $A\ =\ (a_{ij})\in M_n(k)$. Тогда для некоторых неотрицательных целых чисел a и b

\begin{displaymath}A = T_1 T_2\dots T_a DT_{a+1} T_{a+2}\dots T_b,\end{displaymath}

где Ti -- элементарная матрица для всех i, а D -- диагональная матрица.


Доказательство. Индукция по n. Если n=1, то A -- диагональная матрица и A = A -- искомое произведение (в этом случае a=b=0). Пусть $n\geq 2$ и теорема справедлива для матриц из Mn-1(k). Рассмотрим несколько случаев.


Случай 1. ain =0 для всех $i\leq n$, и anj =0 для всех $j\leq n$. Обозначим через $A^{\prime}$ подматрицу размерности n-1 матрицы A, расположенную в ее верхнем левом углу, то есть матрицу $A^{\prime}\ = \
(a_{ij})_{(n-1)\times (n-1)}$. По индуктивному предположению

\begin{displaymath}A^{\prime}\ =\ T_1^{\prime}T_2^{\prime}\dots
T_a^{\prime}D^{\prime}T_{a+1}^{\prime} T_{a+2}^{\prime}\dots T_b^{\prime},\end{displaymath}

где $T_i^{\prime}$ -- элементарная матрица из Mn-1(k) для всех i, а $D^{\prime}$ -- диагональная матрица из Mn-1(k). Пусть D -- матрица из Mn(k), в левом верхнем углу которой расположена матрица $D^{\prime}$, элементы с номерами in и $nj\ (i\neq n,\ j\neq n)$ равны 0, а элемент с номером nn равен ann. Пусть Ti -- матрица из Mn(k), в левом верхнем углу которой расположена матрица $T_i^{\prime}$, элементы с номерами sn и $nj\ (s\neq n,\ j\neq n)$ равны 0, а элемент с номером nn равен 1. Тогда Ti -- элементарная матрица из Mn(k) для всех i, а D - диагональная матрица из Mn(k) и

\begin{displaymath}A\ =\ T_1 T_2\dots T_a DT_{a+1} T_{a+2}\dots T_b.\end{displaymath}

Случай 2. $a_{nn}\neq 0$. Заметим, что матрица Trs(a)A отличается от A только r-ой строкой, которая равна линейной комбинации r-й и s-й строк матрицы A с коэффициентами 1 и a, а матрица ATrs(a) отличается от A только s-м столбцом, который равен линейной комбинации r-го и s-го столбцов матрицы A с коэффициентами a и 1. Поэтому матрица

\begin{displaymath}T_{1n}(-a_{1n}/a_{nn})\dots T_{n-1,n}(-a_{n-1,n}/a_{nn})A
T_{n1}(-a_{n1}/a_{nn})\end{displaymath}


\begin{displaymath}\dots T_{n,n-1}(-a_{n,n-1}/a_{nn})\end{displaymath}

удовлетворяет условиям первого случая и, по доказанному, равна

\begin{displaymath}T_1 T_2\dots T_a DT_{a+1} T_{a+2}\dots T_b,\end{displaymath}

где Ti -- элементарная матрица для всех i, а D -- диагональная матрица. Непосредственно проверяется, что

Trs(-a)Trs(a) = Trs(a)Trs(-a) = E,

поэтому

\begin{displaymath}A = T_{n-1,n}(a_{n-1,n}/a_{nn})\dots T_{1n}(a_{1n}/a_{nn})
T_1 T_2\dots T_a D\cdot\end{displaymath}


\begin{displaymath}\cdot T_{a+1} T_{a+2}\dots T_bT_{n,n-1}(a_{n,n-1}/a_{nn})
\dots
T_{n1}(a_{n1}/a_{nn})\end{displaymath}

и, значит, представима в нужном виде.


Случай 3. ann =0, а один из элементов последнего столбца или последней строки матрицы A отличен от 0 (пусть, например, $a_{n1}\neq 0$). По замечанию, сделанному при разборе второго случая, элемент с номером nn в матрице $A^{\prime}\ =\ AT_{n1}(1)$ равен an1, поэтому матрица $A^{\prime}$ удовлетворяет условиям 2-го случая и, следовательно представима в нужном виде. Но тогда и A представима в нужном виде. Поскольку разобраны все возможные случаи, теорема доказана.


3.1.4. Упражнение. Доказать, что любая матрица $A\in M_n(k)$ представима в виде $A = T_1 T_2\dots T_aU$, где Ti -- элементарная матрица для любого k, а $U\ =\ (u_{ij})$ -- нижняя треугольная матрица, то есть матрица, в которой uij =0, если i>j.


3.2. Определитель квадратной матрицы.


3.2.1. Цель этого пункта -- связать с каждой матрицей A из Mn(k) некоторый элемент из поля k, называемый определителем матрицы A, который равен 0 в точности тогда, когда строки матрицы A линейно зависимы (другими словами, который отличен от 0 в точности тогда, когда строки A составляют базу пространства kn ). Пусть $A\ =\ (a_{ij})\in M_n(k)$. Определителем (детерминантом) матрицы A называется элемент из k (обычно обозначаемый как $det(A),\ \vert A\vert,\ det(a_{ij}),\ \vert a_{ij}\vert _{n\times n}$ или

$
\left\vert
\begin{array}{llll}
a_{11} & a_{12} & ... & a_{1n}\\
a_{21} & ...
... \ddots & \vdots\\
a_{n1} & a_{n2} & ... & a_{nn}
\end{array}
\right\vert )$,
который вычисляется следующим образом: если n = 1, то det(A) = a11; если n > 1, то
det(A) = a11A1 -a12A2 +...+(-1)n-1a1nAn, (n)
где Ai -- определитель матрицы из Mn-1(k), полученной из A вычеркиванием первой строки и i-го столбца.


Примеры:


1. При $n=2\ det(A) = a_{11}a_{22} -a_{12}a_{21}$.


2. При n=3

det(A) = a11a22a33 +a12a23a31 +a13a21a32-


-a11a23a32 -a13a22a31 -a12a21a33.

3. Если к определителям Ai из формулы (n) применить формулу (n-1), то после приведения подобных слагаемых получим формулу
det(A) = $ =\sum_{1\leq j<i\leq n}(a_{1i}a_{2j}-a_{1j}
a_{2i})(-1)^{i+j}B_{ij}$, (n,n-1)
где Bij -- определитель матрицы, полученной из A вычеркиванием 1-й и 2-й строк и столбцов с номерами i и j.


4. Пусть A -- верхняя треугольная матрица, то есть пусть aij =0, если i<j. Тогда $det(A)\ =\ a_{11}a_{22}\dots a_{nn}$ (произведение элементов главной диагонали).


Упражнения.


1. Пусть $(a_{11},a_{12}),\ (a_{21},a_{22})$ -- декартовы координаты двух точек $A_1,\ A_2$ плоскости. Доказать, что площадь параллелограмма с вершиной в точке O=(0,0) и сторонами OA1 и OA2 равна модулю определителя $\left\vert
\begin{array}{ll}
a_{11} & a_{22}\\ a_{12} & a_{21}
\end{array}
\right\vert$. Сформулировать и доказать аналогичное утверждение для объема параллелепипеда.


2. Доказать, что $det\left[
\begin{array}{ll}
A & O \\ X & B
\end{array}
\right]\ =\ detA\cdot detB$, если A и B - квадратные клетки, а O -- клетка (не обязательно квадратная), все элементы которой равны 0.


Основные свойства определителя сосредоточены в следующих трех теоремах.


3.2.2. Теорема. а) Если в матрице A поменять местами две строки, то определитель получившейся матрицы равен -det(A) (при транспозиции двух строк определитель меняет знак).


б) Если в матрице A есть две одинаковые строки, то det(A)=0.


в) Если строку матрицы умножить на скаляр, то определитель матрицы умножится на тот же скаляр. В частности, определитель матрицы, в которой одна строка нулевая, равен 0.


г) Если для некоторого $i\ i$-ю строку a матрицы A представить в виде суммы a =b +c двух строк, то

det(A) = det(B)+det(C),

где матрицы B и C отличаются от A только i-й строкой: в одной i-я строка равна b , в другой -- равна c.


д) Определитель матрицы A не изменится, если i-ю строку A заменить на линейную комбинацию i-й и j-й строк матрицы A с коэффициентами 1 и $a\ (i\neq j,\ a\in k)$, то есть если к произвольной строке матрицы прибавить умноженную на произвольный скаляр строку той же матрицы, но с другим номером.


Доказательство. Во всех случаях используем индукцию по n. а) Если номера переставляемых строк >1, то достаточно применить индуктивное предположение к определителям A формулы (n). Если переставляются строки с номерами 1 и 2, то утверждение следует из формулы (n,n-1). Если, наконец, речь идет о строках с номерами 1 и i>2, то переставим сначала 1-ю и 2-ю строки, затем получившуюся вторую и i-ю, а затем снова получившуюся вторую с получившейся первой. При этом по уже доказанному определитель трижды поменяет знак, 1-я и i-я строки поменяются местами, остальные строки останутся без изменения. б). По а) можно считать, что равны 1-я и 2-я строки, поэтому утверждение следует из формулы (n,n-1). в) и г) следуют по индукции из формулы (n) (отдельно рассматриваются случаи i=1 и i>1). д). По г) определитель преобразованной матрицы равен сумме двух определителей, отличающихся i-ми строками. Один из этих определителей есть определитель матрицы A, а второй после вынесения множителя a за знак определителя будет содержать две одинаковые строки и, следовательно, по б) равен 0.


3.2.3. Теорема.

det(AB) = det(Adet(B)

(определитель произведения квадратных матриц над полем равен произведению определителей сомножителей).


Доказательство.


Случай 1: $A\ =\ D(a_1 ,a_2 ,...,a_n)$ -- диагональная матрица. Тогда A -- верхняя треугольная матрица и, значит, $\vert A\vert\ =\ a_1 a_2\dots a_n$. Матрица AB получается из B умножением каждой строки на соответствующий скаляр ai , поэтому $\vert AB\vert\ =\ a_1 a_2\dots a_n \vert B\vert\ =\ \vert A\vert\vert B\vert$.


Случай 2: $A\ =\ T_{rs}(a)$ -- элементарная матрица. Если к r-ой строке A прибавить s-ю, умноженную на -a, то A превратится в диагональную матрицу с единичными диагональными элементами и, значит, |A| = 1. Матрица AB получается из B прибавлением к r-й строке умноженной на $a\ s$-й строки. Такое преобразование не меняет определитель, поэтому $\vert AB\vert\ =\ \vert B\vert\ =\ \vert A\vert\vert B\vert$.


Случай 3 (общий). По теореме 3.1.3.

\begin{displaymath}A = T_1 T_2\dots T_a DT_{a+1} T_{a+2}\dots T_b,\end{displaymath}

где Ti -- элементарная матрица для всех i, а D -- диагональная матрица. С учетом разобранных случаев имеем

\begin{displaymath}\vert A\vert = \vert T_1\vert\vert T_2\dots T_a DT_{a+1} T_{a+2}\dots T_b\vert\
=\end{displaymath}


\begin{displaymath}=\ \vert T_1\vert\vert T_2\vert\vert\dots T_a DT_{a+1} T_{a+2}\dots T_b\vert\
\ =\end{displaymath}


\begin{displaymath}=\ \vert T_1\vert\vert T_2\vert\dots \vert T_a\vert\vert D\vert\vert T_{a+1}\vert\vert T_{a+2}\vert\dots \vert T_b\vert\end{displaymath}

и, аналогично,

\begin{displaymath}\vert AB\vert\ =\ \vert T_1\vert\vert T_2\dots T_a DT_{a+1} T_{a+2}\dots T_bB\vert\
=\end{displaymath}


\begin{displaymath}=\ \vert T_1\vert\vert T_2\vert\dots \vert T_a\vert\vert D\ve...
...T_{a+1}\vert\vert T_{a+2}\vert\dots \vert T_b\vert\vert B\vert.\end{displaymath}

Теорема доказана.


3.2.4. Транспонирование матрицы.


Если $A\ =\ (a_{ij})_{m\times n}$, то транспонированной матрицей A называется матрица $A^{\prime}\
=\ (a^{\prime}_{ij})_{n\times m}$, элементы которой при всех i и j удовлетворяют условию $a^{\prime}_{ij}\ =\
a_{ji}$. Таким образом, строки $A^{\prime}$ -- это столбцы матрицы A и, наоборот, столбцы $A^{\prime}$ -- это строки A.


Примеры-упражнения. 1. $(T_{rs}(a))^{\prime} = T_{sr}(a)$.


2. Если D -- диагональная матрица, то $D^{\prime}=D$.


3. $(AB)^{\prime} = B^{\prime}A^{\prime}$.


4. $(A^{\prime})^{\prime} = A$.


Теорема. а) Определитель транспонированной матрицы A равен определителю A.


б) Если в теореме 3.2.2 заменить везде слово "строка" на слово "столбец", то все соответствующие утверждения останутся верными.


Доказательство. а) По теореме 3.1.3.

\begin{displaymath}A = T_1 T_2\dots T_a DT_{a+1} T_{a+2}\dots T_b,\end{displaymath}

где Ti -- элементарная матрица для всех i, а D -- диагональная матрица. По предыдущей теореме |A| = |D|. Далее,

\begin{displaymath}A^{\prime} = T^{\prime}_b\dots T^{\prime}_{a+1}
D^{\prime}T^{\prime}_a\dots T^{\prime}_1\end{displaymath}

и

\begin{displaymath}\vert A^{\prime}\vert\ =\ \vert D^{\prime}\vert\ =\ \vert D\vert\ =\ \vert A\vert\end{displaymath}

. б). Операции над столбцами матрицы A -- это те же операции над строками $A^{\prime}$. Если мы, скажем, переставили два столбца в A, то тем самым переставили две строки в $A^{\prime}$. В результате определитель $A^{\prime}$ сменит знак, то есть по а) определитель A сменит знак. Аналогично доказываются и другие свойства определителя, связанные с преобразованием столбцов. Теорема доказана.


3.3. Разложение определителя по строке (столбцу).


3.3.1. Пусть $A\ =\ (a_{ij})\in M_n(k)$. Алгебраическим дополнением в A к элементу с номером ksназывается скаляр Aks, равный произведению (-1)k+s на определитель матрицы, полученной вычеркиванием из $A\ k$-й строки и s-го столбца.


Теорема. Пусть $A\ =\ (a_{ij})\in M_n(k)$ и $\hat{A}\
=\ (A_{ij})_{n\times n}$ -- матрица, элементами которой служат алгебраические дополнения к элементам матрицы A. Тогда $A\cdot\hat{A}^{\prime}\ =\ \hat{A}^{\prime}\cdot A\
=\ \vert A\vert E$, где E -- единичная матрица. Другими словами, верны равенства:
1) $\sum_{j=1}^na_{ij}A_{ij}\ =\ det(A)$ для i = 1,2,...,n
(разложение определителя по i-й строке),

2) $\sum_{j=1}^na_{ij}A_{kj}\ =\ 0$ для $i,k =
1,2,...,n,\ i\neq k$,

3) $\sum_{i=1}^na_{ij}A_{ij}\ =\ det(A)$ для j = 1,2,...,n
(разложение определителя по j-у столбцу),

4) $ \sum_{i=1}^na_{ij}A_{ik}\ =\ 0$ для $j,k\ =\ 1,2,...,n,\
j\neq k$.


Доказательство. 1) Индукция по i. При i = 1 это равенство совпадает с формулой (n). Чтобы получить его для i>1, нужно переставить i-ю и (i-1)-ю строки, воспользоваться индукцией и учесть изменение знака, происшедшее от перестановки строк. 2) Рассмотрим матрицу B, полученную заменой k-й строки матрицы A на ее i-ю строку, и применим к det(B) = 0 разложение по k-й строке. 3) и 4) -- это равенства 1) и 2) для транспонированной матрицы A. Теорема доказана.


3.3.2. Упражнение. Доказать, что определитель Ван дер Монда


\begin{displaymath}\left\vert
\begin{array}{ccccc}
x_1^{n-1}&x_2^{n-1}&...&x_{...
...x_2&...&x_{n-1}&x_n\\
1 & 1&...&1&1
\end{array}
\right\vert\end{displaymath}

равен

\begin{displaymath}(x_1 -x_2)(x_1 -x_2 )\dots (x_{n-1} -x_n ) = \prod_{1\leq i< j
\leq n}{(x_i-x_j)}.\end{displaymath}


Указание: Вычесть из первой строки умноженную на xn вторую строку, затем вычесть из второй строки умноженную на xn третью строку, и т.д., наконец, вычесть из предпоследней строки умноженную на xn последнюю строку. После этого разложить определитель по последнему столбцу и применить индукцию по n.


3.4. Обратная матрица. Если для матрицы $A\ =\ (a_{ij})\in M_n(k)$ существует такая матрица $X\in M_n(k)$, что AX = XA = E, то матрица A называется обратимой (или невырожденной), а X -- обратной матрицей к матрице A (обозначение X = A-1).


Теорема. Матрица A обратима тогда и только тогда, когда $det(A)
\neq 0$. Если $det(A)
\neq 0$, то A-1 = (xij), где

xij = Aji/det(A)

(обратите внимание на перестановку индексов в этом равенстве). Другими словами,

\begin{displaymath}A^{-1} = \vert A\vert^{-1}\hat{A}^{\prime}.\end{displaymath}


Доказательство. $AX = E \Rightarrow \vert A\vert\vert X\vert = \vert E\vert = 1 \Rightarrow \vert A\vert \neq 0$. Если $\vert A\vert \neq 0$, то, как следует из теоремы 3.3.1, $\vert A\vert^{-1}\hat{A}^{\prime}$ -- обратная матрица для A. Если X и Y -- две обратные матрицы к матрице A, то X = XE = XAY = EY = Y. Теорема доказана.


Упражнение. Пусть A -- обратимая матрица размерности n. Составим матрицу [E|A] размера $n\times 2n\ (E$ -- единичная матрица). Элементарными преобразованиями строк ее можно привести к виду [B|E]. Тогда B -- обратная матрица к A. Доказать.


3.5. Снова матрица перехода от базы к базе. Пусть V -- конечномерное векторное пространство над k и ${\cal V} =
\{ v_1 ,v_2 ,...,v_n \},\ {\cal U} = \{ u_1 ,u_2 ,...,u_n \}$ -- две его базы. Выразим векторы базы ${\cal U}$ через ${\cal V}$:

\begin{displaymath}u_i =a_{i1}v_1 +a_{i2}v_2+...+a_{in}v_n\ (i = 1,2,...,n).\end{displaymath}

Матрица $A = (a_{ij})_{n\times n}$ называется матрицей перехода от базы ${\cal V}$ к базе ${\cal U}$.


Теорема. а) Пусть ${\cal V}$, ${\cal U}$ -- базы векторного пространства и A - матрица перехода от ${\cal V}$ к ${\cal U}$. Тогда координатные строки $[x]_{\cal U}$ и $[x]_{\cal V}$ в этих базах связаны равенством

\begin{displaymath}[x]_{\cal U} = [x]_{\cal V}\cdot A.\end{displaymath}

б) Пусть ${\cal V},\ {\cal U},\ {\cal T}$ -- три базы векторного пространства, A -- матрица перехода от ${\cal V}$ к ${\cal U}$, B -- матрица перехода от ${\cal U}$ к ${\cal T}$, C -- матрица перехода от ${\cal V}$ к ${\cal T}$. Тогда C = AB.


в) Матрица перехода от базы к базе невырождена и если A -- матрица перехода от ${\cal V}$ к ${\cal U}$, то A-1 -- матрица перехода от ${\cal U}$ к ${\cal V}$.


Доказательство. Пункты а) и б) проверяются непосредственным вычислением. Для доказательства в) заметим, что матрица перехода от ${\cal V}$ к ${\cal V}$ равна E и положим в б) ${\cal T}
= {\cal V}$. Тогда по б) E = AB, откуда $det(A)
\neq 0$ и B = A-1.


3.6.Ранг матрицы.


3.6.1. Мы уже рассматривали ранг набора строк матрицы $A\ =\ (a_{ij})_{m\times n}$ над полем k. Назовем этот ранг строчным рангом матрицы A. Поскольку столбцы матрицы A можно считать элементами векторного пространства km , есть смысл ввести определение ранга набора столбцов или столбцевого ранга матрицы A. Важным для приложений фактом является равенство столбцевого и строчного рангов для любой матрицы. Чтобы его доказать, введем понятие минорного ранга матрицы.


3.6.2. Пусть $s\leq m,\ s\leq n$. Минором s-го порядка матрицы $A\ =\ (a_{ij})_{m\times n}$ называется любая матрица размерности s, которую можно получить вычеркиванием из A любых m-s строк и любых n-s столбцов, другими словами, матрица, стоящая на пересечении любых s строк и любых s столбцов матрицы A. Минорным рангом матрицы A называется такое число r, что в A есть обратимый минор порядка r, но нет обратимых миноров порядка >r.


3.6.3. Теорема о ранге матрицы. Для любой матрицы ее минорный, строчный и столбцевой ранги совпадают.


Доказательство. Пусть минорный ранг матрицы A равен r. Покажем, что строчный ранг тоже равен r. Для этого можно считать, что обратимый минор M порядка r находится в первых r строках матрицы A. Отсюда следует, что первые r строк матрицы A линейно независимы и набор строк минора M линейно независим. Пусть a -- строка длины r, составленная из элементов i-ой строки матрицы $A\
(i>r)$, которые расположены в тех же столбцах, что и минор M. Так как строки минора M составляют базу в kr , то a -- линейная комбинация строк минора M. Вычтем из i-ой строки A такую же линейную комбинацию первых r строк матрицы A. Если получится строка, содержащая ненулевой элемент в столбце с номером t, то рассмотрим минор M1 порядка r+1 матрицы A, добавив к строкам минора $M\ i$-ю строку матрицы A и к столбцам минора $M\ t$-ый столбец матрицы A (говорят, что минор M1 получен окаймлением минора M с помощью i-ой строки и t-го столбца матрицы A). По нашему выбору t, этот минор обратим (достаточно вычесть из последней строки этого минора выбранную выше линейную комбинацию первых r строк, а затем разложить его определитель по последней строке, чтобы убедиться, что этот определитель с точностью до ненулевого скалярного множителя совпадает с определителем минора M. По определению r такая ситуация невозможна и, значит, после преобразования i-я строка A станет нулевой. Другими словами, исходная i-я строка -- линейная комбинация первых r строк матрицы A. Мы показали, что первые r строк составляют базу набора строк матрицы A, то есть строчный ранг A равен r. Чтобы доказать, что столбцевой ранг равен r, достаточно в приведенном выше рассуждении "строки" и "столбцы" поменять местами. Теорема доказана.


Эта теорема показывает, что нет смысла различать три ранга матрицы, и в дальнейшем под рангом матрицы мы будем понимать строчный ранг, помня о том, что он равен и столбцевому, и минорному рангу (обозначение r(A) -- ранг матрицы A). Заметим еще, что из доказательства теоремы о ранге следует, что ранг матрицы совпадает с размерностью любого такого обратимого минора матрицы, что все окаймляющие его миноры (если они вообще существуют) вырождены.


3.6.4. Следствие. Определитель квадратной матрицы тогда и только тогда равен 0, когда строки матрицы линейно зависимы (или, что то же самое, строки матрицы составляют базу в пространстве строк.


3.6.6. Упражнение.

\begin{displaymath}r(A+B)\leq r(A)+r(B),\ r(AB)\leq r(A), r(AB)\leq r(B).\end{displaymath}


Указание: Набор строк матрицы A+B линейно выражается через объединение наборов строк матриц A и B. Набор строк матрицы AB линейно выражается через набор строк матрицы B. Набор столбцов матрицы AB линейно выражается через набор столбцов матрицы A.