6. Линейные преобразования



На протяжении всей главы V будет означать векторное пространство размерности n над полем k.



6.1. Определение. Линейное отображение V в V называется линейным преобразованием векторного пространства V. Таким образом, $\varphi$ -- линейное преобразование V, если $\varphi$ -- функция, заданная на V со значениями в V и удовлетворяющая следующим двум условиям: $(a+b)\varphi=a\varphi+b\varphi,\
(\alpha a)\varphi=\alpha (a\varphi)$ при всех $a,b\in V,\ \alpha\in k$. Эти два условия можно заменить на одно: $(\alpha_1 a_1+...+\alpha_t a_t)\varphi=\alpha_1 (a_1\varphi )+...
+\alpha_t (a_t\varphi)$ при всех $a_i\in V,\ \alpha_i\in k,\ t\in$N. Совокупность всех линейных преобразований пространства V обозначается через ${\cal L}(V)$. Ясно, что ${\cal L}(V) = {\cal L}(V,V)$.



6.1.2. Примеры - упражнения. Показать, что $\varphi$ - линейное преобразования соответствующего векторного пространства. 1. V - пространство векторов вещественной плоскости с началом в точке O, а) $\varphi$ - симметрия относительно точки O, б) $\varphi$ - симметрия относительно прямой, проходящей через O, в) $\varphi$ - поворот плоскости вокруг O на данной угол. 2. $\varphi$ - дифференцирование в пространстве полиномов k[x]: $f\varphi\ =\ f^{\prime}$ для $f\in k[x]$. 3. Пусть $A\in M_n(k)$, $\varphi$ - умножение строки из пространства kn на A:

\begin{displaymath}v\varphi=vA\end{displaymath}

для $v\in k^n$. 4. Пусть $\alpha$ - фиксированный скаляр из $k,\ \varphi$ - умножение векторов из V на $\alpha$: $v\varphi =\alpha v$ для всех $v\in V$. При $\alpha = 0\ \varphi$ называется нулевым преобразованием (обозначение $\varphi =0$), при $\alpha = 1\ \varphi$ называется тождественным или единичным преобразованием (обозначение $\varphi =\varepsilon$).



Если $v\in V$, $\varphi\in {\cal L}(V)$ и $v\varphi = u$, то u называется образом v под действием $\varphi$, а v -- прообразом u. Если $A\subseteq V$, то множество $A\varphi = \{a\varphi\mid
a\in A\}$ называется образом A под действием $\varphi$.



6.1.3. Матрица линейного преобразования.



Пусть ${\cal U}$ - база V, $\varphi\in {\cal L}(V)$. Матрицей [$\varphi$] = $[\varphi ]_{\cal U}$ преобразования $\varphi$ в базе ${\cal U}$ называется матрица линейного отображения $\varphi \in {\cal L}(V,V)={\cal L}(V)$ относительно пары баз $({\cal U}, {\cal U})$. Таким образом, если ${\cal U}=\{u_1,...,u_n\}$ и

\begin{displaymath}u_1\varphi = a_{11}u_1+...+a_{1n}u_n,\end{displaymath}


\begin{displaymath}u_2\varphi = a_{21}u_1+...+a_{2n}u_n,\end{displaymath}


............................................


\begin{displaymath}u_n\varphi = a_{n1}u_1+...+a_{nn}u_n,\end{displaymath}

то

\begin{displaymath}[\varphi ]= \left[ \begin{array}{lcr}
a_{11}, & ... & a_{1n}...
...... & ... & ... \\
a_{n1}, & ... & a_{nn} \end{array} \right]\end{displaymath}

Обозначим столбец $\left[ \begin{array}{l}
u_1\\ u_2 \\ ...\\ u_n \end{array} \right]$ через $\vec{u}$, столбец $\left[ \begin{array}{l}
u_1\varphi\\ u_2\varphi \\ ...\\ u_n\varphi \end{array} \right]$ -- через $\vec{u}\varphi$. Тогда $\vec{u}\varphi$= $[\varphi]\vec{u}$, где справа - произведение матриц $[\varphi]$ и $\vec{u}$.



6.1.4. Координаты образа вектора. Пусть ${\cal U}$ - база V, $\varphi\in {\cal L}(V),\ [\varphi]$ - матрица $\varphi$ в базе ${\cal U}$. Если $a\in V$, то, как и раньше, через [a] обозначим строку координат вектора a в базе ${\cal U}$. Напомним, что $a=[a]\vec{u}$.



Теорема. Если $a\in V$, то $[a\varphi ]=[a][\varphi ]$.



Доказательство. Имеет место цепочка равенств

\begin{displaymath}[a\varphi ]\vec{u}=a\varphi =([a]\vec{u})\varphi
=[a](\vec{u}\varphi )=[a]([\varphi ]\vec{u})=([a][\varphi ])\vec{u}.\end{displaymath}

Поэтому

\begin{displaymath}[a\varphi ]=[a][\varphi ].\end{displaymath}

Теорема доказана.



6.1.5. Связь между ${\cal L}(V)$ и Mn(k).



Для $\varphi,\psi\in {\cal L}(V)$ и $\alpha\in k$ определим отображения $\varphi +\psi, \varphi\psi$ и $\alpha\varphi$ пространства V в V равенствами

\begin{displaymath}v(\varphi +\psi )=v\varphi + v\psi ,\end{displaymath}


\begin{displaymath}v(\varphi\psi )=(v\varphi )\psi ,\end{displaymath}


\begin{displaymath}v(\alpha\varphi )=\alpha (v\varphi )\end{displaymath}

для всех $v\in V$.



Теорема. Пусть ${\cal U}$ - база V. Тогда соответствие $\varphi \rightarrow [\varphi ]$ (линейному преобразованию $\varphi$ сопоставляется его матрица в базе ${\cal U}$) дает взаимно однозначное отображение множества ${\cal L}(V)$ на Mn(k). Если $\varphi ,\psi
\in {\cal L}(V),\ \alpha\in k$, то $\varphi +\psi, \varphi\psi,
\alpha\varphi\in {\cal L}(V)$ и имеют место равенства

\begin{displaymath}[\varphi +\psi ]=[\varphi ]+[\psi ],\end{displaymath}


\begin{displaymath}[\varphi\psi ]=[\varphi ][\psi ],\end{displaymath}


\begin{displaymath}[\alpha\varphi ]=\alpha [\varphi ].\end{displaymath}



Доказательство. Эта теорема -- частный случай теоремы 2.6.6, пункта 2.6.9 и определения операций над матрицами.



6.1.6. Матрицы линейного преобразования в разных базах.



Пусть $\varphi\in {\cal L}(V),\ {\cal U}=\{ u_1,...,u_n\},\
{\cal V}=\{ v_1,...,v_n\}$ -- две базы $V,\ A=(a_{ij})_{n\times n}$ -- матрица перехода от ${\cal V}$ к ${\cal U}$. Это означает (см. 2.4.9), что

\begin{displaymath}u_i=a_{i1}v_1+...+a_{in}v_n=(a_{i1},...,a_{in})\vec{v}\ (i=1,...,n),\end{displaymath}

то есть, что $\vec{u}=A\vec{v}$. Если теперь B -- матрица перехода от ${\cal U}$ к ${\cal V}$, то $\vec{v}=B\vec{u}$, откуда $\vec{v}=BA\vec{v}$ и BA=E -- единичная матрица. Другими словами, A невырождена и B=A-1,A=B-1. Пусть $[\varphi ]_{\cal U}$ -- матрица $\varphi$ в базе ${\cal U},
[\varphi ]_{\cal V}$ -- матрица $\varphi$ в базе ${\cal V}$. Тогда

\begin{displaymath}[\varphi ]_{\cal U}\vec{u}=\vec{u}\varphi=
(A\vec{v})\varphi=A(\vec{v}\varphi)=A[\varphi ]_{\cal V}\vec{v}=\end{displaymath}


\begin{displaymath}=
A[\varphi ]_{\cal V}B\vec{u}=B^{-1}[\varphi ]_{\cal V}B\vec{u},\end{displaymath}

откуда

\begin{displaymath}[\varphi ]_{\cal U}=B^{-1}[\varphi ]_{\cal V}B=A[\varphi ]_
{\cal V}A^{-1}.\end{displaymath}

Говорят, что две матрицы X и Y подобны над k, если существует такая невырожденная матрица C с элементами из k, что X=C-1YC. Матрица C называется матрицей, осуществляющей подобие (или сопрягающей матрицей). Таким образом мы доказали следующую теорему.



Теорема. Матрицы одного и того же линейного преобразования пространства V в двух базах подобны над k. Подобие осуществляет матрица перехода от одной базы к другой.



Упражнение. Докажите обратное утверждение: пусть X и Y -- две матрицы из Mn(k), сопряженные над k. Тогда X и Y -- матрицы одного и того же линейного преобразования в подходящих базах.



Указание. Если $\{v_1,...,v_n\}$ -- база $V,\ C$ -- невырожденная матрица из Mn(k), то элементы столбца $C\vec{v}$ образуют базу V.



6.1.7. Образ и ядро, ранг и дефект.



Если $\varphi\in {\cal L}(V)$, то множество $Im\varphi =V\varphi
=\{ v\varphi\mid v\in V\}$ называется образом $\varphi$, а множество $Ker\varphi=\{ v\in V\mid v\varphi = \overline{0}\}$ называется ядром $\varphi$.



Теорема. 1. $Im\varphi$ и $Ker\varphi$ -- подпространства пространства V. Размерность $Im\varphi$ называется рангом, а размерность $Ker\varphi$ -- дефектом $\varphi$. 2. Сумма ранга и дефекта линейного преобразования равна размерности пространства. 3. Ранг $\varphi$ равен рангу $[\varphi]$ (в любой базе).



Доказательство. Эта теорема - частный случай теоремы 2.5.7.



6.1.8. Невырожденное преобразование.



Теорема-определение. Пусть $\varphi\in {\cal L}(V)$. Следующие свойства $\varphi$ эквивалентны: 1. $Ker\varphi=O$. 2. $V\varphi=V$. 3. Образ произвольной базы -- база. 4. Матрица $\varphi$ невырождена (в любой базе). 5. Существует обратное преобразование $\varphi^{-1}$ и оно линейно. Если $\varphi$ обладает одним из этих свойств, то $\varphi$ называется невырожденным линейным преобразованием.



Доказательство. 1. $\iff$ 2. поскольку размерность V равна сумме ранга и дефекта преобразования $\varphi$. 1. $\Rightarrow$ 3. Пусть ${\cal U}=\{u_1,...,u_n\}$ -- база V. Если $u_1\varphi ,...,u_n\varphi$ линейно зависимы, то существует ненулевая строка (a1,...an), для которой $\overline{0}=a_1u_1\varphi +...+a_nu_n\varphi =
(a_1u_1+...+a_nu_n)\varphi$, поэтому $\overline{0}\neq a_1u_1+...+a_nu_n\in
Ker\varphi$. Противоречие. Поскольку n линейно независимых векторов из V составляют базу, то $u_1\varphi ,...,u_n\varphi$ -- база. 3. $\Rightarrow$ 4. Матрица $\varphi$ в базе ${\cal U}$ -- матрица перехода от ${\cal U}$ к базе ${\cal U}\varphi$ (см. 6.1.6). Поэтому $[\varphi]$ невырождена. 4. $\Rightarrow$ 5. Пусть $\psi$ -- линейное преобразование, для которого $[\psi ]=[\varphi ]^{-1}$. Тогда $[\varphi ][\psi ]=[\psi ][\varphi ]=E$ и, значит, $\varphi\psi =\psi\varphi =\varepsilon$ -- тождественное преобразование. 5. $\Rightarrow$ 1. Пусть $v\varphi =\overline{0}$. Тогда $v\varphi\varphi ^{-1}=\overline{0}\varphi ^{-1}=\overline{0}$, откуда $v=\overline{0}$ и $Ker\varphi =\overline{0}$.



6.1.9. Инвариантное подпространство и ограничение.



Пусть $\varphi\in {\cal L}(V)$. Подпространство U пространства V называется$\varphi$-инвариантным подпространством или подпространством, инвариантным относительно $\varphi$, если $U\varphi\subseteq U$. Если подпространство U инвариантного относительно $\varphi$, то отображение $\psi :U\rightarrow U$, определенное равенством $u\psi=u\varphi$ для всех $u\in U$ является линейным преобразованием пространства U. Оно называется ограничением $\varphi$ на Uи обозначается через $\varphi _{\mid U}$.



Теорема. 1. Пусть подпространство U инвариантно относительно $\varphi,\ {\cal U}=\{ u_1,...,u_r\}$ -- база $U,\
{\cal V}=\{ u_1,...,u_r,u_{r+1},...,u_n\}$ -- согласованная с ней база V. Тогда

\begin{displaymath}[\varphi ]=
\left[
\begin{array}{lr}
[\varphi _{\mid U}] & O\\ \ast & \ast
\end{array}\right].\end{displaymath}

Здесь $[\varphi _{\mid U}]$ -- матрица $\varphi _{\mid U}$ в базе ${\cal U},
[\varphi ]$ - матрица $\varphi$ в базе ${\cal V}, O$ -- $r\times (n-r)$-матрица, все элементы которой равны нулю. 2. Если $V=U_1\oplus ...\oplus U_s$ -- прямая сумма $\varphi$-инвариантных подпространств $U_i,\ {\cal U}_i$ -- база Ui и ${\cal V}=
{\cal U}_1\cup ...\cup {\cal U}_s$ -- база V, то в базе ${\cal V}$

\begin{displaymath}[\varphi ]=
\left[
\begin{array}{lcr}
[\varphi _{{\mid U}_...
.... & ...\\ O & ... & [\varphi _{{\mid U}_s}]
\end{array}\right]\end{displaymath}

-- клеточно-диагональная матрица, диагональная клетка $[\varphi _{{\mid U}_i}]$ которой - это матрица $\varphi
_{{\mid U}_i}$ в базе ${\cal U}_i$.



Доказательство -- непосредственное применение определения $\varphi$ и $\varphi _{\mid U}$.



6.1.10. Одномерное инвариантное подпространство. Собственные векторы и собственные значения. Характеристический полином и характеристические корни.



Пусть $\varphi\in {\cal L}(V), U$ -- подпространство размерности 1, инвариантное относительно $\varphi$. Тогда U=ku, где u -- ненулевой вектор из V и $u\varphi=lu$, где $l\in k$. Наоборот, если u - ненулевой вектор из V и $u\varphi=lu$, где $l\in k$, то U=ku -- одномерное $\varphi$-инвариантное подпространство. Ненулевой вектор u вектор из V, для которого $u\varphi=lu$, где $l\in k$, называется собственным вектором преобразования $\varphi$, соответствующим собственному значению l.



Теорема. Пусть $\varphi\in {\cal L}(V)$. 1. Полином

\begin{displaymath}\mid [\varphi ]-xE\mid \end{displaymath}

не зависит от базы, в которой вычислена $[\varphi]$. Он называется характеристическим полиномом для $\varphi$. Его корни называются характеристическими корнями $\varphi$. 2. Собственный вектор преобразования $\varphi$, соответствующий собственному значению l, существует тогда и только тогда, когда l -- лежащий в k корень характеристического полинома $\varphi$.



Доказательство. 1. Пусть A и B -- матрицы преобразования $\varphi$ в двух базах. По 6.1.6 A=C-1BC для некоторой невырожденной матрицы C. Поэтому

\begin{displaymath}\mid A-xE\mid\ =\ \mid C^{-1}(B-xE)C\mid\
=\ \mid B-xE\mid.\end{displaymath}

2. Пусть v - собственный вектор для $\varphi$, соответствующий собственному значению $l,\ U=kv$ -- одномерное $\varphi$-инвариантное подпространство. Тогда

\begin{displaymath}[\varphi ]=\left[\begin{array}{lccr} l & 0 & ... & 0 \\
* & * & * & * \end{array}\right]\end{displaymath}

в базе, продолжающей базу U, и $\mid [\varphi ]-lE\mid=0$, поэтому l -- корень характеристического полинома $\varphi$. Очевидно, $l\in k$. Наоборот, если $l\in k$ и $\mid [\varphi ]-lE\mid=0$, то матрица $[\varphi -l\varepsilon ]$ вырождена и $Ker(\varphi -l\varepsilon )\neq O$ по теореме 6.1.8. Если $\overline{0}\neq v\in Ker(\varphi -l\varepsilon)$, то $v\varphi =lv$ и l - собственное значение для $\varphi$. Теорема доказана.



Если $A\in M_n(k)$, то $\mid A-xE\mid$ называется характеристическим полиномом матрицы A.



Упражнения. 1. Для матрицы $A\in M_n(k)\ \mid A-xE\mid\ =\
(-1)^nx^n+...+\mid A\mid$ -- полином степени n над k. Доказать. 2. Доказать, что $[\varphi]$ тогда и только тогда подобна над k диагональной матрице, когда существует база V, состоящая из собственных векторов $\varphi$. 3. Проверить, что $\left[\begin{array}{lr} 1 & 1 \\ 0 & 1
\end{array}\right]$ не подобна диагональной матрице. 4. Проверить, что для дифференцирования $\varphi$ пространства полиномов степени $\leq n$ при $n\geq 1$ нет базы, состоящей из собственных векторов $\varphi$.



6.1.11. Значения полинома от матрицы и от линейного преобразования. Теорема Кэли - Гамильтона



Пусть $f(x)=a_0+a_1x+...+a_mx^m\in k[x],\ A\in M_n(k),\
\varphi\in {\cal L}(V)$. Положим $f(A)=a_0E+a_1A+...+a_mA^m,f(\varphi )
=a_0\varepsilon +a_1\varphi +...+\varphi ^m$, где $\varphi ^i
=\varphi\dots\varphi$ (i сомножителей).



Упражнение. Пусть $f,g\in k[x],\ u=f+g,\ v=fg,\ A\in M_n(k),\
\varphi\in {\cal L}(V)$. Доказать, что

u(A)=f(A)+g(A),


\begin{displaymath}u(\varphi )=f(\varphi )+g(\varphi ),\end{displaymath}


v(A)=f(A)g(A),


\begin{displaymath}v(\varphi )=f(\varphi )g(\varphi ).\end{displaymath}

В частности, для любых двух полиномов f и g

f(A)g(A)=g(A)f(A)

и

\begin{displaymath}f(\varphi )
g(\varphi )= g(\varphi )f(\varphi ).\end{displaymath}



Теорема Кэли - Гамильтона. 1. Пусть $A\in M_n(k),\ f(x)$ -- характеристический полином A. Тогда f(A) -- нулевая матрица ("Вольная" формулировка: матрица -- корень своего характеристического полинома). 2. Пусть $\varphi\in {\cal L}(V), f(x)$ -- характеристический полином $\varphi$. Тогда $f(\varphi )$ -- нулевое преобразование (Линейное преобразование -- корень своего характеристического полинома).



Доказательство. 1. Пусть f(x)=a0+a1x+...+anxn -- характеристический полином матрицы A. Пусть bij -- алгебраическое дополнение к элементу с номером ji в матрице A-xE. Очевидно,

bij=bij(0)+bij(1)x+...+bij(n-1)xn-1

-- полином из k[x] степени, меньшей n. Поэтому матрица $B=(b_{ij})_{n\times n}$ представима в виде

B=B0+B1x+...+Bn-1xn-1,

где $B_t=(b_{ij}^{(t)})
_{n\times n}\in M_n(k)$. По теореме 3.3

(A-xE)(B0+B1x+...+Bn-1xn-1)=


\begin{displaymath}=(A-xE)B=\mid A-xE\mid\cdot E=a_0E+a_1Ex+...+a_nEx^n.\end{displaymath}

Сравнивая коэффициенты при xi в правой и левой частях этого равенства, получим

AB0=a0E,


AB1-B0=a1E,


AB2-B1=a2E,


.........................


ABn-1-Bn-2=an-1E,


-Bn-1=anE.

Умножим слева каждое равенство, начиная со второго, соответственно, на A, A2,...,An и сложим полученные равенства. Слева получим нулевую матрицу, а справа --

a0E+a1A+...+anAn=f(A).

2. Пусть

\begin{displaymath}f(x)=\mid [\varphi ]-xE\mid .\end{displaymath}

По 1. $[f(\varphi )]=f([\varphi ])$ -- нулевая матрица. Поэтому $f(\varphi )=o$.