10. Квадратичные формы.


10.1. Определение. Квадратичной формой от n переменных над полем k назовем однородный многочлен степени 2 от переменных x1,...,xn с коэффициентами из k, т.е. многочлен вида

\begin{displaymath}f=\sum_{1\leq i\leq j\leq n}f_{ij}x_ix_j,\ f_{ij}\in k. \hspace{4cm} (1)\end{displaymath}


Если в выражении (1) отказаться от условия $i\leq j$, то коэффициенты при xixj однозначно формой не определяются. Например, форму x12+3x1x2-x22 можно записать также в виде x12+2x1x2+x2x1-x22. В дальнейшем будем предполагать, что поле k имеет характеристику, отличную от 2, т.е. в нем $1+1=2\neq 0$. В этом случае положим

\begin{displaymath}a_{ii}=f_{ii}\ (i=1,...,n),\ a_{ij}=a_{ji}=f_{ij}/2\mbox{ при } (i<j).\end{displaymath}

и вместо представления (1) будем рассматривать представление

\begin{displaymath}f=\sum_{1\leq i, j\leq n}a_{ij}x_ix_j. \hspace{5cm} (2)\end{displaymath}

Матрицу $A=(a_{ij})_{n\times n}$ назовем матрицей квадратичной формы f. Из определения следует, что A -- симметрическая матрица, т.е. она совпадает со своей транспонированной матрицей $A^{\prime}$.


Пример. Матрицей квадратичной формы x12+3x1x2-x22 будет $\left[
\begin{array}{rr}
1&3/2\\
3/2&-1
\end{array}
\right]$.


Обозначим через X строку (x1,...,xn), которую будем понимать как матрицу с одной строкой и n столбцами. Тогда равенство (2) можно переписать в матричном виде:

\begin{displaymath}f=XAX^{\prime}. \hspace{4cm} (3)\end{displaymath}


10.2. Эквивалентные формы. Канонический вид.


Пусть имеются две квадратичные формы:

\begin{displaymath}f=\sum_{1\leq i, j\leq n}a_{ij}x_ix_j=XAX^{\prime}\end{displaymath}

и

\begin{displaymath}g=\sum_{1\leq i, j\leq n}b_{ij}y_iy_j=YBY^{\prime}\end{displaymath}

от переменных x1,...,xn и y1,...,yn, соответственно. Будем говорить, что формы f и g эквивалентны (обозначение $f\sim g$), если существует невырожденная линейная замена переменных над полем k

\begin{displaymath}\left\{
\begin{array}{ccc}
x_1&=&t_{11}y_1+t_{21}y_2+...+t_...
...t_{2n}y_2+...+t_{nn}y_n,
\end{array}
\right. \hspace{1cm} (4)\end{displaymath}

переводящая форму f в g. Рассмотрим матрицу замены (она по определению невырождена)

\begin{displaymath}T=\left[
\begin{array}{cccc}
t_{11}&t_{12}&...&t_{1n}\\
t...
...ots&\vdots\\
t_{n1}&t_{n2}&...&t_{nn}
\end{array}
\right] .\end{displaymath}

Равенства (4) можно переписать в матричном виде: X=YT.


Проверим три условия эквивалентности (рефлексивность, симметричность и транзитивность). 1) Очевидно, что $f\sim f$ (матрица замены будет единичной). 2) Если $f=XAX^{\prime}\sim
g=YBY^{\prime}$ и X=YT -- соответствующая замена, то обратная замена Y=XT-1 переводит форму g в f, т.е. $g\sim f$. 3) Пусть $f=XAX^{\prime}\sim
g=YBY^{\prime},\ g\sim h=ZCZ^{\prime}$ и $X=YT_1,\ Y=ZT_2$ -- соответствующие замены. Тогда замена X=ZT2T1 с матрицей T2T1 переводит форму f в h, т.е. $f\sim h$. Отметим также, как меняется матрица формы $f=XAX^{\prime}$ в результате замены переменных X=YT. Имеем

\begin{displaymath}f=XAX^{\prime}=(YT)A(YT)^{\prime}=Y(TAT^{\prime})Y^{\prime}.\end{displaymath}

Таким образом матрица формы изменяется по правилу

\begin{displaymath}A\longrightarrow TAT^{\prime}. \hspace{2cm} (5)\end{displaymath}


Замечание. Так как ранг матрицы сохраняется при умножении данной матрицы слева или справа на невырожденную матрицу, то из формулы (5) следует, что ранги матриц эквивалентных форм одинаковы.


Будем говорить, что форма

\begin{displaymath}f=\sum_{1\leq i, j\leq n}a_{ij}x_ix_j=XAX^{\prime}\end{displaymath}

имеет канонический вид, если она является суммой квадратов переменных с некоторыми коэффициентами. Это равносильно тому, что aij=0 при $i\neq j$, т.е. матрица A -- диагональная.


Теорема. Всякая квадратичная форма эквивалентна некоторой форме канонического вида.


Доказательство. Пусть вид данной формы $f=XAX^{\prime}$ не канонический. Будем доказывать, что эта форма приводится к каноническому виду с помощью невырожденной замены переменных, индукцией по числу этих переменных. Разберем два возможных случая. 1). Предположим, что некоторый коэффициент aii отличен от нуля. Без ограничения общности можно предполагать, что это -- коэффициент a11 (в противном случае мы подходящим образом перенумеруем переменные). Выделим в сумме $f=\sum_{1\leq i, j\leq n}a_{ij}x_ix_j$ все слагаемые, зависящие от x1. Они имеют вид $a_{11}x_1^2,\
a_{1i}x_1x_i$ и ai1xix1 при $i\neq j$. Так как a1ix1xi+ ai1xix1=2a1ix1xi, то такие же члены, зависящие от x1, имеет многочлен

a11-1(a11x1+a12x2+...+a1nxn)2.

Введем новые переменные y1,...,yn, которые выражаются через старые следующим образом:

\begin{displaymath}y_1=a_{11}x_1+a_{12}x_2+...+a_{1n}x_n,\ y_2=x_2,...,y_n=x_n.\end{displaymath}

Обратным выражением будет

\begin{displaymath}x_1=a_{11}^{-1}(x_1-a_{12}x_2-...-a_{1n}x_n),\ x_2=y_2,...,x_n=y_n.\end{displaymath}

По построению форма g=f-a11y12 зависит только от переменных y2,...,yn. В силу индукционного предположения найдется невырожденная замена этих переменных

\begin{displaymath}\left\{
\begin{array}{ccc}
y_2&=&t_{22}z_2+...+t_{n2}z_n\...
...vdots\\
y_n&=&t_{2n}z_2+...+t_{nn}z_n,
\end{array}
\right. \end{displaymath}

которая приводит форму g к каноническому виду, например, к виду b2z22+...+bnzn2. Дополняя эту замену выражением y1=z1, мы находим невырожденную замену переменных, приводящую форму f к виду a11-1z1+b2z22+...+bnzn2. 2) Рассмотрим второй случай, когда в форме f все коэффициенты при квадратах переменных равны нулю. Так как форма ненулевая, то в этом случае некоторый коэффициент aij отличен от нуля. Пусть для определенности $a_{12}\neq 0$. Рассмотрим следующую замену переменных

\begin{displaymath}x_1=y_1+y_2,\ x_2=y_1-y_2,\ x_3=y_3,...,x_n=y_n.\end{displaymath}

Эта замена невырожденная, так как определитель соответствующей матрицы замены равен $-2\neq 0$. В новых переменных форма f уже имеет при y12 ненулевой коэффициент 2a12. Это возвращает нас к первому случаю. Теорема доказана.


Замечание. Из доказательства теоремы получается практический метод, который носит название метода Лангранжа, приведения квадратичной формы к каноническому виду.


10.3. Действительные формы. Закон инерции.


Ниже в этом подпункте мы будем рассматривать только формы над полем действительных чисел. Такие формы называются действительными. Из предыдущего подпункта следует, что действительную квадратичную форму $f=XAX^{\prime}$ можно привести к следующему каноническому виду

a1y12+...+asys2-as+1ys+12-...-aryr2+0yr+12+ ...+0yn2,

где все числа a1,...,ar положительны. Сделав замену

\begin{displaymath}y_1=z_1/\sqrt{a_1},...,y_r=z_r/\sqrt{a_r},\ y_{r+1}=z_{r+1},...,
y_n=z_n,\end{displaymath}

мы приведем форму f к виду

\begin{displaymath}z_1^2+...+z_s^2-z_{s+1}^2-...-z_r^2+0z_{r+1}^2+
...+0z_n^2,\hspace{1cm} (6)\end{displaymath}

который называется нормальным. Число s квадратов переменных, входящих в выражение (6) с коэффициентом +1, называется положительным индексом инерции формы f, а число r-s квадратов переменных, входящих в выражение (6) с коэффициентом -1, называется отрицательным индексом инерции формы f. Форму f можно разными способами приводить к нормальному виду. Поэтому корректность определения индексов обеспечивается следующим утверждением.


Теорема (закон инерции). Положительный и отрицательный индексы инерции зависят только от самой формы и не зависят от способа приведения этой формы к нормальному виду.


Доказательство. Пусть форма $f=XAX^{\prime}$ приводится к нормальному виду

g=g(y1,...,yn)=


\begin{displaymath}=y_1^2+...+y_s^2-y_{s+1}^2-...y_r^2+0y_{r+1}^2+
...+0y_n^2.\hspace{1cm} (7)\end{displaymath}

Так как ранг матрицы формы g, равный r, совпадает с рангом матрицы A, то число r однозначно определяется формой f. Предположим, что форма f приводится также к другому нормальному виду

h=h(z1,...,zn)=


\begin{displaymath}=z_1^2+...+z_k^2-z_{k+1}^2-...z_r^2+0z_{r+1}^2+
...+0z_n^2,\hspace{1cm} (8)\end{displaymath}

где $s\neq k$ (пусть для определенности s<k). Так как $f\sim g$ и $f\sim h$, то $g\sim h$. Поэтому существует невырожденная линейная замена

\begin{displaymath}\left\{
\begin{array}{ccc}
z_1&=&t_{11}y_1+t_{21}y_2+...+t_...
..._n&=&t_{1n}y_1+t_{2n}y_2+...+t_{nn}y_n,
\end{array}
\right. ,\end{displaymath}

переводящая форму h в g. Рассмотрим следующую систему однородных линейных уравнений относительно неизвестных y1,...,yn:

\begin{displaymath}\left\{
\begin{array}{ccl}
y_1&=&0\\
\vdots&\vdots&\vdots...
...1n}y_1+...+t_{nn}y_n&=&0.
\end{array}
\right.\hspace{3cm} (9)\end{displaymath}

В этой системе число уравнений меньше числа неизвестных. Поэтому она имеет ненулевое решение y0=(0,...,0,as+1,...,an). Положим z0=(b1,...,bn)=y0T, где T=(tij) -- матрица нашей замены. Так как матрица T невырождена, то вместе со строкой y0 ненулевой будет строка z0. Однако из системы (9) следует, что bk+1=0,...,bn=0. Напомним, что замена Z=YT переводит форму h в g, откуда g(y0)=h(z0) Имеем $g(y^0)=-a_{s+1}^2-...-a_r^2\leq 0$; h(z0)=b12+...+bk2>0, так как хотя бы одно из чисел b1,...,bk отлично от нуля. Полученное противоречие с равенством g(y0)=h(z0) показывает, что наше предположение о том, что $s\neq k$, неверно. Теорема доказана.


10.4. Приведение действительной формы к каноническому виду ортогональным преобразованием.


Пусть $f=XAX^{\prime}$ -- действительная квадратичная форма с симметрической матрицей A. По теореме 9.8.2 существует ортогональная матрица T, для которой $TAT^{-1}=TAT^{\prime}=D$ -- диагональная матрица, диагональные элементы которой совпадают с характеристическими корнями матрицы A. Для квадратичной формы f рассмотрим теперь линейную замену переменных X=YT с матрицей T. После этой замены форма f становится канонической с матрицей D. Таким образом, нами доказана следующая


Теорема. Каждая действительная квадратичная форма может быть приведена к каноническому виду заменой переменных с ортогональной матрицей (ортогональной заменой). При этом коэффициенты канонического вида совпадают с характеристическими корнями матрицы исходной формы.


10.5. Положительно определенные формы


Определение. Действительная квадратичная форма f(x1,...,xn) называется положительно определенной, если для любого ненулевого набора (a1,...,an) действительных значений переменных число f(a1, ...,an) больше нуля.


Примером положительно определенной формы может служить форма x12+...+xn2. Пусть A=(aij) -- квадратная матрица размерности n. Назовем главными минорами этой матрицы определители вида

\begin{displaymath}D_k(A)=\left\vert
\begin{array}{cccc}
a_{11}&a_{12}&...&a_{...
...&a_{kk}
\end{array}
\right\vert,\ \mbox{ где }1\leq k\leq n. \end{displaymath}


Теорема. Пусть $f=XAX^{\prime}$ -- действительная квадратичная форма от n переменных. Тогда равносильны следующие условия. 1. Форма f эквивалентна форме y12+y22+...+yn2. 2. Форма f положительно определена. 3. Все главные миноры матрицы A больше нуля.


Доказательство. 1. $\Longleftrightarrow$ 2. Заметим, что положительная определенность формы сохраняется при эквивалентности. На самом деле, пусть форма f положительно определена, $f\sim g$ и X=YT -- невырожденная замена переменных, переводящая форму f в g. Если a=(a1,...,an) - ненулевой набор действительных чисел, то набор b=aT также отличен от нулевого. Имеем g(a)=f(b)>0. Поэтому форма g положительно определена. Пусть теперь выполняется условие 1. Так как форма y12+y22+...+yn2 положительно определена, то, в силу нашего замечания, положительно определенной будет и эквивалентная ей форма f. Пусть выполняется условие 2. Приведем форму f к нормальному виду

g=g(y1,...,yn)=


\begin{displaymath}y_1^2+...+y_s^2-y_{s+1}^2-...y_r^2+0y_{r+1}^2+
...+0y_n^2.\hspace{1cm} (7)\end{displaymath}

Если s<n, то $g(0,0,...,0,1)\leq 0$. Это противоречит положительной определенности формы f. 1. $\Longrightarrow$ 3. Пусть невырожденная замена X=YT переводит форму f в форму y12+y22+...+yn2. Из сравнения матриц форм имеем $TAT^{\prime}=E$. Отсюда $\vert T\vert\vert A\vert\vert T^{\prime}\vert=\vert A\vert\vert T\vert^2=\vert E\vert=1$. Следовательно, Dn(A)>0. Предположим, что некоторый главный минор $D_k(A)\leq 0$. Рассмотрим форму h от k переменных x1,...,xk, равную f(x1,...,xk,0,...,0). Матрица этой формы равна

\begin{displaymath}\left[
\begin{array}{cccc}
a_{11}&a_{12}&...&a_{1k}\\
a_{...
...ots&\vdots\\
a_{k1}&a_{k2}&...&a_{kk}
\end{array}
\right]. \end{displaymath}

и ее определитель равен Dk(A). Из предыдущего следует, что форма h не положительно определена. Пусть (a1,...,ak) -- ненулевой набор действительных чисел такой, что $h(a_1,....,a_k)\leq 0$. Имеем $f(a_1,...,a_k,0,...,0)=
h(a_1,....,a_k)\leq 0$, что противоречит положительной определенности формы f. 3. $\Longrightarrow$ 1. Пусть все главные миноры матрицы A больше нуля. Рассмотрим форму g(x1,...,xn-1)=f(x1,...,xn-1,0). Ее матрица равна

\begin{displaymath}\left[
\begin{array}{llll}
a_{11}&a_{12}&...&a_{1,n-1}\\
...
...\
a_{n-1,1}&a_{n-1,2}&...&a_{n-1,n-1}
\end{array}
\right]. \end{displaymath}

Используя индукцию по числу переменных, мы можем утверждать, что существует невырожденное линейное преобразование переменных

\begin{displaymath}\left\{
\begin{array}{lll}
x_1&=&t_{11}y_1+t_{21}y_2+...+t_...
...y_1+t_{2,n-1}y_2+...+t_{n-1,n-1}y_{n-1},
\end{array}
\right. \end{displaymath}

приводящее форму g к виду y12+y22+...+yn-12. Рассмотрим матрицу

\begin{displaymath}T=\left[
\begin{array}{lllll}
t_{11}&t_{12}&...&t_{1,n-1}&0...
...-1,2}&...&t_{n-1,n-1}&0\\
0&0&...&0&1
\end{array}
\right] .\end{displaymath}

порядка n и замену X=YT переменных формы f. Пусть h(Y)=f(YT). Матрица $TAT^{\prime}$ формы h имеет вид

\begin{displaymath}\left[
\begin{array}{lllll}
1&0&...&0&b_{1n}\\
0&1&...&0&...
...\\
b_{n1}&b_{n2}&...&b_{n,n-1}&b_{nn}
\end{array}
\right] ,\end{displaymath}

а сама форма представляется как

y12+y22+...+yn-12+bnnyn2+2b1ny1yn+... +2bn-1,nyn-1yn.

Новая замена

\begin{displaymath}y_1=z_1-b_{1n}z_n,....,y_{n-1}=z_{n-1}-b_{n-1,n}z_n,\ y_n=z_n\end{displaymath}

приводит форму h к виду l= z12+...+zn-12+czn2. Осталось показать, что c>0, тогда форма l, а вместе с ней и f, будет положительно определена. Число c является определителем матрицы формы l. Пусть X=ZS -- невырожденная замена переменных, переводящая форму f в l. Тогда из предыдущего пункта доказательства следует, что c=|A||S|2. Так как |A|>0, то и c>0. Теорема доказана.


10.6. Приведение к каноническому виду пары форм.


В этом разделе рассмотрим следующую задачу. Пусть имеются две действительные квадратичные формы $f=XAX^{\prime}$ и $g=XBX^{\prime}$ от переменных x1,...,xn. Существует ли единая невырожденная замена переменных, приводящая обе формы одновременно к каноническому виду? Вообще говоря, ответ на этот вопрос отрицательный, что следует из упражнения, которое мы приведем ниже. Однако в следующем важном случае ответ получается положительным.


Теорема. Пусть одна из форм $f=XAX^{\prime}$ и $g=XBX^{\prime}$ положительно определена. Тогда существует невырожденная замена переменных, приводящая одновременно обе формы к каноническому виду.


Доказательство. Предположим для определенности, что форма g положительно определена. Тогда существует невырожденная замена переменных, переводящая форму g в сумму квадратов переменных. Это же преобразование применяем к форме f. Чтобы не вводить новых обозначений, будем сразу предполагать, что g=x12+....+xn2. В пункте 10.4 мы доказали, что форму f с помощью некоторой ортогональной замены переменных X=YT можно привести к каноническому виду. Применим это же преобразование к форме g:

\begin{displaymath}XEX^{\prime}=YTET^{\prime}Y^{\prime}=YEY^{\prime}=
y_1^2+....+y_n^2,\end{displaymath}

т.е. форма f осталась суммой квадратов переменных. Итак, мы нашли преобразование, приводящее одновременно обе формы к каноническому виду. Теорема доказана.


Упражнение. 1. Доказать, что если действительная невырожденная линейная замена переменных X=YT приводит форму f=2x1x2 к каноническому виду, то матрица T имеет вид

\begin{displaymath}\left[
\begin{array}{rr}
a&b\\
-ac&bc
\end{array}
\right] ,\end{displaymath}

где a,b,c -- ненулевые действительные числа. 2. Доказать, что невырожденная линейная замена X=YT с действительной матрицей

\begin{displaymath}T=\left[
\begin{array}{rr}
a&b\\
-ac&bc
\end{array}
\right] \end{displaymath}

не переводит форму g=x12-x22 в форму канонического вида.