固有値

ケーリー・ハミルトンの定理

ケーリー・ハミルトンの定理の定義と証明を確認し、実際の例題を解いて理解しよう。ケーリー・ハミルトンの定理は行列の次数下げや冪乗等に応用される定理であり、非常に重要な考え方である。

ケーリー・ハミルトンの定理とは?

ケーリー・ハミルトンの定理とは、正方行列 \(A\) の固有多項式 \(|\lambda E-A|\) の \(\lambda\) を \(A\) に置き換えると、零行列 \(O\) になるという定理である。

(例)

$$A=\begin{pmatrix}-1 & -4\\3 & 6\end{pmatrix}$$

$$|\lambda E-A|=\color{red}{\lambda}^2-5\color{red}{\lambda}+6$$

$$\color{red}{A}^2-5\color{red}{A}+6E=O$$

(注)定数項は単位行列 \(E\) を補う必要がある

すなわち、ケーリー・ハミルトンの定理とは正方行列 \(A\) が満たす固有の方程式の求め方を示す定理であり、特にその方程式を固有方程式と呼ぶ。

一般的には以下のように定義される。

ケーリー・ハミルトンの定理

正方行列 \(A\) の固有多項式が \(g_A(\lambda)\) ならば、

$$g_A(A)=O$$

ケーリー・ハミルトンの定理を使うメリット

ケーリー・ハミルトンの定理は特に以下に示すような問題で有効である。

  • 行列の次数下げを必要とする問題
  • 行列の \(n\) 乗をする問題

ケーリー・ハミルトンの定理の証明

ケーリー・ハミルトンの定理の証明には代表的な2つがある。

対角化を用いる証明

正方行列 \(A\) の固有多項式を \(g_A(t)=|tE-A|\) とおく。

\(A\) の次数を \(n\) とし、\(A\) の \(n\) 個の固有値を\(\lambda_1,\cdots\lambda_n\) とすると、

$$g_A(t)=(t-\lambda_1)\cdots(t-\lambda_n)=\sum_{k=0}^n c_kt^k$$

が成り立つ。これを行列に拡張して

$$g_A(A)=(A-\lambda_1E)\cdots(A-\lambda_nE)=\sum_{k=0}^n c_kA^k$$

表すことにする(置き換えではなく新たに定義していることに注意)。ここで、\(A\) を固有値 \(\lambda_1,\cdots\lambda_n\) の順に対角化する正則行列 \(P\) を用意すると、

$$P^{-1}AP=\begin{pmatrix}\lambda_1 & 0 & \cdots & 0 \\0 &  \lambda_2 & \cdots & 0\\\vdots & \vdots & \ddots & \vdots\\0 & 0 & \cdots & \lambda_n\end{pmatrix}=D$$

が成り立ち、\(A=PDP^{-1}\) および \(P^{-1}P=E\) を用いることで、

$$\begin{align*}g_A(A)&=\sum_{k=0}^n c_k(PDP^{-1})^k\\&=\sum_{k=0}^n c_kP\color{red}{D}P^{-1}P\color{red}{D}P^{-1}P\cdots P^{-1}P\color{red}{D}P^{-1}\\&=\sum_{k=0}^n c_kP\color{red}{D^k}P^{-1}\\&=P\left(\sum_{k=0}^n c_kD^k\right)P^{-1}\\&=Pg_A(D)P^{-1}\end{align*}$$

ここで、

$$\begin{align*}g_A(D)&=(D-\lambda_1E)\cdots(D-\lambda_nE)\\&=\begin{pmatrix}\color{red}{0} & 0 & \cdots & 0 \\0 &  \lambda_2-\lambda_1 & \cdots & 0\\\vdots & \vdots & \ddots & \vdots\\0 & 0 & \cdots & \lambda_n-\lambda_1\end{pmatrix}\cdots\begin{pmatrix}\lambda_1-\lambda_n & 0 & \cdots & 0 \\0 &  \lambda_2-\lambda_n & \cdots & 0\\\vdots & \vdots & \ddots & \vdots\\0 & 0 & \cdots & \color{red}{0}\end{pmatrix}\\&=O\end{align*}$$

となるため、\(g_A(A)=O\) が成り立つ。

(対角化できない場合もジョルダン標準形により同等の証明が行える)

余因子行列を用いる証明

正方行列 \(A\) の固有多項式を \(g_A(t)=|tE-A|\) とおく。

\(B(t)=tE-A\) とおくと \(g_A(t)=|B(t)|\) であり、\(B(t)\) の余因子行列を \(\tilde{B}(t)\) とおくことで、

$$B(t)\tilde{B}(t)=g_A(t)E\cdot\cdot\cdot(1)$$

が成り立つ。

\(A\) の次数を \(n\) とすると、 \(\tilde{B}(t)\) の成分は \(n-1\) 次以下の \(t\) の多項式であることから、\(k\) 次正方行列 \(B_k\) を用いて

$$\tilde{B}(t)=\sum_{k=0}^{n-1} t^{k}B_k$$

と表せる。よって、

$$\begin{align*}B(t)\tilde{B}(t)&=(tE-A)\sum_{k=0}^{n-1} t^{k}B_k\\&=\sum_{k=0}^{n-1} t^{k+1}B_k-\sum_{k=0}^{n-1} t^{k}AB_k\\&=t^n\color{red}{B_{n-1}}+\sum_{k=0}^{n-1}t^k\color{blue}{(B_{k-1}-AB_k)}\color{green}{-AB_0}\cdot\cdot\cdot(2)\\\end{align*}$$

また、\(g_A(t)\) は \(n\) 次の \(t\) の多項式であることから、

$$g_A(t)=t^n+\sum_{k=1}^{n-1} t^kc_k+c_0\cdot\cdot\cdot(*)$$

とおくと、

$$g_A(t)E=t^n\color{red}{E}+\sum_{k=1}^{n-1} t^k\color{blue}{c_kE}+\color{green}{c_0E}\cdot\cdot\cdot(3)$$

となり、\((1)\) 式より \((2)\) 式と \((3)\) 式は等しいため、係数比較により、

$$\begin{cases}\color{red}{E=B_{n-1}}\\\color{blue}{c_kE=B_{k-1}-AB_k}&(k=1,\cdots,n-1)\\\color{green}{c_0E=-AB_0}\end{cases}$$

すなわち、両辺に \(A\) の適当な冪乗を左から掛けることにより、

$$\begin{cases}\color{red}{A^n=A^nB_{n-1}}\\\color{blue}{c_kA^k=A^k(B_{k-1}-AB_k)}&(k=1,\cdots,n-1)\\\color{green}{c_0E=-AB_0}\end{cases}$$

となる。よって、\((*)\) 式を行列の多項式に拡張して

$$g_A(A)=A^n+\sum_{k=1}^{n-1} c_kA^k+c_0E$$

表すことにする(置き換えではなく新たに定義していることに注意)と、

$$\begin{align*}g_A(A)&=\color{red}{A^n}+\sum_{k=1}^{n-1}\color{blue}{c_kA^k}+\color{green}{c_0E}\\&=\color{red}{A^nB_{n-1}}+\sum_{k=1}^{n-1}\color{blue}{A^k(B_{k-1}-AB_k)}\color{green}{-AB_0}\\&=A^nB_{n-1}+\sum_{k=1}^{n-1}(A^kB_{k-1}-A^{k+1}B_k)-AB_0\\&=(A^nB_{n-1}-A^nB_{n-1})+\cdots+(AB_0-AB_0)\\&=O\end{align*}$$

となるため、\(g_A(A)=O\) が成り立つ。

典型的な間違いの証明を紹介する。


正方行列 \(A\) の固有方程式は、

$$|\lambda E-A|=0$$

であり、 \(\lambda\) を \(A\) に置き換えても

$$|AE-A|=|A-A|=|O|=0$$

が成り立つことから題意が示された。


この証明では \(\lambda\) (スカラー)を \(A\) (行列)に勝手に置き換えているが、置き換えた式の意味を述べていないため誤りとなる。

例題1

行列 \(A\) が以下で与えられるとき、 \(A^3-8A^2+22A-17E\) の値を求めよ。

$$A=\begin{pmatrix}-1 & -4\\3 & 6\end{pmatrix}$$

解答

固有多項式が \(g_A(\lambda)=\lambda^2-5\lambda+6\) で表されることから、ケーリー・ハミルトンの定理より、

$$A^2-5A+6E=O$$

であり、

$$\begin{align*}A^3-8A^2+22A-17E&=\color{red}{(A^2-5A+6E)}(A-3E)+A+E\\&=\color{red}{O}+A+E\\&=A+E\end{align*}$$

となるので、

$$A^3-8A^2+22A-17E=\begin{pmatrix}0 & -4\\3 & 7\end{pmatrix}$$

2次の行列の場合、ケーリー・ハミルトンの定理は以下の形で表せる。


\(A=\begin{pmatrix}a & b\\c & d\end{pmatrix}\) のとき、

  • \(A^2-(a+d)A+(ad-bc)E=O\)
  • \(A^2-(\mathrm{tr}\:A)A+(\mathrm{det}\:A)E=O\)

例題2

行列 \(A\) が以下で与えられるとき、 \(A^n\) の値を求めよ。

$$A=\begin{pmatrix}-1 & -4\\3 & 6\end{pmatrix}$$

解答

固有多項式が \(g_A(\lambda)=\lambda^2-5\lambda+6\) で表されることから、ケーリー・ハミルトンの定理より、

$$A^2-5A+6E=O$$

であり、

$$\begin{align*}A^n&=\color{red}{(A^2-5A+6E)}\cdot f(A)+(3^n-2^n)A+(3\cdot2^n-2\cdot3^n)E\\&=\color{red}{O}+(3^n-2^n)A+(3\cdot2^n-2\cdot3^n)E\\&=(3^n-2^n)A+(3\cdot2^n-2\cdot3^n)E\end{align*}$$

よって、

$$A^n=\begin{pmatrix}2^{n+2}-3^{n+1} &2^{n+2}-4\cdot3^n \\3^{n+1}-3\cdot2^n & 4\cdot3^n-3\cdot2^n\end{pmatrix}$$

まとめ

  • ケーリー・ハミルトンの定理とは、正方行列の固有多項式にその行列を代入すると零行列になるという定理である。
  • ケーリー・ハミルトンの定理は次数下げや冪乗等に応用される。