선형 대수학(linear algebra)에서, 정사각 행렬(square matrix) \(A\)는 만약 그것이 대각 행렬과 닮았으면, 즉, \(P^{-1}AP=D\), 또는 동등하게 \(A = PDP^{-1}\)를 만족하는 역가능 행렬(invertible matrix) \(P\)와 대각 행렬 \(D\)가 존재하면 대각화-가능(diagonalizable) 또는 비-결합있는(non-defective)이라고 불립니다. (그러한 \(P\), \(D\)는 고유하지 않습니다.) 유한-차원 벡터 공간 \(V\)에 대해, 선형 맵(linear map) \(T:V\to V\)는 만약 \(T\)의 고유벡터(eigenvectors)로 구성된 \(V\)의 순서화된 기저(ordered basis)가 존재하면 대각화-가능(diagonalizable)이라고 불립니다. 이들 정의는 동등합니다: 만약 \(T\)가 위와 같이 [[matrix (mathematics)|행렬]] 표현 \(T = PDP^{-1}\)를 가지면, \(P\)의 열 벡터는 \(T\)의 고유벡터로 구성된 기저를 형성하고, \(D\)의 대각선 엔트리는 \(T\)의 해당하는 고윳값(eigenvalues)입니다; 이 고유벡터 기저에 관해, \(A\)는 \(D\)에 의해 표시됩니다. 대각화(Diagonalization)는 위의 \(P\)와 \(D\)를 찾는 과정입니다.
대각화-가능 행렬과 맵은 일단 그것들의 고윳값과 고유벡터가 알려져 있으면 특히 계산하기 쉽습니다. 대각 엔트리에 그 거듭제곱을 간단히 올림으로써 대각 행렬 \(D\)를 거듭제곱할 수 있고, 대각 행렬의 행렬식(determinant)은 단순히 모든 대각 엔트리의 곱입니다; 그러한 계산은 쉽게 \(A=PDP^{-1}\)로 일반화됩니다. 기하학적으로, 대각화-가능 행렬은 비균질 팽창(inhomogeneous dilation, 또는 이방성 스케일링(anisotropic scaling))입니다 — 그것은 균질 팽창(homogeneous dilation)과 마찬가지로 공간을 스케일하지만, 각 고유벡터 축을 따라 다른 인수, 해당 고윳값에 의해 주어진 인수로 스케일합니다.
대각화-가능이 아닌 정사각 행렬은 결함-있는(defective) 것이라고 불립니다. 실수 엔트리를 갖는 행렬 \(A\)는 실수에 걸쳐 결함-있는 것으로 발생할 수 있으며, 즉, \(A = PDP^{-1}\)은 실수 엔트리를 갖는 임의의 역가능 \(P\)와 대각 \(D\)에 대해 불가능하지만, \(A\)가 복소수에 걸쳐 대각화-가능이 되도록 복소수 엔트리로 가능합니다. 예를 들어, 이것은 일반 회전 행렬(rotation matrix)에 대한 경우입니다.
대각화-가능 행렬에 대한 많은 결과는 대수적으로 닫힌 필드 (예를 들어, 복소수)에 걸쳐에서만 유지됩니다. 이 경우에서, 대각화-가능 행렬은 모든 행렬의 공간에서 조밀하며, 이는 결함-있는 행렬이 작은 섭동(perturbation)에 의해 대각화-가능 행렬로 변형될 수 있음을 의미합니다; 그리고 조르당 정규 형식(Jordan normal form)은 임의의 행렬이 고유하게 대각화-가능 행렬과 거듭제곱영 행렬(nilpotent matrix)의 합이라고 말합니다. 대수적으로 닫힌 필드에 걸쳐, 대각화-가능 행렬은 반-단순 행렬(semi-simple matrices)과 동등합니다.
Definition
필드(field) \(F\)에서 엔트리를 갖는 정사각 \(n \times n\) 행렬, \(A\)는 만약 \(P^{-1}AP\)가 대각 행렬임을 만족하는 역가능 행렬 (즉, 일반 선형 그룹 \(\text{GL}_n(F)\)의 원소), \(P\)가 존재하면 대각화-가능(diagonalizable) 또는 비-결점있는(nondefective)이라고 불립니다. 형식적으로
\(\quad A \in F^{n \times n} \text{ diagonalizable} \iff \exists\, P \in \operatorname{GL}_n(F) : \; P^{-1}\!AP \text{ diagonal}\)
Characterization
대각화-가능 맵과 행렬에 대한 토대적인 사실은 다음에 의해 표현됩니다:
- 필드 \(F\)에 걸쳐 \(n \times n\) 행렬 \(A\)가 대각화-가능인 것과 그 고유공간의 차원(dimensions)의 합이 \(n\)과 같은 것은 필요충분 조건이며, 이것이 그 경우인 것과 \(A\)의 고윳값으로 구성된 \(F^n\)의 기저(basis)가 존재하는 것은 필요충분 조건입니다. 만약 그러한 기저가 발견되면, 이들 기저 벡터(basis vectors)를 열로 가지는 행렬 \(P\)를 형성할 수 있고, \(P^{-1}AP\)는 그 대각 엔트리가 \(A\)의 고윳값인 대각 행렬일 것입니다. 행렬 \(P\)는 \(A\)에 대해 양식 행렬(modal matrix)로 알려져 있습니다.
- 선형 맵 \(T : V \to V\)가 대각화-가능인 것과 그 고유공간의 차원의 합이 \(\dim(V)\)과 같은 것은 필요충분 조건이며, 이것이 그 경우인 것과 \(T\)의 고유벡터로 구성된 \(V\)의 기저가 존재하는 것은 필요충분 조건입니다. 그러한 기저에 관해, \(T\)는 대각 행렬에 의해 표현될 것입니다. 이 행렬의 대각 엔트리는 \(T\)의 고윳값입니다.
다음의 충분 (필수는 아님) 조건이 종종 유용합니다.
- \(n \times n\) 행렬 \(A\)는 만약 그것이 \(F\)에서 구별되는 고윳값을 가지면, 즉, 그것의 특성 다항식(characteristic polynomial)이 \(F\)에서 \(n\)개의 구별되는 근을 가지면 필드 \(F\)에 걸쳐 대각화-가능입니다; 어쨌든, 그 전환은 거짓일 수 있습니다. 다음을 생각해 보십시오:
- \(\begin{bmatrix}
-1 & 3 & -1 \\
-3 & 5 & -1 \\
-3 & 3 & 1
\end{bmatrix},\) - 이는 1, 2, 2 (모두가 구별되지는 않음)를 가지고 (\(A\)와 닮은) 대각 형식을 갖는 대각화-가능입니다:
- \(\begin{bmatrix}
1 & 0 & 0 \\
0 & 2 & 0 \\
0 & 0 & 2
\end{bmatrix}\) - 그리고 기저 행렬 \(P\)의 변경:
- \(\begin{bmatrix}
1 & 1 & -1 \\
1 & 1 & 0 \\
1 & 0 & 3
\end{bmatrix}.\) - 그 전환은 \(A\)가 1보다 큰 차원의 고유공간을 가질 때 실패합니다. 이 예제에서, 고윳값 2와 결합된 \(A\)의 고유공간은 차원 2를 가집니다.
- \(\begin{bmatrix}
- \(n = \dim(V)\)를 갖는 선형 맵 \(T : V \to V\)은 만약 그것이 \(n\)개의 구별되는 고윳값이면, 즉, 그것의 특성 다항식이 \(F\)에서 \(n\)개의 구별되는 근을 가지면 대각화-가능입니다.
\(A\)를 \(F\)에 걸쳐 행렬이라고 놓습니다. 만약 \(A\)가 대각화-가능이면, 그것의 임의의 거듭제곱도 마찬가지입니다. 반대로, 만약 \(A\)가 역-가능이고, \(F\)가 대수적으로 닫혀 있고, \(A^n\)이 \(F\)의 특성의 정수 배수가 아닌 일부 \(n\)에 대해 대각화-가능이면, \(A\)는 대각화-가능입니다. 증명: 만약 \(A^n\)이 대각화-가능이면, \(A\)는 일부 다항식 \(\left(x^n - \lambda_1\right) \cdots \left(x^n - \lambda_k\right)\)에 의해 소멸되며, 이는 중복 근을 가지지 않고 (왜냐하면 \(\lambda_j \ne 0\)), \(A\)의 최소 다항식으로 나뉩니다.
복소수 \(\mathbb{C}\)에 걸쳐, 거의 모든 각 행렬이 대각화-가능입니다. 보다 정확하게: \(\mathbb{C}\)에 걸쳐 대각화-가능이 아닌 복소수 \(n \times n\) 행렬의 집합은, \(\mathbb{C}^{n \times n}\)의 부분집합으로 고려되며, 르베그 측정(Lebesgue measure) 영을 가집니다. 역시 대각화-가능 행렬은 자르스키 토폴로지(Zariski topology)에 관해 조밀한 부분집합을 형성한다고 말할 수 있습니다: 비-대각화가능 행렬은 초표면인 특성 다항식의 판별식(discriminant)의 사리지는 집합(vanishing set) 내부에 있습니다. 그로부터 노름(norm)에 의해 주어진 보통의 (강력한) 토폴로지에서 밀도도 따릅니다. \(\mathbb{R}\)에 대해서도 마찬가지입니다.
조르당–슈발레 분해(Jordan–Chevalley decomposition)는 연산자를 그것의 반단순 (즉, 대각화-가능) 부분과 그것의 거듭제곱영(nilpotent) 부분의 합으로 표현합니다. 따라서, 행렬이 대각화-가능인 것과 그것의 거듭제곱영 부분이 영인 것은 필요충분 조건입니다. 다시 말로 하면, 행렬은 만약 그것의 조르당 형식에서 각 블록이 거듭제곱영 부분을 가지지 않으면 대각화-가능입니다; 즉, 각 "블록"은 일-대-일 행렬입니다.
Diagonalization
만약 행렬 \(A\)가 대각화될 수 있으면, 즉,
\(\quad P^{-1}AP = \begin{bmatrix}
\lambda_1 & 0 & \cdots & 0 \\
0 & \lambda_2 & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & \lambda_n
\end{bmatrix},\)
다음과 같습니다:
\(\quad AP = P\begin{bmatrix}
\lambda_1 & 0 & \cdots & 0 \\
0 & \lambda_2 & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & \lambda_n
\end{bmatrix}.\)
\(P\)를 열 벡터 \(\boldsymbol{\alpha}_{i}\)의 블록 행렬로 쓰면,
\(\quad P = \begin{bmatrix} \boldsymbol{\alpha}_1 & \boldsymbol{\alpha}_2 & \cdots & \boldsymbol{\alpha}_n \end{bmatrix},\)
위의 방정식은 다음과 같이 다시 쓸 수 있습니다:
\(\quad A\boldsymbol{\alpha}_i = \lambda_i \boldsymbol{\alpha}_i \qquad (i=1,2,\dots,n).\)
따라서 \(P\)의 오른쪽 고유벡터(right eigenvectors)이고, 해당하는 대각 엔트리는 해당하는 고윳값(eigenvalue)입니다. \(P\)의 역-가능성은 역시 고유벡터가 선형적으로 독립(linearly independent)이고 \(F^{n}\)의 기저를 형성함을 시사합니다. 이것은 대각화-가능성과 대각화의 정식의 접근 방식을 위한 필요충분 조건입니다. \(P^{-1}\)의 왼쪽 고유벡터(left eigenvectors)입니다.
복소수 행렬 \(A\in\mathbb{C}^{n\times n}\)이 에르미트 행렬 (또는 더 일반적으로 정규 행렬)일 때, \(A\)의 고유벡터는 \(\mathbb{C}^n\)의 직교정규 기저(orthonormal basis)를 형성하도록 선택될 수 있고, \(P\)는 유니태리 행렬(unitary matrix)이 되도록 선택될 수 있습니다. 만약 게다가, \(A\in\mathbb{R}^{n\times n}\)이 실수 대칭 행렬(symmetric matrix)이면, 그것의 고유벡터는 \(\mathbb{R}^n\)의 직교정규 기저로 선택될 수 있고 \(P\)는 직교 행렬(orthogonal matrix)로 선택될 수 있습니다.
대부분의 실제 연구 행렬은 컴퓨터 소프트웨어를 사용하여 수치적으로 대각화됩니다. 이를 달성하기 위해 많은 알고리듬이 존재합니다.
Simultaneous diagonalization
행렬의 집합은 만약 \(P^{-1}AP\)가 그 집합에서 모든 각 \(A\)에 대해 대각 행렬임을 만족하는 단일 역-가능 행렬 \(P\)가 존재하면 동시에 대각화-가능(simultaneously diagonalizable)이라고 말합니다. 다음 정리는 동시에 대각화-가능 행렬을 특징짓습니다: 대각화-가능 행렬이 교환하는 것과 그 집합이 동시에 대각화-가능인 것은 필요충분 조건입니다.
\(n > 1\)을 갖는 (\(\mathbb{C}\)에 걸쳐) 모든 \(n \times n\) 대각화-가능 행렬의 집합은 동시에 대각화-가능은 아닙니다. 예를 들어, 다음 행렬은
\(\quad \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix} \quad\text{and}\quad \begin{bmatrix} 1 & 1 \\ 0 & 0 \end{bmatrix} \)
그것들이 교환하지 않기 때문에 대각화-가능이지만 동시에 대각화-가능은 아닙니다.
집합이 교환하는 정규 행렬(normal matrices)로 구성되는 것과 그것이 유니태리 행렬(unitary matrix)에 의해 동시에 대각화-가능인 것은 필요충분 조건입니다; 즉, \(U^{*} AU\)가 그 집합에서 모든 각 \(A\)에 대해 대각선임을 만족하는 유니태리 행렬 \(U\)가 존재합니다.
리 이론(Lie theory)의 언어에서, 동시에 대각화-가능 행렬의 집합은 토럴 리 대수(toral Lie algebra)를 생성합니다.
Examples
Diagonalizable matrices
- 인볼루션(Involutions)은 대각선 위에 ±1을 갖는 실수 (그리고 실제로 2가 아닌 특성의 임의의 필드)에 걸쳐 대각선-가능입니다.
- 유한 차수 자기-사상(endomorphisms)은 대각선 위에 단위의 근(roots of unity)을 갖는 \(\mathbb{C}\) (또는 필드의 특성이 자기사상의 차수를 나누지 않는 대수적으로 닫힌 필드)에 걸쳐 대각화-가능입니다. 이것은 최소 다항식이 분리-가능(separable)이기 때문에 따르는데, 왜냐하면 단위의 근이 구별되기 때문입니다.
- 투영(Projections)은 대각선 위에 0과 1을 갖는 대각화-가능입니다.
- 실수 대칭 행렬(symmetric matrices)은 직교 행렬(orthogonal matrices)에 의해 대각화-가능입니다; 즉, 실수 대칭 행렬 \(A\)가 주어졌을 때, \(Q^{\mathrm T}AQ\)는 일부 직교 행렬 \(Q\)에 대해 대각선입니다. 보다 일반적으로, 행렬이 유니태리 행렬(unitary matrices)에 의해 대각화-가능인 것과 그것들이 정규(normal)인 것은 필요충분 조건입니다. 실수 대칭 행렬의 경우에서, \(A=A^{\mathrm T}\)임을 알 수 있으므로, 분명히 \(AA^{\mathrm T} = A^{\mathrm T}A\)가 성립합니다. 정규 행렬의 예제는 실수 대칭 (또는 반-대칭) 행렬 (예를 들어, 공분산 행렬)과 에르미트 행렬 (또는 반-에르미트 행렬)을 포함합니다. 무한-차원 벡터 공간에 대한 일반화에 대해 스펙트럼 정리(spectral theorems)를 참조하십시오.
Matrices that are not diagonalizable
일반적으로, 회전 행렬(rotation matrix)은 실수에 걸쳐 대각화-가능이 아니지만, 모든 회전 행렬(rotation matrices)은 복소수 필드에 걸쳐 대각선-가능입니다. 심지어 행렬이 대각화-가능이 아니더라도, 항상 "할 수 있는 최선을 다하는 것"이 가능하고, 선행하는 대각선 위에 고윳값과 상부대각선(superdiagonal) 위에 1 또는 0으로 구성된 같은 속성을 갖는 행렬을 찾을 수 있습니다 – 조르당 정규 형식(Jordan normal form)으로 알려져 있습니다.
일부 행렬은 임의의 필드에 걸쳐 대각화-가능이 아니며, 특히 비-영 거듭제곱영 행렬(nilpotent matrices)이 그렇습니다. 이것은 고윳값의 대수적 및 기하학적 중복도가 일치하지 않으면 더 일반적으로 발생합니다. 예를 들어, 다음을 생각해 보십시오:
\(\quad C = \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix}. \)
이 행렬은 대각화-가능이 아닙니다: \(U^{-1}CU\)가 대각 행렬임을 만족하는 행렬 \(U\)는 없습니다. 실제로, \(C\)는 하나의 고윳값 (즉, 0)을 가지고 이 고윳값은 대수적 중복도 2와 기하학적 중복도 1을 가집니다.
일부 실수 행렬은 실수에 걸쳐 대각화-가능이 아닙니다. 예를 들어 다음 행렬을 생각해 보십시오:
\(\quad B = \left[\begin{array}{rr} 0 & 1 \\ \!-1 & 0 \end{array}\right]. \)
행렬 \(B\)는 임의의 실수 고윳값을 가지지 않으므로, \(Q^{-1}BQ\)가 대각 행렬임을 만족하는 실수 행렬 \(Q\)는 없습니다. 어쨌든, 복소수를 허용하면 \(B\)를 대각화할 수 있습니다. 사실, 우리가 다음을 취한다면
\(\quad Q = \begin{bmatrix} 1 & i \\ i & 1 \end{bmatrix}, \)
\(Q^{-1}BQ\)는 대각입니다. \(B\)는 각도 \(\theta = \frac{3\pi}{2}\)만큼 반시계 방향으로 회전하는 회전 행렬임을 쉽게 알 수 있습니다.
위의 예제는 대각화-가능 행렬의 합이 대각화-가능일 필요가 없음을 보여줌을 주목하십시오.
How to diagonalize a matrix
행렬을 대각화하는 것은 고유벡터가 기저를 형성하는 경우에서 그것의 고윳값과 고유벡터를 찾는 것과 같은 과정입니다. 예를 들어, 다음 행렬을 생각해 보십시오:
\(\quad A=\left[\begin{array}{rrr}
0 & 1 & \!\!\!-2\\
0 & 1 & 0\\
1 & \!\!\!-1 & 3
\end{array}\right].\)
특성 다항식(characteristic polynomial) \(p(\lambda)=\det(\lambda I-A)\)의 근은 고윳값 \(\lambda_1 = 1,\lambda_2 = 1,\lambda_3 = 2\)을 가집니다. 선형 방정식 \(\left(I-A\right) \mathbf{v} = \mathbf{0}\)을 푸는 것은 고유벡터 \(\mathbf{v}_1 = (1,1,0)\)와 \(\mathbf{v}_2 = (0,2,1)\)를 제공하지만, \(\left(2I-A\right)\mathbf{v} = \mathbf{0}\)는 \(\mathbf{v}_3 = (1,0,-1)\)를 제공합니다; 즉, \(i = 1,2,3\)에 대해, \(A \mathbf{v}_i = \lambda_i \mathbf{v}_i\)입니다. 이들 벡터는 \(V = \mathbb{R}^3\)의 기저를 형성하므로, 우리는 기저-의-변경 행렬 \(P\)의 열 벡터로 그것들을 조합하여 다음을 얻을 수 있습니다:
\(\quad P^{-1}AP =
\left[\begin{array}{rrr}
1 & 0 & 1\\
1 & 2 & 0\\
0 & 1 & \!\!\!\!-1
\end{array}\right]^{-1}
\left[\begin{array}{rrr}
0 & 1 & \!\!\!-2\\
0 & 1 & 0\\
1 & \!\!\!-1 & 3
\end{array}\right]
\left[\begin{array}{rrr}
1 & \,0 & 1\\
1 & 2 & 0\\
0 & 1 & \!\!\!\!-1
\end{array}\right]
=
\begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 2 \end{bmatrix} = D .\)
우리는 변환 측면에서 이 방정식을 볼 수 있습니다: \(P\)는 표준 기저를 고유기저, \(P \mathbf{e}_i = \mathbf{v}_i\)로 취하므로, \(P^{-1} AP\)가 \(D\)의 정의하는 속성인 그것의 고유벡터로 표준 기저를 가지도록 다음을 얻습니다:
\(\quad P^{-1} AP \mathbf{e}_i =
P^{-1} A \mathbf{v}_i =
P^{-1} (\lambda_i\mathbf{v}_i) =
\lambda_i\mathbf{e}_i.\)
\(P\)에서 고유벡터의 선호하는 순위가 없음을 주목하십시오; \(P\)에서 고유벡터(eigenvectors)의 순서를 변경하는 것은 \(A\)의 대각화된 형식에서 고윳값(eigenvalues)의 순서만 변경됩니다.
Application to matrix functions
대각화는 행렬 \(A = PDP^{-1}\)의 거듭제곱을 효율적으로 계산하기 위해 사용될 수 있습니다:
\(\quad \begin{align}
A^k &= \left(PDP^{-1}\right)^k = \left(PDP^{-1}\right) \left(PDP^{-1}\right) \cdots \left(PDP^{-1}\right) \\
&= PD\left(P^{-1}P\right) D \left(P^{-1}P\right) \cdots \left(P^{-1}P\right) D P^{-1} = PD^kP^{-1},
\end{align}\)
그리고 후자는 대각 행렬의 거듭제곱만 포함하기 때문에 계산하기 쉽습니다. 예를 들어, 위의 예에서 고윳값 \(\lambda = 1,1,2\)을 갖는 행렬 \(A\)에 대해, 다음을 계산합니다:
\(\quad \begin{align}
A^k = PD^kP^{-1}
&= \left[\begin{array}{rrr}
1 & \,0 & 1 \\
1 & 2 & 0 \\
0 & 1 & \!\!\!\!-1
\end{array}\right]
\begin{bmatrix} 1^k & 0 & 0 \\ 0 & 1^k & 0 \\ 0 & 0 & 2^k \end{bmatrix}
\left[\begin{array}{rrr}
1 & \,0 & 1 \\
1 & 2 & 0 \\
0 & 1 & \!\!\!\!-1
\end{array}\right]^{-1} \\[1em]
&= \begin{bmatrix}
2 - 2^k & -1 + 2^k & 2 - 2^{k + 1} \\
0 & 1 & 0 \\
-1 + 2^k & 1 - 2^k & -1 + 2^{k + 1}
\end{bmatrix}.
\end{align}\)
이 접근 방식은 거듭제곱 급수로 정의될 수 있는 행렬 지수(matrix exponential)와 다른 행렬 함수(matrix functions)로 일반화될 수 있습니다. 예를 들어, \(\exp(A) = I + A + \frac{1}{2!}A^2 + \frac{1}{3!}A^3 + \cdots\)를 정의하여, 다음을 가집니다:
\(\quad \begin{align}
\exp(A) = P \exp(D) P^{-1}
&= \left[\begin{array}{rrr}
1 & \,0 & 1 \\
1 & 2 & 0 \\
0 & 1 & \!\!\!\!-1
\end{array}\right]
\begin{bmatrix} e^1 & 0 & 0 \\ 0 & e^1 & 0 \\ 0 & 0 & e^2 \end{bmatrix}
\left[\begin{array}{rrr}
1 & \,0 & 1\\
1 & 2 & 0\\
0 & 1 & \!\!\!\!-1
\end{array}\right]^{-1} \\[1em]
&= \begin{bmatrix}
2 e - e^2 & -e + e^2 & 2 e - 2 e^2 \\
0 & e & 0 \\
-e + e^2 & e - e^2 & -e + 2 e^2
\end{bmatrix}.
\end{align}\)
이것은 피보나치 숫자(Fibonacci numbers)와 같은 선형 재귀 수열(linear recursive sequences)의 항에 대해 닫힌 형식 표현을 찾는 데 특히 유용합니다.
Particular application
예를 들어, 다음 행렬을 생각해 보십시오:
\(\quad M = \begin{bmatrix}a & b - a\\ 0 & b\end{bmatrix}.\)
\(M\)의 다양한 거듭제곱을 계산하는 것은 다음과 같은 놀라운 패턴을 드러냅니다:
\(\quad
M^2 = \begin{bmatrix}a^2 & b^2-a^2 \\ 0 &b^2 \end{bmatrix},\quad
M^3 = \begin{bmatrix}a^3 & b^3-a^3 \\ 0 &b^3 \end{bmatrix},\quad
M^4 = \begin{bmatrix}a^4 & b^4-a^4 \\ 0 &b^4 \end{bmatrix},\quad
\ldots
\)
위의 현상은 \(M\)을 대각화함으로써 설명될 수 있습니다. 이를 달성하기 위해, \(M\)의 고유벡터로 구성된 \(\mathbb{R}^2\)의 기저가 필요합니다. 그러한 고유벡터 기저 중 하나는 다음과 같이 주어집니다:
\(\quad
\mathbf{u} = \begin{bmatrix} 1 \\ 0 \end{bmatrix} = \mathbf{e}_1,\quad
\mathbf{v} = \begin{bmatrix} 1 \\ 1 \end{bmatrix} = \mathbf{e}_1 + \mathbf{e}_2,
\)
여기서 \(\mathbf e_i\)가 \(\mathbb{R}^n\)의 표준 기저를 나타냅니다. 기저의 역 변경은 다음과 같이 주어집니다:
\(\quad \mathbf{e}_1 = \mathbf{u},\qquad \mathbf{e}_2 = \mathbf{v} - \mathbf{u}.\)
간단한 계산은 다음임을 보여줍니다:
\(\quad M\mathbf{u} = a\mathbf{u},\qquad M\mathbf{v} = b\mathbf{v}.\)
따라서, \(a\)와 \(b\)는 각각 \(\mathbf u\)와 \(\mathbf v\)에 해당하는 고윳값입니다. 행렬 곱셈의 선형성에 의해, 우리는 다음임을 가집니다:
\(\quad M^n \mathbf{u} = a^n \mathbf{u},\qquad M^n \mathbf{v} = b^n \mathbf{v}.\)
표준 기준으로 다시 전환하여, 다음임을 가집니다:
\(\quad \begin{align}
M^n \mathbf{e}_1 &= M^n \mathbf{u} = a^n \mathbf{e}_1, \\
M^n \mathbf{e}_2 &= M^n \left(\mathbf{v} - \mathbf{u}\right) = b^n \mathbf{v} - a^n\mathbf{u} = \left(b^n - a^n\right) \mathbf{e}_1 + b^n\mathbf{e}_2.
\end{align}\)
행렬 형식으로 표현되는 선행 관계는 다음과 같습니다:
\(\quad M^n = \begin{bmatrix} a^n & b^n - a^n \\ 0 & b^n \end{bmatrix}, \)
이에 따라서 위의 현상을 설명합니다.
Quantum mechanical application
양자 역학적 계산과 양자 화학적 계산에서, 행렬 대각화는 가장 자주 적용되는 수치적 과정 중 하나입니다. 기본적인 이유는 시간-독립적인 슈뢰딩거 방정식(Schrödinger equation)이 무한 차원 공간 (힐베르트 공간) 위에 대부분의 물리적 상황에도 불구하고 고윳값 방정식이기 때문입니다.
매우 공통적인 근사는 힐베르트 공간을 유한 차원으로 자르는 것이며, 그 후에 슈뢰딩거 방정식은 실수 대칭, 또는 복소수 에르미트 행렬의 고윳값 문제로 공식화될 수 있습니다. 형식적으로 이 근사는 변형 원리(variational principle)에 기초하며, 아래에서 경계진 해밀턴에 유효합니다.
일-차 섭동 이론(First-order perturbation theory)은 역시 퇴화 상태에 대한 행렬 고윳값 문제로 이어집니다.
See also
References
- Horn, Roger A.; Johnson, Charles R. (2013). Matrix Analysis, second edition. Cambridge University Press. ISBN 9780521839402.
- Anton, H.; Rorres, C. (22 Feb 2000). Elementary Linear Algebra (Applications Version) (8th ed.). John Wiley & Sons. ISBN 978-0-471-17052-5.