수학(mathematics)에서, 행렬의 제곱근(square root of a matrix)은 숫자에서 행렬(matrices)로의 제곱근(square root)의 개념을 확장합니다. 행렬 B는 만약 행렬 곱(matrix product) BB가 A와 같을 때 A의 제곱근이라고 말합니다.
일부 저자는 양수 반한정이고 \(BB=B^{\text{T}}B=A\)임을 만족하는 고유한 행렬 B를 나타내기 위해, A가 양수 반한정(positive semidefinite)일 때의 특정 경우에만 이름 제곱근(square root) 또는 표기법 \(A^{1/2}\)를 사용합니다 (실수-값 행렬에 대해, 여기서 \(B^{\text{T}}\)는 B의 전치입니다).
드물게, 이름 제곱근(square root)은, 심지어 BB ≠ A이더라도, 숄레스키 인수분해(Cholesky factorization)에서와 같이, 양수 반한정 행렬 A를 \(B^{\text{T}}B=A\)로 임의의 인수분해에 대해 사용될 수 있습니다. 이 뚜렷한 의미는 Positive definite matrix § Decomposition에서 설명합니다.
Examples
일반적으로, 행렬은 여러 제곱근을 가질 수 있습니다. 특히, 만약 \(A = B^2\)이면 마찬가지로 \(A=(-B)^2\)입니다.
2×2 항등 행렬(identity matrix) \(\textstyle\begin{pmatrix}1 & 0\\ 0 & 1\end{pmatrix} \)은 무한하게 많은 제곱근을 가집니다. 그것들은 다음에 의해 제공됩니다:
\(\quad \begin{pmatrix} \pm 1 & 0\\ 0 & \pm 1\end{pmatrix}\) and \(\begin{pmatrix} a & b\\ c & -a\end{pmatrix}\)
여기서 \((a, b, c)\)는 \(a^2+bc=1\)임을 만족하는 임의의 숫자 (실수 또는 복소수)입니다. 특히, 만약 \((a,b,t)\)가 임의의 피타고라스 세-쌍(Pythagorean triple)—즉, \(a^2 + b^2 = t^2\)임을 만족하는 양의 정수의 임의의 집합이면, \(\displaystyle \frac{1}{t}\begin{pmatrix}a & b\\ b & -a\end{pmatrix}\)는 대칭적이고 유리수 엔트리를 갖는 \(I\)의 제곱근 행렬입니다. 따라서
\(\quad \begin{pmatrix}1 & 0\\ 0 & 1\end{pmatrix}= \begin{pmatrix}0 & 1\\ 1 & 0\end{pmatrix}^2 = \begin{pmatrix}\frac{4}{5} & \frac{3}{5}\\ \frac{3}{5} & -\frac{4}{5}\end{pmatrix}^2.\)
음의 항등은 제곱근을 가집니다, 예를 들어:
\(\quad -\begin{pmatrix}1 & 0\\ 0 & 1\end{pmatrix} = \begin{pmatrix}0 & -1\\ 1 & 0\end{pmatrix}^2,\)
이는 허수 단위(imaginary unit) i를 나타내기 위해 사용될 수 있고 따라서 2×2 실수 행렬을 사용하는 모든 복소수를 나타내기 위해 사용될 수 있습니다. 복소수의 행렬 표현을 참조하십시오.
실수와 마찬가지로, 실수 행렬은 실수 제곱근을 갖지 못할 수 있지만, 복소수-값 엔트리를 갖는 제곱근을 가질 수 있습니다. 일부 행렬은 제곱근을 가지지 않습니다. 예제는 행렬 \(\begin{pmatrix}0 & 1\\ 0 & 0\end{pmatrix}\)입니다.
비-음의 정수의 제곱근은 다시 정수이거나 무리수이지만, 대조적으로 정수 행렬은 위의 예에서와 같이 엔터리가 유리수이지만 정수가 아닌 제곱근을 가질 수 있습니다.
Positive semidefinite matrices
대칭 실수 n × n 행렬은 만약 모든 \(x \in \mathbb{R}^n\)에 대해 \(x^\textsf{T} A x \geq 0\)이면 양수 반한정(positive semidefinite)이라고 불립니다 (여기서 \(x^\textsf{T}\)는 열 벡터 x를 행 벡터로 변경하는 전치(transpose)를 나타냅니다). 정사각 실수 행렬이 양수 반한정인 것과 일부 행렬 B에 대해 \(A = B^\textsf{T} B\)인 것은 필요충분 조건입니다. 많은 다른 그러한 행렬 B가 있을 수 있습니다. 양수 반한정 행렬 A는 역시 \(A = B B\)임을 만족하는 많은 행렬 B를 가질 수 있습니다. 어쨌든, A는 항상 양수 반한정 (그리고 따라서 대칭)인 정확하게 하나의 제곱근 B를 가집니다. 특히, B는 대칭, \(B=B^\textsf{T}\)임을 요구하기 때문에, 따라서 \(A = B B\) 또는 \(A = B^\textsf{T} B\)라는 두 조건은 동등합니다.
복소수-값 행렬에 대해, 켤레 전치(conjugate transpose) \(B^*\)가 대신 사용되고 양수 반한정 행렬은 에르미트(Hermitian)이며, \(B^*=B\)임을 의미합니다.
Theorem — A를 양수 반한정 행렬 (실수 또는 복소수)라고 놓습니다. 그런-다음 \(A = B^* B\)임을 만족하는 정확하게 하나의 양수 반한정 행렬 B가 있습니다.
이 고유한 행렬은 주요(principal), 비-음수(non-negative), 또는 양수 제곱근(positive square root)이라고 불립니다 (양수 한정 행렬(positive definite matrices)의 경우에서 후자입니다)
실수 양수 반한정 행렬의 주요 제곱근은 실수입니다. 양수 한정 행렬의 주요 제곱근은 양수 반한정입니다; 보다 일반적으로, A의 주요 제곱근의 랭크는 A의 랭크와 같습니다.
주요 제곱근을 취하는 연산은 이 행렬의 집합에서 연속적입니다. 주요 제곱근의 존재와 고유성은 [[Jordan normal form|조르당 정규 형식(Jordan normal form)]]에서 직접 추론될 수 있습니다 (아래 참조).
Matrices with distinct eigenvalues
n 구별되는 비-영 고윳값을 갖는 n×n 행렬은 \(2^n\) 제곱근을 가집니다. 그러한 행렬 A는 고유분해(eigendecomposition) \(VDV^{-1}\)을 가지며, 여기서 V는 열이 V의 고유벡터인 행렬이고 D는 대각 원소가 대응하는 n 고윳값 \(\lambda_i\)인 대각 행렬입니다. 따라서 A의 제곱근은 \(VD^{1/2}V^{-1}\)에 의해 주어지며, 여기서 \(D^{1/2}\)는 D의 임의의 제곱근 행렬이며, 이는, 구별되는 고윳값에 대해, 대각 원소가 D의 대각 원소의 제곱근과 같은 대각이어야 합니다; D의 각 대각 원소의 제곱근에 대해 두 가지 가능한 선택이 있기 때문에, 행렬 \(D^{1/2}\)에 대해 \(2^n\)개의 선택이 있습니다.
이것은 역시 양수-한정 행렬이 정확하게 하나의 양수-한정 제곱근을 가진다는 위의 관찰의 증명으로 이어집니다: 양수 한정 행렬은 오직 양수 고윳값만 가지고, 이들 각 고윳값은 하나의 양의 제곱근만 가집니다; 그리고 제곱근 행렬의 고윳값은 \(D^{1/2}\)의 대각 원소이므로, 제곱근 행렬 자체가 양수 한정이 되려면 원래 고윳값의 고유한 양수 제곱근만 사용해야 합니다.
Solutions in closed form
만약 행렬이 거듭상등(idempotent)이면, \(A^2 = A\)임을 의미하며, 정의에 의해 그것의 제곱근 중 하나는 행렬 자체입니다.
Diagonal and triangular matrices
만약 D가 대각(diagonal) n × n 행렬 \(D = \operatorname{diag}(\lambda_1,\dots,\lambda_n)\)이면, 그것의 제곱근의 일부는 대각 행렬 \(\operatorname{diag}(\mu_1,\dots,\mu_n)\)이며, 여기서 \(\mu_i = \pm \sqrt{\lambda_i}\)입니다. 만약 D의 대각 원소가 실수이고 비-음수이면 그것은 양수 반한정이고, 만약 제곱근이 비-음의 부호로 취해지면, 결과 행렬은 D의 주요 근입니다. 대각 행렬은 위의 항등 행렬에 예시된 것처럼 대각선의 일부 엔트리가 같으면 추가 비-대각 근을 가질 수 있습니다.
만약 U가 위쪽 삼각 행렬 (\(i > j\)에 대해 그 엔트기가 \(u_{i,j} = 0\)임을 의미)이고 그 대각 엔트리 중 많아야 하나가 0이면, 방정식 \(B^2 = U\)의 하나의 위쪽 삼각 해는 다음과 같이 찾을 수 있습니다. 방정식 \(u_{i,i} = b_{i,i}^2\)가 만족되어야 하므로, \(b_{i,i}\)를 복소수 \(u_{i,i}\)의 주요 제곱근(principal square root)이라고 놓습니다. \(u_{i,i} \neq 0\)이라는 가정에 의해, 이것은 모든 i,j에 대해 \(b_{i,i} + b_{j,j} \neq 0\)임을 보장합니다 (왜냐하면 복소수의 주요 제곱근은 모두 복소 평면의 하나의 절반에 놓이기 때문입니다). 다음 방정식에서
\(\quad u_{i,j} = b_{i,i} b_{i,j} + b_{i,i+1} b_{i+1,j} + b_{i,i+2} b_{i+2,j} + \dots + b_{i,j} b_{j,j}\)
우리는 \(b_{i,j}\)가 다음과 같이 1에서 n−1로 증가하는 \(j-i\)에 대해 재귀적으로 계산될 수 있다고 추론합니다:
\(\quad\displaystyle b_{i,j} = \frac{1}{b_{i,i} + b_{j,j}}\left(u_{i,j} - b_{i,i+1} b_{i+1,j} - b_{i,i+2} b_{i+2,j} - \dots - b_{i,j-1} b_{j-1,j}\right).\)
만약 U가 위쪽 삼각이지만 대각선에 여러 개의 영들을 가지면, \(\left(\begin{smallmatrix}0 & 1\\ 0 & 0\end{smallmatrix}\right)\)으로 예시된 것처럼 제곱근이 존재하지 않을 수 있습니다. 삼각 행렬의 대각 엔트리는 정확하게 그것의 고윳값(eigenvalues)임을 주목하십시오 (Triangular matrix#Properties 참조).
By diagonalization
n × n 행렬 A는 \(A=VDV^{-1}\)임을 만족하는 행렬 V와 대각 행렬 D가 있으면 대각화가능(diagonalizable)입니다. 이것이 발생하는 것과 A가 \(\mathbf{C}^n\)에 대해 기저를 구성하는 n 고유벡터(eigenvectors)를 가지는 것은 필요충분 조건입니다. 이 경우에서, V는 열로 n 고유벡터를 갖는 행렬로 선택될 수 있고, 따라서 A의 정사각 행렬은 다음과 같습니다:
\(\quad R = V S V^{-1}~,\)
여기서 S는 D의 임의의 제곱근입니다. 실제로,
\(\quad\displaystyle \left(V D^\frac{1}{2} V^{-1}\right)^2 = V D^\frac{1}{2} \left(V^{-1} V\right) D^\frac{1}{2} V^{-1} = V D V^{-1} = A ~.\)
예를 들어, 행렬 \(A = \left(\begin{smallmatrix} 33 & 24\\ 48 & 57\end{smallmatrix}\right)\)는 \(VDV^{-1}\)로 대각화될 수 있으며, 여기서
\(\quad V = \begin{pmatrix} 1 & 1\\ 2 & -1\end{pmatrix}\) and \(D = \begin{pmatrix} 81 & 0\\ 0 & 9\end{pmatrix}\).
D는 다음과 같은 주요 제곱근을 가지며
\(\quad D^\frac{1}{2} = \begin{pmatrix} 9 & 0\\ 0 & 3\end{pmatrix}\),
다음 제곱근을 제공합니다:
\(\quad A^\frac{1}{2} = V D^\frac{1}{2} V^{-1} = \begin{pmatrix} 5 & 2\\ 4 & 7\end{pmatrix}\).
A가 대칭일 때, 대각화하는 행렬 V는 고유벡터를 적절하게 선택함으로써 직교 행렬(orthogonal matrix)을 만들 수 있습니다 (스펙트럼 정리(spectral theorem)를 참조). 그런-다음 V의 역은 다음이 되도록 단순히 전치입니다:
\(\quad R = V S V^\textsf{T}~.\)
By Schur decomposition
모든 각 복소-값 정사각 행렬 \(A\)는, 대각화-가능성과 관계없이, \(A=QUQ^*\)에 의해 제공되는 슈어 분해(Schur decomposition)를, 여기서 \(U\)는 위쪽 삼각이고 \(Q\)는 유니태리 (의미 \(Q^* = Q^{-1}\)임을 의미)입니다. \(A\)의 고윳값(eigenvalues)은 정확하게 \(U\)의 대각 엔트리입니다; 그것들 중 많아야 하나가 영이면, 다음은 제곱근입니다:
\(\quad A^\frac{1}{2} = Q U^\frac{1}{2} Q^*.\)
여기서 위쪽 삼각 행렬 \(U\)의 제곱근 \(U^\frac{1}{2}\)은 위에서 설명된 것처럼 찾을 수 있습니다.
만약 \(A\)가 양수 한정이면, 고윳값은 모두 양의 실수이므로, \(U^\frac{1}{2}\)의 선택된 대각선도 양의 실수로 구성됩니다. 따라서 \(Q U^\frac{1}{2} Q^*\)의 고윳값은 양의 실수이며, 이는 결과 행렬이 \(A\)의 주요 근임을 의미합니다.
By Jordan decomposition
슈어 분해와 마찬가지로, 모든 각 정사각 행렬 \(A\)는 \(A = P^{-1} J P\)로 분해될 수 있으며, 여기서 P는 역가능(invertible)이고 J는 조르당 정규 형식(Jordan normal form)입니다.
양의 고윳값을 갖는 임의의 복소수 행렬이 같은 형식의 제곱근을 가지는지 확인하려면, 조르당 블록에 대해 이를 확인하는 것으로 충분합니다. 임의의 그러한 블록은 λ > 0이고 N 거듭제곱영(nilpotent)을 갖는 λ(I + N) 형식을 가집니다. 만약 \((1+z)^{1/2} = 1+a_1 z +a_2 z^2 + \cdots\)가 제곱근에 대한 이항 전개 (|z| < 1에서 유효)이면, 형식적 거듭제곱 급수(formal power series)로서 그것의 제곱은 1 + z와 같습니다. N을 z로 대체하여, 유한하게 많은 항만 영이 될 것이고 \(S=\sqrt{\lambda}(I+a_1 N + a_2 N^2+ \cdots)\)는 고윳값 \(\sqrt{\lambda}\)를 갖는 조르당 블록의 제곱근을 제공합니다.
λ = 1을 갖는 조르당 블록에 대한 고유성을 확인하는 것으로 충분합니다. 위에서 구성된 제곱은 S = I + L 형식을 가지며, 여기서 L은 상수 항 없이 N에서 다항식입니다. 양의 고윳값을 갖는 임의의 다른 제곱근 T는 M 거듭제곱영을 갖는 T = I + M 형식을 가지며, N과 따라서 L과 교환합니다. 그러나 그때에 \(0=S^2-T^2 = 2(L_M)(I+(L+M)/2)\)입니다. L과 M이 교환하므로, 행렬 L + M은 거듭제곱영이고 I + (L + M)/2는 노이만 급수(Neumann series)에 의해 주어진 역으로 역가능입니다. 따라서 L = M입니다.
만약 A가 양의 고윳값과 최소 다항식(minimal polynomial) p(t)를 갖는 행렬이면, A의 일반화된 고유공간으로의 조르당 분해는 \(p(t)^{-1}\)의 부분 분수 전개에서 추론될 수 있습니다. 일반화된 고유공간 위로의 해당 투영은 A에서 실수 다항식에 의해 제공됩니다. 각 고유공간에서, A는 위와 같이 λ(I + N) 형식을 가집니다. 고유공간 위에 제곱근에 대한 거듭제곱 급수 표현은 A의 주요 제곱근이 q(A) 형식을 가짐을 보여주며, 여기서 q(t)는 실수 계수를 갖는 다항식입니다.
Power series
형식적 거듭제곱 급수 \((1 - z)^\frac{1}{2} = \sum_{n=0}^\infty (-1)^n \binom{1/2}{n} z^n\)을 상기하여, 이는 \(\|z\| \leq 1\)라는 조건으로 하여 수렴합니다 (거듭제곱 급수의 계수가 합-가능이기 때문입니다). 이 표현에 \(z = I - A\)를 대입하면 다음을 산출합니다:
\(\quad\displaystyle A^\frac{1}{2} := \sum_{n=0}^\infty (-1)^n {\frac{1}{2} \choose n} (I - A)^n \)
이때 \(\limsup_n\|(I - A)^n\|^\frac{1}{n} < 1\)를 조건으로 합니다.
겔판트 공식(Gelfand formula) 덕분에, 해당 조건은 \( A \)의 스펙트럼이 디스크 \( D(1,1) \subseteq \mathbb{C} \) 내에 포함되어야 한다는 요구 조건과 동등합니다. \(A^\frac{1}{2}\)를 정의하거나 계산하는 이 방법은 \( A \)가 양수 반-한정인 경우에 특히 유용합니다. 이 경우에서, \(\left\|I - \frac{A}{\|A\|}\right\| \leq 1\)를 가지고 따라서 \(\left\|\left(I - \frac{A}{\|A\|}\right)^n\right\| \leq \left\|I - \frac{A}{\|A\|}\right\|^n \leq 1\)이므로, 표현 \(\|A\|^\frac{1}{2} = \left(\sum_{n=0}^\infty (-1)^n \binom{1/2}{n} \left(I - \frac{A}{\|A\|}\right)^n\right)\)은 역시 \( A \)의 제곱근을 정의하며 이는 고유한 양수 반-한정 근으로 판명됩니다. 이 방법은 무한-차원 바나흐 공간 또는 힐베르트 공간 또는 (C*) 바나흐 대수의 특정 원소에서 연산자의 제곱근을 정의하기 위해 유효합니다.
Iterative solutions
By Denman–Beavers iteration
n × n 행렬 A의 제곱근을 찾는 또 다른 방법은 Denman–Beavers 제곱근 반복입니다.
\(Y_0=A\) 및 \(Z_0=I\)라고 놓으며, 여기서 I 는 n × n 항등 행렬(identity matrix)입니다. 반복은 다음에 의해 정의됩니다:
\(\quad \begin{align}
Y_{k+1} &= \frac{1}{2} \left(Y_k + Z_k^{-1}\right), \\
Z_{k+1} &= \frac{1}{2} \left(Z_k + Y_k^{-1}\right).
\end{align} \)
이것은 나중 원소가 상대적으로 거의 변경되지 않은 한 쌍의 행렬 역의 순서열을 사용하므로, 첫 번째 원소만 높은 계산 비용을 가지는데, 왜냐하면 나머지는 역을 계산하는 데 뉴턴의 방법(Newton's method)의 변형을 몇 번만 거치면 이전 원소에서 계산될 수 있기 때문입니다.
\(\quad X_{n+1} = 2X_n - X_n B X_n.\)
이와 함께, k의 나중 값에 대해 \(X_0 = Z_{k-1}^{-1}\)와 \(B = Z_k\)로 설정하고, 그런-다음 일부 작은 \(n\) (아마도 단지 1)에 대해 \(Z_k^{-1} = X_n\)을 사용하고 \(Y_k^{-1}\)에 대해서도 유사하게 사용합니다.
제곱근이 있는 행렬의 경우에도 수렴이 보장되지 않지만, 과정이 수렴하면, 행렬 \(Y_k\)는 제곱근 \(A^{1/2}\)로 이차적으로수렴하고, 반면 \(Z_k\)는 역 \(A^{-1/2}\)로 수렴합니다.
By the Babylonian method
또 다른 반복 방법은 실수의 제곱근을 계산하고, 행렬에 그것을 적용하는 바빌로니아 방법(Babylonian method)의 잘-알려진 공식을 취함으로써 얻을 수 있습니다. \(X_0=I\)라고 놓으며, 여기서 I 는 항등 행렬(identity matrix)입니다. 반복은 다음에 의해 정의됩니다:
\(\quad\displaystyle X_{k+1} = \frac{1}{2} \left(X_k + A X_k^{-1}\right)\,.\)
다시 말하지만, 수렴이 보장되지는 않지만, 과정이 수렴하면, 행렬 \(X_k\)는 제곱근 \(A^{1/2}\)로 이차적으로 수렴합니다. Denman–Beavers 반복과 비교될 때, 바빌로니아 방법의 장점은 반복 단계당 하나의 행렬 역(matrix inverse)만 계산하면 된다는 것입니다. 다른 한편으로, Denman–Beavers 반복은 이후 원소가 상대적으로 거의 변경되지 않은 한 쌍의 행렬 역의 순서열을 사용하기 때문에 첫 번째 원소만 계산 비용이 높은데, 왜냐하면 나머지는 역을 계산하기 위한 뉴턴의 방법(Newton's method)의 변형을 몇 번만 거치면 이전 원소에서 계산될 수 있기 때문입니다. (위의 Denman–Beavers iteration을 참조); 물론, 같은 접근 방식은 바빌로니아 방법에 필요한 역의 단일 순서열을 얻기 위해 사용될 수 있습니다. 어쨌든, Denman–Beavers 반복과 달리, 바빌로니아 방법은 수치적으로 불안정하고 수렴에 실패할 가능성이 더 큽니다.
바빌로니아 방법은 방정식 \(X^2-A=0\)에 대한 뉴턴의 방법(Newton's method)과 모든 \(k\)에 대해 \(AX_k=X_k A\)를 사용하는 방법을 따릅니다.
Square roots of positive operators
선형 대수(linear algebra)와 연산자 이론(operator theory)에서, 복소수 힐베르트 공간 위에 경계진 양수 반-한정 연산자 (비-음수 연산자) T가 주어졌을 때, B는 T = B* B이면 T의 제곱근이며, 여기서 B*은 B의 에르미트 인접(Hermitian adjoint)을 나타냅니다. 스펙트럼 정리(spectral theorem)에 따르면, 연속 함수형 미적분(continuous functional calculus)은 \(T^{1/2}\)가 자체 양수이고 \((T^{1/2})^2=T\)임을 만족하는 연산자 \(T^{1/2}\)를 얻기 위해 적용될 수 있습니다. 연산자 \(T^{1/2}\)는 T의 고유한 비-음의 제곱근입니다.
복소수 힐베르트 공간에서 경계진 비-음의 연산자는 정의에 의해 자체 인접합니다. 따라서 \(T=(T^{1/2})^{*}T^{1/2}\)입니다. 반대로, B* B 형식의 모든 각 연산자가 비-음수라는 것은 자명한 참입니다. 그러므로, 연산자 T가 비-음수인 것과 일부 B에 대한 T = B* B (일부 C에 대해 T = CC*)인 것은 필요충분 조건입니다.
숄레스키 인수분해(Cholesky factorization)는 제곱근의 또 다른 특정 예제를 제공하며, 이는 고유한 비-음의 제곱근과 혼동해서는 안 됩니다.
Unitary freedom of square roots
만약 T가 유한-차원 힐베르트 공간에서 비-음의 연산자이면, T의 모든 제곱근은 유니태리 변환에 의해 관련됩니다. 보다 정확하게, 만약 T = A*A = B*B이면, A = UB임을 만족하는 유니태리(unitary) U가 존재합니다.
실제로, \(B=T^{1/2}\)를 T의 고유한 비-음의 제곱근으로 취합니다. 만약 T가 엄격하게 양수이면, B는 역가능이고 따라서 \(U=AB^{-1}\)은 유니태리입니다:
\(\quad \begin{align}
U^*U &= \left(\left(B^*\right)^{-1}A^*\right)\left(AB^{-1}\right)
= \left(B^*\right)^{-1}T \left(B^{-1}\right) \\
&= \left(B^*\right)^{-1} B^* B \left(B^{-1}\right) = I.
\end{align}\)
만약 T가 엄격하게 양수인 것 없이 비-음수이면, B의 역은 정의될 수 없지만, 무어-펜로즈 유사역행렬(Moore-Penrose pseudoinverse) \(B^+\)는 정의될 수 있습니다. 해당 경우에서, 연산자 \(B^+A\)는 부분 등거리변환(partial isometry), 즉, T의 치역에서 자체로의 유니태리 연산자입니다. 이것은 그런-다음 T의 커널 위에 항등식과 같게 설정함으로써 전체 공간 위에 유니태리 연산자 U로 확장될 수 있습니다. 더 일반적으로, 이것은, 추가로, T가 닫힌 치역(closed range)을 가지면 무한-차원 힐베르트 공간 위에 참입니다. 일반적으로, A, B가 힐베르트 공간 H 위에 닫혀 있고 조밀하게 정의된 연산자이고, A* A = B* B이면, A = UB이며, 여기서 U는 부분 등거리변환입니다.
Some applications
제곱근 및 제곱근의 단일 자유도는 함수형 해석과 선형 대수 전반에 적용됩니다.
Polar decomposition
만약 A가 유한-차원 힐베르트 공간 위에 역-가능 연산자이면, 다음임을 만족하는 고유한 유니태리 연산자 U와 양의 연산자 P가 있습니다:
\(\quad A = UP;\)
이것은 A의 극 분해입니다. 양의 연산자 P는 양수 연산자 A∗A의 고유한 양수 제곱근이고, U는 \(U=AP^{-1}\)에 의해 정의됩니다.
만약 A가 역가능이 아니면, 여전히 P가 같은 방법으로 정의되는 (그리고 고유한) 극 합성을 가집니다. 유니태리 연산자 U는 고유하지 않습니다. 오히려 다음과 같이 "자연스러운" 유니태리 연산자를 결정하는 것이 가능합니다: \(AP^+\)는 A의 치역에서 자체로의 유니태리 연산자이며, 이는 \(A^{*}\)의 커널 위에 항등식에 의해 확장될 수 있습니다. 결과 유니태리 연산자 U는 A의 극 분해를 산출합니다.
Kraus operators
최(Choi)의 결과에 의해, 다음 선형 맵은
\(\quad \Phi : C^{n \times n} \to C^{m \times m}\)
완전하게 양수인 것과 그것이 다음 형식인 것은 필요충분 조건입니다:
\(\quad\displaystyle \Phi(A) = \sum_i ^k V_i A V_i^*\)
여기서 k ≤ nm. \(\{E_pq\} \subset \mathbf{C}^{n\times n}\)를 \(n^2\) 기본 행렬 단위라고 놓습니다. 다음 양수 행렬은
\(\quad M_\Phi = \left(\Phi \left(E_{pq}\right)\right)_{pq} \in C^{nm \times nm}\)
Φ의 최 행렬(Choi matrix)이라고 불립니다. 크라우스(Kraus) 연산자는, 반드시 제곱근이 아닌, \(M_{\Phi}\)의 제곱근에 해당합니다: \(M_{\Phi}\)의 제곱근 B에 대해, B의 각 열 \(b_i\)에 대해 Vec 연산을 실행-취소함으로써 크라우스 연산자 \(V_i\)의 가족을 얻을 수 있습니다. 따라서 모든 크라우스 연산자의 집합은 부분 등거리변환과 관련이 있습니다.
Mixed ensembles
양자 물리학에서, n-수준 양자 시스템에 대한 밀도 행렬은 대각합 1을 갖는 양수 반한정인 n × n 복소수 행렬 ρ입니다. 만약 ρ가 다음과 같이 표현될 수 있으면,
\(\quad\displaystyle \rho = \sum_i p_i v_i v_i^*\)
여기서 \( p_i > 0 \)이고 \(\sum p_i = 1\)이며, 다음 집합은
\(\quad \left\{p_i, v_i\right\}\)
혼합된 상태 ρ를 설명하는 앙상블(ensemble)이라고 말합니다. \(\{v_i\}\)는 직교일 필요가 없음에 유의하십시오. 상태 ρ를 설명하는 다른 앙상블은 ρ의 제곱근을 통해 유니태리 연산자와 관련됩니다. 예를 들어, 다음을 가정합니다:
\(\quad\displaystyle \rho = \sum_j a_j a_j^*.\)
대각합 1 조건은 다음임을 의미합니다:
\(\quad\displaystyle \sum_j a_j ^* a_j = 1.\)
다음이라고 놓습니다:
\(\quad p_i = a_i ^* a_i,\)
그리고 \(v_i\)를 정규화된 \(a_i\)라고 놓습니다. 우리는 다음임을 압니다:
\(\quad \left\{p_i, v_i\right\}\)
위는 혼합된 상태 ρ를 제공합니다.
References
- Bourbaki, Nicolas (2007), Théories spectrales, chapitres 1 et 2, Springer, ISBN 978-3540353317
- Conway, John B. (1990), A Course in Functional Analysis, Graduate Texts in Mathematics, vol. 96, Springer, pp. 199–205, ISBN 978-0387972459, Chapter IV, Reisz functional calculus
- Cheng, Sheung Hun; Higham, Nicholas J.; Kenney, Charles S.; Laub, Alan J. (2001), "Approximating the Logarithm of a Matrix to Specified Accuracy" (PDF), SIAM Journal on Matrix Analysis and Applications, 22 (4): 1112–1125, CiteSeerX 10.1.1.230.912, doi:10.1137/S0895479899364015, archived from the original (PDF) on 2011-08-09
- Burleson, Donald R., Computing the square root of a Markov matrix: eigenvalues and the Taylor series
- Denman, Eugene D.; Beavers, Alex N. (1976), "The matrix sign function and computations in systems", Applied Mathematics and Computation, 2 (1): 63–94, doi:10.1016/0096-3003(76)90020-5
- Higham, Nicholas (2008), Functions of Matrices. Theory and Computation, SIAM, ISBN 978-0-89871-646-7
- Horn, Roger A.; Johnson, Charles R. (2013). Matrix Analysis (2nd ed.). Cambridge University Press. ISBN 978-0-521-54823-6.
- Horn, Roger A.; Johnson, Charles R. (1994), Topics in Matrix Analysis, Cambridge University Press, ISBN 978-0521467131
- Rudin, Walter (1991). Functional Analysis. International Series in Pure and Applied Mathematics. Vol. 8 (Second ed.). New York, NY: McGraw-Hill Science/Engineering/Math. ISBN 978-0-07-054236-5. OCLC 21163277.