본문 바로가기
영문 위키피디아 번역

(번역) Square root of a matrix

by 다움위키 2024. 4. 6.
Original article: w:Square root of a matrix

 

수학(mathematics)에서, 행렬의 제곱근(square root of a matrix)은 숫자에서 행렬(matrices)로의 제곱근(square root)의 개념을 확장합니다. 행렬 B는 만약 행렬 곱(matrix product) BBA와 같을 때 A의 제곱근이라고 말합니다.

일부 저자는 양수 반한정이고 BB=BTB=A임을 만족하는 고유한 행렬 B를 나타내기 위해, A양수 반한정(positive semidefinite)일 때의 특정 경우에만 이름 제곱근(square root) 또는 표기법 A1/2를 사용합니다 (실수-값 행렬에 대해, 여기서 BTB전치입니다).

드물게, 이름 제곱근(square root)은, 심지어 BB ≠ A이더라도, 숄레스키 인수분해(Cholesky factorization)에서와 같이, 양수 반한정 행렬 ABTB=A로 임의의 인수분해에 대해 사용될 수 있습니다. 이 뚜렷한 의미는 Positive definite matrix § Decomposition에서 설명합니다.

Examples

일반적으로, 행렬은 여러 제곱근을 가질 수 있습니다. 특히, 만약 A=B2이면 마찬가지로 A=(B)2입니다.

2×2 항등 행렬(identity matrix) (1001)은 무한하게 많은 제곱근을 가집니다. 그것들은 다음에 의해 제공됩니다:

(±100±1) and (abca)

여기서 (a,b,c)a2+bc=1임을 만족하는 임의의 숫자 (실수 또는 복소수)입니다. 특히, 만약 (a,b,t)가 임의의 피타고라스 세-쌍(Pythagorean triple)—즉, a2+b2=t2임을 만족하는 양의 정수의 임의의 집합이면, 1t(abba)는 대칭적이고 유리수 엔트리를 갖는 I의 제곱근 행렬입니다. 따라서

(1001)=(0110)2=(45353545)2.

음의 항등은 제곱근을 가집니다, 예를 들어:

(1001)=(0110)2,

이는 허수 단위(imaginary unit) i를 나타내기 위해 사용될 수 있고 따라서 2×2 실수 행렬을 사용하는 모든 복소수를 나타내기 위해 사용될 수 있습니다. 복소수의 행렬 표현을 참조하십시오.

실수와 마찬가지로, 실수 행렬은 실수 제곱근을 갖지 못할 수 있지만, 복소수-값 엔트리를 갖는 제곱근을 가질 수 있습니다. 일부 행렬은 제곱근을 가지지 않습니다. 예제는 행렬 (0100)입니다.

비-음의 정수의 제곱근은 다시 정수이거나 무리수이지만, 대조적으로 정수 행렬은 위의 예에서와 같이 엔터리가 유리수이지만 정수가 아닌 제곱근을 가질 수 있습니다.

Positive semidefinite matrices

대칭 실수 n × n 행렬은 만약 모든 xRn에 대해 xTAx0이면 양수 반한정(positive semidefinite)이라고 불립니다 (여기서 xT는 열 벡터 x를 행 벡터로 변경하는 전치(transpose)를 나타냅니다). 정사각 실수 행렬이 양수 반한정인 것과 일부 행렬 B에 대해 A=BTB인 것은 필요충분 조건입니다. 많은 다른 그러한 행렬 B가 있을 수 있습니다. 양수 반한정 행렬 A는 역시 A=BB임을 만족하는 많은 행렬 B를 가질 수 있습니다. 어쨌든, A는 항상 양수 반한정 (그리고 따라서 대칭)인 정확하게 하나의 제곱근 B를 가집니다. 특히, B는 대칭, B=BT임을 요구하기 때문에, 따라서 A=BB 또는 A=BTB라는 두 조건은 동등합니다.

복소수-값 행렬에 대해, 켤레 전치(conjugate transpose) B가 대신 사용되고 양수 반한정 행렬은 에르미트(Hermitian)이며, B=B임을 의미합니다.

 

Theorem —  A를 양수 반한정 행렬 (실수 또는 복소수)라고 놓습니다. 그런-다음 A=BB임을 만족하는 정확하게 하나의 양수 반한정 행렬 B가 있습니다.

이 고유한 행렬은 주요(principal), 비-음수(non-negative), 또는 양수 제곱근(positive square root)이라고 불립니다 (양수 한정 행렬(positive definite matrices)의 경우에서 후자입니다)

실수 양수 반한정 행렬의 주요 제곱근은 실수입니다. 양수 한정 행렬의 주요 제곱근은 양수 반한정입니다; 보다 일반적으로, A의 주요 제곱근의 랭크는 A의 랭크와 같습니다.

주요 제곱근을 취하는 연산은 이 행렬의 집합에서 연속적입니다. 주요 제곱근의 존재와 고유성은 [[Jordan normal form|조르당 정규 형식(Jordan normal form)]]에서 직접 추론될 수 있습니다 (아래 참조).

Matrices with distinct eigenvalues

n 구별되는 비-영 고윳값을 갖는 n×n 행렬은 2n 제곱근을 가집니다. 그러한 행렬 A고유분해(eigendecomposition) VDV1을 가지며, 여기서 V는 열이 V의 고유벡터인 행렬이고 D는 대각 원소가 대응하는 n 고윳값 λi인 대각 행렬입니다. 따라서 A의 제곱근은 VD1/2V1에 의해 주어지며, 여기서 D1/2D의 임의의 제곱근 행렬이며, 이는, 구별되는 고윳값에 대해, 대각 원소가 D의 대각 원소의 제곱근과 같은 대각이어야 합니다; D의 각 대각 원소의 제곱근에 대해 두 가지 가능한 선택이 있기 때문에, 행렬 D1/2에 대해 2n개의 선택이 있습니다.

이것은 역시 양수-한정 행렬이 정확하게 하나의 양수-한정 제곱근을 가진다는 위의 관찰의 증명으로 이어집니다: 양수 한정 행렬은 오직 양수 고윳값만 가지고, 이들 각 고윳값은 하나의 양의 제곱근만 가집니다; 그리고 제곱근 행렬의 고윳값은 D1/2의 대각 원소이므로, 제곱근 행렬 자체가 양수 한정이 되려면 원래 고윳값의 고유한 양수 제곱근만 사용해야 합니다.

Solutions in closed form

만약 행렬이 거듭상등(idempotent)이면, A2=A임을 의미하며, 정의에 의해 그것의 제곱근 중 하나는 행렬 자체입니다.

Diagonal and triangular matrices

만약 D대각(diagonal) n × n 행렬 D=diag(λ1,,λn)이면, 그것의 제곱근의 일부는 대각 행렬 diag(μ1,,μn)이며, 여기서 μi=±λi입니다. 만약 D의 대각 원소가 실수이고 비-음수이면 그것은 양수 반한정이고, 만약 제곱근이 비-음의 부호로 취해지면, 결과 행렬은 D의 주요 근입니다. 대각 행렬은 위의 항등 행렬에 예시된 것처럼 대각선의 일부 엔트리가 같으면 추가 비-대각 근을 가질 수 있습니다.

만약 U가 위쪽 삼각 행렬 (i>j에 대해 그 엔트기가 ui,j=0임을 의미)이고 그 대각 엔트리 중 많아야 하나가 0이면, 방정식 B2=U의 하나의 위쪽 삼각 해는 다음과 같이 찾을 수 있습니다. 방정식 ui,i=bi,i2가 만족되어야 하므로, bi,i를 복소수 ui,i주요 제곱근(principal square root)이라고 놓습니다. ui,i0이라는 가정에 의해, 이것은 모든 i,j에 대해 bi,i+bj,j0임을 보장합니다 (왜냐하면 복소수의 주요 제곱근은 모두 복소 평면의 하나의 절반에 놓이기 때문입니다). 다음 방정식에서

ui,j=bi,ibi,j+bi,i+1bi+1,j+bi,i+2bi+2,j++bi,jbj,j

우리는 bi,j가 다음과 같이 1에서 n−1로 증가하는 ji에 대해 재귀적으로 계산될 수 있다고 추론합니다:

bi,j=1bi,i+bj,j(ui,jbi,i+1bi+1,jbi,i+2bi+2,jbi,j1bj1,j).

만약 U가 위쪽 삼각이지만 대각선에 여러 개의 영들을 가지면, (0100)으로 예시된 것처럼 제곱근이 존재하지 않을 수 있습니다. 삼각 행렬의 대각 엔트리는 정확하게 그것의 고윳값(eigenvalues)임을 주목하십시오 (Triangular matrix#Properties 참조).

By diagonalization

n × n 행렬 AA=VDV1임을 만족하는 행렬 V와 대각 행렬 D가 있으면 대각화가능(diagonalizable)입니다. 이것이 발생하는 것과 ACn에 대해 기저를 구성하는 n 고유벡터(eigenvectors)를 가지는 것은 필요충분 조건입니다. 이 경우에서, V는 열로 n 고유벡터를 갖는 행렬로 선택될 수 있고, 따라서 A의 정사각 행렬은 다음과 같습니다:

R=VSV1 ,

여기서 SD의 임의의 제곱근입니다. 실제로,

(VD12V1)2=VD12(V1V)D12V1=VDV1=A .

예를 들어, 행렬 A=(33244857)VDV1로 대각화될 수 있으며, 여기서

V=(1121) and D=(81009).

D는 다음과 같은 주요 제곱근을 가지며

D12=(9003),

다음 제곱근을 제공합니다:

A12=VD12V1=(5247).

A가 대칭일 때, 대각화하는 행렬 V는 고유벡터를 적절하게 선택함으로써 직교 행렬(orthogonal matrix)을 만들 수 있습니다 (스펙트럼 정리(spectral theorem)를 참조). 그런-다음 V의 역은 다음이 되도록 단순히 전치입니다:

R=VSVT .

By Schur decomposition

모든 각 복소-값 정사각 행렬 A는, 대각화-가능성과 관계없이, A=QUQ에 의해 제공되는 슈어 분해(Schur decomposition)를, 여기서 U는 위쪽 삼각이고 Q유니태리 (의미 Q=Q1임을 의미)입니다. A고윳값(eigenvalues)은 정확하게 U의 대각 엔트리입니다; 그것들 중 많아야 하나가 영이면, 다음은 제곱근입니다:

A12=QU12Q.

여기서 위쪽 삼각 행렬 U의 제곱근 U12은 위에서 설명된 것처럼 찾을 수 있습니다.

만약 A가 양수 한정이면, 고윳값은 모두 양의 실수이므로, U12의 선택된 대각선도 양의 실수로 구성됩니다. 따라서 QU12Q의 고윳값은 양의 실수이며, 이는 결과 행렬이 A의 주요 근임을 의미합니다.

By Jordan decomposition

슈어 분해와 마찬가지로, 모든 각 정사각 행렬 A는 A=P1JP로 분해될 수 있으며, 여기서 P역가능(invertible)이고 J조르당 정규 형식(Jordan normal form)입니다.

양의 고윳값을 갖는 임의의 복소수 행렬이 같은 형식의 제곱근을 가지는지 확인하려면, 조르당 블록에 대해 이를 확인하는 것으로 충분합니다. 임의의 그러한 블록은 λ > 0이고 N 거듭제곱영(nilpotent)을 갖는 λ(I + N) 형식을 가집니다. 만약 (1+z)1/2=1+a1z+a2z2+가 제곱근에 대한 이항 전개 (|z| < 1에서 유효)이면, 형식적 거듭제곱 급수(formal power series)로서 그것의 제곱은 1 + z와 같습니다. Nz로 대체하여, 유한하게 많은 항만 영이 될 것이고 S=λ(I+a1N+a2N2+)는 고윳값 λ를 갖는 조르당 블록의 제곱근을 제공합니다.

λ = 1을 갖는 조르당 블록에 대한 고유성을 확인하는 것으로 충분합니다. 위에서 구성된 제곱은 S = I + L 형식을 가지며, 여기서 L은 상수 항 없이 N에서 다항식입니다. 양의 고윳값을 갖는 임의의 다른 제곱근 TM 거듭제곱영을 갖는 T = I + M 형식을 가지며, N과 따라서 L과 교환합니다. 그러나 그때에 0=S2T2=2(LM)(I+(L+M)/2)입니다. LM이 교환하므로, 행렬 L + M은 거듭제곱영이고 I + (L + M)/2노이만 급수(Neumann series)에 의해 주어진 역으로 역가능입니다. 따라서 L = M입니다.

만약 A가 양의 고윳값과 최소 다항식(minimal polynomial) p(t)를 갖는 행렬이면, A의 일반화된 고유공간으로의 조르당 분해는 p(t)1의 부분 분수 전개에서 추론될 수 있습니다. 일반화된 고유공간 위로의 해당 투영은 A에서 실수 다항식에 의해 제공됩니다. 각 고유공간에서, A는 위와 같이 λ(I + N) 형식을 가집니다. 고유공간 위에 제곱근에 대한 거듭제곱 급수 표현은 A의 주요 제곱근이 q(A) 형식을 가짐을 보여주며, 여기서 q(t)는 실수 계수를 갖는 다항식입니다.

Power series

형식적 거듭제곱 급수 (1z)12=n=0(1)n(1/2n)zn을 상기하여, 이는 z1라는 조건으로 하여 수렴합니다 (거듭제곱 급수의 계수가 합-가능이기 때문입니다). 이 표현에 z=IA를 대입하면 다음을 산출합니다:

A12:=n=0(1)n(12n)(IA)n

이때 lim supn(IA)n1n<1를 조건으로 합니다. 

겔판트 공식(Gelfand formula) 덕분에, 해당 조건은 A의 스펙트럼이 디스크 D(1,1)C 내에 포함되어야 한다는 요구 조건과 동등합니다. A12를 정의하거나 계산하는 이 방법은 A가 양수 반-한정인 경우에 특히 유용합니다. 이 경우에서, IAA1를 가지고 따라서 (IAA)nIAAn1이므로, 표현 A12=(n=0(1)n(1/2n)(IAA)n)은 역시 A의 제곱근을 정의하며 이는 고유한 양수 반-한정 근으로 판명됩니다. 이 방법은 무한-차원 바나흐 공간 또는 힐베르트 공간 또는 (C*) 바나흐 대수의 특정 원소에서 연산자의 제곱근을 정의하기 위해 유효합니다.

Iterative solutions

By Denman–Beavers iteration

n × n 행렬 A의 제곱근을 찾는 또 다른 방법은 Denman–Beavers 제곱근 반복입니다.

Y0=AZ0=I라고 놓으며, 여기서 In × n 항등 행렬(identity matrix)입니다. 반복은 다음에 의해 정의됩니다:

Yk+1=12(Yk+Zk1),Zk+1=12(Zk+Yk1).

이것은 나중 원소가 상대적으로 거의 변경되지 않은 한 쌍의 행렬 역의 순서열을 사용하므로, 첫 번째 원소만 높은 계산 비용을 가지는데, 왜냐하면 나머지는 역을 계산하는 데 뉴턴의 방법(Newton's method)의 변형을 몇 번만 거치면 이전 원소에서 계산될 수 있기 때문입니다.

Xn+1=2XnXnBXn.

이와 함께, k의 나중 값에 대해 X0=Zk11B=Zk로 설정하고, 그런-다음 일부 작은 n (아마도 단지 1)에 대해 Zk1=Xn을 사용하고 Yk1에 대해서도 유사하게 사용합니다.

제곱근이 있는 행렬의 경우에도 수렴이 보장되지 않지만, 과정이 수렴하면, 행렬 Yk는 제곱근 A1/2로 이차적으로수렴하고, 반면 Zk는 역 A1/2로 수렴합니다.

By the Babylonian method

또 다른 반복 방법은 실수의 제곱근을 계산하고, 행렬에 그것을 적용하는 바빌로니아 방법(Babylonian method)의 잘-알려진 공식을 취함으로써 얻을 수 있습니다. X0=I라고 놓으며, 여기서 I항등 행렬(identity matrix)입니다. 반복은 다음에 의해 정의됩니다:

Xk+1=12(Xk+AXk1).

다시 말하지만, 수렴이 보장되지는 않지만, 과정이 수렴하면, 행렬 Xk는 제곱근 A1/2로 이차적으로 수렴합니다. Denman–Beavers 반복과 비교될 때, 바빌로니아 방법의 장점은 반복 단계당 하나의 행렬 역(matrix inverse)만 계산하면 된다는 것입니다. 다른 한편으로, Denman–Beavers 반복은 이후 원소가 상대적으로 거의 변경되지 않은 한 쌍의 행렬 역의 순서열을 사용하기 때문에 첫 번째 원소만 계산 비용이 높은데, 왜냐하면 나머지는 역을 계산하기 위한 뉴턴의 방법(Newton's method)의 변형을 몇 번만 거치면 이전 원소에서 계산될 수 있기 때문입니다. (위의 Denman–Beavers iteration을 참조); 물론, 같은 접근 방식은 바빌로니아 방법에 필요한 역의 단일 순서열을 얻기 위해 사용될 수 있습니다. 어쨌든, Denman–Beavers 반복과 달리, 바빌로니아 방법은 수치적으로 불안정하고 수렴에 실패할 가능성이 더 큽니다.

바빌로니아 방법은 방정식 X2A=0에 대한 뉴턴의 방법(Newton's method)과 모든 k에 대해 AXk=XkA를 사용하는 방법을 따릅니다.

Square roots of positive operators

선형 대수(linear algebra)연산자 이론(operator theory)에서, 복소수 힐베르트 공간 위에 경계진 양수 반-한정 연산자 (비-음수 연산자) T가 주어졌을 때, BT = B* B이면 T의 제곱근이며, 여기서 B*B에르미트 인접(Hermitian adjoint)을 나타냅니다. 스펙트럼 정리(spectral theorem)에 따르면, 연속 함수형 미적분(continuous functional calculus)T1/2가 자체 양수이고 (T1/2)2=T임을 만족하는 연산자 T1/2를 얻기 위해 적용될 수 있습니다. 연산자 T1/2T고유한 비-음의 제곱근입니다.

복소수 힐베르트 공간에서 경계진 비-음의 연산자는 정의에 의해 자체 인접합니다. 따라서 T=(T1/2)T1/2입니다. 반대로, B* B 형식의 모든 각 연산자가 비-음수라는 것은 자명한 참입니다. 그러므로, 연산자 T가 비-음수인 것과 일부 B에 대한 T = B* B (일부 C에 대해 T = CC*)인 것은 필요충분 조건입니다.

숄레스키 인수분해(Cholesky factorization)는 제곱근의 또 다른 특정 예제를 제공하며, 이는 고유한 비-음의 제곱근과 혼동해서는 안 됩니다.

Unitary freedom of square roots

만약 T가 유한-차원 힐베르트 공간에서 비-음의 연산자이면, T의 모든 제곱근은 유니태리 변환에 의해 관련됩니다. 보다 정확하게, 만약 T = A*A = B*B이면, A = UB임을 만족하는 유니태리(unitary) U가 존재합니다.

실제로, B=T1/2T의 고유한 비-음의 제곱근으로 취합니다. 만약 T가 엄격하게 양수이면, B는 역가능이고 따라서 U=AB1은 유니태리입니다:

UU=((B)1A)(AB1)=(B)1T(B1)=(B)1BB(B1)=I.

만약 T가 엄격하게 양수인 것 없이 비-음수이면, B의 역은 정의될 수 없지만, 무어-펜로즈 유사역행렬(Moore-Penrose pseudoinverse) B+는 정의될 수 있습니다. 해당 경우에서, 연산자 B+A부분 등거리변환(partial isometry), 즉, T의 치역에서 자체로의 유니태리 연산자입니다. 이것은 그런-다음 T의 커널 위에 항등식과 같게 설정함으로써 전체 공간 위에 유니태리 연산자 U로 확장될 수 있습니다. 더 일반적으로, 이것은, 추가로, T닫힌 치역(closed range)을 가지면 무한-차원 힐베르트 공간 위에 참입니다. 일반적으로, A, B가 힐베르트 공간 H 위에 닫혀 있고 조밀하게 정의된 연산자이고, A* A = B* B이면, A = UB이며, 여기서 U는 부분 등거리변환입니다.

Some applications

제곱근 및 제곱근의 단일 자유도는 함수형 해석과 선형 대수 전반에 적용됩니다.

Polar decomposition

만약 A가 유한-차원 힐베르트 공간 위에 역-가능 연산자이면, 다음임을 만족하는 고유한 유니태리 연산자 U와 양의 연산자 P가 있습니다:

A=UP;

이것은 A의 극 분해입니다. 양의 연산자 P는 양수 연산자 AA의 고유한 양수 제곱근이고, UU=AP1에 의해 정의됩니다.

만약 A가 역가능이 아니면, 여전히 P가 같은 방법으로 정의되는 (그리고 고유한) 극 합성을 가집니다. 유니태리 연산자 U는 고유하지 않습니다. 오히려 다음과 같이 "자연스러운" 유니태리 연산자를 결정하는 것이 가능합니다: AP+A의 치역에서 자체로의 유니태리 연산자이며, 이는 A의 커널 위에 항등식에 의해 확장될 수 있습니다. 결과 유니태리 연산자 UA의 극 분해를 산출합니다.

Kraus operators

최(Choi)의 결과에 의해, 다음 선형 맵은

Φ:Cn×nCm×m

완전하게 양수인 것과 그것이 다음 형식인 것은 필요충분 조건입니다:

Φ(A)=ikViAVi

여기서 knm. {Epq}Cn×nn2 기본 행렬 단위라고 놓습니다. 다음 양수 행렬은

MΦ=(Φ(Epq))pqCnm×nm

Φ의 최 행렬(Choi matrix)이라고 불립니다. 크라우스(Kraus) 연산자는, 반드시 제곱근이 아닌, MΦ의 제곱근에 해당합니다: MΦ의 제곱근 B에 대해, B의 각 열 bi에 대해 Vec 연산을 실행-취소함으로써 크라우스 연산자 Vi의 가족을 얻을 수 있습니다. 따라서 모든 크라우스 연산자의 집합은 부분 등거리변환과 관련이 있습니다.

Mixed ensembles

양자 물리학에서, n-수준 양자 시스템에 대한 밀도 행렬은 대각합 1을 갖는 양수 반한정인 n × n 복소수 행렬 ρ입니다. 만약 ρ가 다음과 같이 표현될 수 있으면,

ρ=ipivivi

여기서 pi>0이고 pi=1이며, 다음 집합은

{pi,vi}

혼합된 상태 ρ를 설명하는 앙상블(ensemble)이라고 말합니다. {vi}는 직교일 필요가 없음에 유의하십시오. 상태 ρ를 설명하는 다른 앙상블은 ρ의 제곱근을 통해 유니태리 연산자와 관련됩니다. 예를 들어, 다음을 가정합니다:

ρ=jajaj.

대각합 1 조건은 다음임을 의미합니다:

jajaj=1.

다음이라고 놓습니다:

pi=aiai,

그리고 vi를 정규화된 ai라고 놓습니다. 우리는 다음임을 압니다:

{pi,vi}

위는 혼합된 상태 ρ를 제공합니다.

References