본문 바로가기
영문 위키피디아 번역

(번역) Orthogonal matrix

by 다움위키 2024. 3. 14.
Original article: w:Orthogonal matrix

 

선형 대수(linear algebra)에서, 직교 행렬(orthogonal matrix), 또는 직교정규 행렬(orthonormal matrix)은 그 열과 행이 직교정규 벡터인 실수 정사각 행렬입니다.

이것을 표현하는 한 가지 방법은 다음과 같습니다:

\(\quad\displaystyle Q^\mathrm{T} Q = Q Q^\mathrm{T} = I,\)

여기서 \(Q^{\text{T}}\)는 Q전치(transpose)이고 I항등 행렬(identity matrix)입니다.

이것은 동등한 특성화로 이어집니다: 행렬 Q는 만약 그 전치가 그 과 같으면 직교입니다.

\(\quad\displaystyle Q^\mathrm{T}=Q^{-1},\)

여기서 \(Q^{-1}\)는 Q의 역입니다.

직교 행렬 Q는 반드시 역가능 (역 \(Q^{-1} = Q^{\text{T}}\)를 가짐), 유니태리(unitary, \(Q^{-1}=Q^{*}\))이며. 여기서 \(Q^{*}\)는 Q에르미트 인접 (켤레 전치)이고, 따라서 실수에 걸쳐 정규(normal, \(Q^{*}Q = QQ^{*}\))입니다. 임의의 직교 행렬의 행렬식(determinant)은 +1 또는 −1입니다. 선형 변환(linear transformation)으로, 직교 행렬은 벡터의 안의 곱을 보존하고, 따라서 회전, 반사, 또는 회전-반사(rotoreflection)와 같은 유클리드 공간의 등거리-변환(isometry)으로 동작합니다. 다시 말해서, 그것은 유니태리 변환(unitary transformation)입니다.

n × n 직교 행렬의 집합은, 곱셈 아래에서, 직교 그룹(orthogonal group)으로 알려진 그룹(group) O(n)을 형성합니다. 행렬식 +1을 갖는 직교 행렬로 구성된 부분그룹(subgroup) SO(n)특수 직교 그룹(special orthogonal group)이라고 불리고, 그것의 각 원소는 특수 직교 행렬(special orthogonal matrix)입니다. 선형 변환으로, 모든 각 특수 직교 행렬은 회전으로 동작합니다.

Overview

직교 행렬은 유니태리 행렬의 실수 특수화이고, 따라서 항상 정규 행렬(normal matrix)입니다. 비록 여기서 실수 행렬만 고려하지만, 정의는 임의의 필드(field)에서 엔트리를 갖는 행렬에 사용될 수 있습니다. 어쨌든, 직교 행렬은 점 곱(dot products)에서 자연적으로 발생하고, 복소수의 행렬에 대해 유니태리 요구 사항으로 대신 이어집니다. 직교 행렬은 점 곱을 보존하므로, n-차원 실수 유클리드 공간(Euclidean space)에서 벡터 uv에 대해

\(\quad\displaystyle {\mathbf u} \cdot {\mathbf v} = \left(Q {\mathbf u}\right) \cdot \left(Q {\mathbf v}\right) \)

여기서 Q는 직교 행렬입니다. 안의 곱 연결을 보이기 위해, n-차원 실수 유클리드 공간에서 벡터 v를 생각해 보십시오. 직교정규 기저에 관해 쓰면 v의 제곱 길이는 \(\mathbf{v}^{\text{T}} \mathbf{v}\)입니다. 만약 행렬 형식 Qv에서 선형 변환이 벡터 길이를 보존하면, 다음과 같습니다:

\(\quad\displaystyle {\mathbf v}^\mathrm{T}{\mathbf v} = (Q{\mathbf v})^\mathrm{T}(Q{\mathbf v}) = {\mathbf v}^\mathrm{T} Q^\mathrm{T} Q {\mathbf v} .\)

따라서 회전, 반사, 및 이들의 조합과 같은 유한-차원(finite-dimensional) 선형 등거리-변환은 직교 행렬을 생성합니다. 그 전환은 역시 참입니다: 직교 행렬은 직교 변환을 의미합니다. 어쨌든, 선형 대수에는 유한 차원도 아니고 같은 차원도 아닐 수 있는 공간 사이의 직교 변환이 포함되고, 이것들은 동등한 직교 행렬을 가지지 않습니다.

직교 행렬은 이론적 및 실제적인 여러 가지 이유로 중요합니다. n × n 직교 행렬은 행렬 곱셈 아래에서 그룹, O(n)으로 표시되는 직교 그룹(orthogonal group)을 형성하며, 이는 그것의 부분그룹과 함께 수학과 물리 과학에서 널리 사용됩니다. 예를 들어, 분자의 점 그룹(point group)은 O(3)의 부분그룹입니다. 직교 행렬의 부동-점 버전은 유리한 속성을 가지고 있기 때문에, QR 분해와 같은 수치 선형 대수의 많은 알고리듬에서 핵심입니다. 또 다른 예제로, 적절한 정규화를 통해 이산 코사인 변환 (MP3 압축에 사용됨)은 직교 행렬로 표현됩니다.

Examples

아래는 작은 직교 행렬과 가능한 해석의 몇 가지 예입니다.

  • \(\displaystyle 
    \begin{bmatrix}
    1 & 0 \\
    0 & 1 \\
    \end{bmatrix}\qquad\) (항등 변환)
  • \(\displaystyle 
    \begin{bmatrix}
    \cos \theta & -\sin \theta \\
    \sin \theta & \cos \theta \\
    \end{bmatrix}\qquad\) (원점에 대한 회전)
  • \(\displaystyle 
    \begin{bmatrix}
    1 & 0 \\
    0 & -1 \\
    \end{bmatrix}\qquad\) (x-축에 가로질러 반사)
  • \(\displaystyle 
    \begin{bmatrix}
    0 & 0 & 0 & 1 \\
    0 & 0 & 1 & 0 \\
    1 & 0 & 0 & 0 \\
    0 & 1 & 0 & 0
    \end{bmatrix}\qquad\) (좌표 축의 순열)

Elementary constructions

Lower dimensions

가장 간단한 직교 행렬은 1 × 1 행렬 [1] 및 [−1]이며, 이는 원점을 가로지르는 실수 직선의 항등과 반사로 해석할 수 있습니다.

2 × 2 행렬은 다음 형식을 가집니다:

\(\quad\displaystyle \begin{bmatrix}
p & t\\
q & u
\end{bmatrix},\)

이 직교성 요구 사항은 다음 세 방정식을 만족시킵니다:

\(\quad\displaystyle \begin{align}
1 & = p^2+t^2, \\
1 & = q^2+u^2, \\
0 & = pq+tu.
\end{align}\)

첫 번째 방정식을 고려하여, 일반성의 손실 없이 p = cos θ, q = sin θ라고 놓습니다. 그런-다음 t = −q, u = p 또는 t = q, u = −p 중 하나입니다. 첫 번째 경우를 θ에 의한 회전으로 해석할 수 있고 (여기서 θ = 0은 항등), 두 번째 경우를 \(\tfrac{\pi}{2}\)의 각도에서 직선을 가로지르는 반사로 해석할 수 있습니다.

\(\quad\displaystyle 
\begin{bmatrix}
\cos \theta & -\sin \theta \\
\sin \theta & \cos \theta \\
\end{bmatrix}\text{ (rotation), }\qquad
\begin{bmatrix}
\cos \theta & \sin \theta \\
\sin \theta & -\cos \theta \\
\end{bmatrix}\text{ (reflection)}
\)

θ = 90°를 갖는 반사 행렬의 특별한 경우는 y = x에 의해 주어진 45°에서 직선에 대한 반사를 생성하고 따라서 xy를 교환합니다; 그것은 각 열과 행에 단일 1 (및 그렇지 않으면 0)을 갖는 순열 행렬(permutation matrix)입니다.

\(\quad\displaystyle \begin{bmatrix}
0 & 1\\
1 & 0
\end{bmatrix}.\) 

항등은 역시 순열 행렬입니다.

반사는 자체적으로 역이며, 이는 반사 행렬이 대칭 (그것의 전치와 같음)이고 직교임을 의미합니다. 두 개의 회전 행렬의 곱은 회전 행렬(rotation matrix)이고, 두 개의 반사 행렬의 곱도 회전 행렬입니다.

Higher dimensions

차원에 관계없이, 직교 행렬을 순수한 회전인지 아닌지로 분류하는 것은 항상 가능하지만, 3 × 3 행렬 이상에 대해 비-회전 행렬이 반사 행렬보다 더 복잡할 수 있습니다. 예를 들어,

\(\quad\displaystyle 
\begin{bmatrix}
-1 & 0 & 0\\
0 & -1 & 0\\
0 & 0 & -1
\end{bmatrix}\text{ and }
\begin{bmatrix}
0 & -1 & 0\\
1 & 0 & 0\\
0 & 0 & -1
\end{bmatrix}\)

위는 z-축에 대해 각각 원점을 통한 반전(inversion)회전-반전(rotoinversion)을 나타냅니다.

회전은 고차원에서 더 복잡해집니다; 그것들은 더 이상 하나의 각도에 의해 완전하게 특성화될 수 없고, 하나보다 많은 평면 부분공간에 영향을 미칠 수 있습니다. 그것은 3 × 3 회전 행렬을 축과 각도의 관점에서 설명하는 것이 공통적이지만, 이것은 3차원에서만 작동합니다. 3차원보다 위에서 2개 이상의 각도가 필요하며, 각 각도는 회전의 평면(plane of rotation)과 결합됩니다.

어쨌든, 일반적으로 적용되는 순열, 반사, 및 회전을 위한 기본 빌딩 블록이 있습니다.

Primitives

가장 토대적인 순열은 두 행을 교환함으로써 항등 행렬에서 얻은 전치입니다. 임의의 n × n 순열 행렬은 n − 1 이하의 전치의 곱으로 구성될 수 있습니다.

하우스홀더 반사(Householder reflection)는 비-널 벡터 v에서 다음과 같이 구성됩니다:

\(\quad\displaystyle Q = I - 2 \frac{{\mathbf v}{\mathbf v}^\mathrm{T}}{{\mathbf v}^\mathrm{T}{\mathbf v}} .\)

여기서 분자는 대칭 행렬이고 반면에 분모는 v의 제곱 크기인 숫자입니다. 이것은 v에 수직인 초평면에서의 반사입니다 (v에 평행한 임의의 벡터 구성요소를 부정합니다). 만약 v가 단위 벡터이면, \(Q=I-2\mathbf{v}\mathbf{v}^{\text{T}}\)가 충분합니다. 하우스홀더 반사는 전형적으로 열의 아래쪽 부분을 동시에 0으로 만들기 위해 사용됩니다. 크기 n × n의 임의의 직교 행렬은 많아야 n개의 그러한 반사의 곱으로 구성될 수 있습니다.

기븐스 회전(Givens rotation)은 선택된 각도만큼 회전하는 두 개의 좌표 축에 의해 스팬된 이-차원 (평면) 부분공간 위에 동작합니다. 그것은 전형적으로 단일 하위대각선 엔트리를 0으로 만들기 위해 사용됩니다. 크기 n × n의 임의의 회전 행렬은 많아야 \(\tfrac{n(n-1)}{2}\) 그러한 회전의 곱으로 구성될 수 있습니다. 3 × 3 행렬의 경우에서, 세 개의 그러한 회전이 충분합니다; 그리고 수열을 고정함으로써 우리는 종종 오일러 각도(Euler angles)라고 불리는 사용된 세 각도의 관점에서 모든 3 × 3 회전 행렬 (유일하지는 않지만)을 설명할 수 있습니다.

야코비 회전(Jacobi rotation)은 기븐스 회전과 같은 형식을 가지지만, 2 × 2 대칭 부분행렬의 비-대각선 엔트리를 모두 0으로 만들기 위해 사용됩니다.

Properties

Matrix properties

실수 정사각 행렬이 직교인 것과 그것의 열이 보통의 유클리드 점 곱(dot product)을 갖는 유클리드 공간(Euclidean space) \(\mathbf{R}^n\)의 직교정규 기저(orthonormal basis)를 형성하는 것은 필요충분 조건이며, 이것이 그 경우인 것과 그것의 행이 \(\mathbf{R}^n\)의 직교정규 기저를 형성하는 것은 필요충분 조건입니다. 직교 (직교정규가 아님) 열을 갖는 행렬을 직교 행렬이라고 불리는 것으로 가정하고 싶을 수도 있지만, 그러한 행렬은 특별한 관심을 받지 못했고 특별한 이름을 가지지 않습니다; 그것들은 \(M^{\text{T}}M = D\)만 만족시키고, D대각 행렬(diagonal matrix)입니다.

임의의 직교 행렬의 행렬식(determinant)은 +1 또는 −1입니다. 이것은 다음과 같이 행렬식에 대한 기본 사실에서 따릅니다:

\(\quad\displaystyle 1=\det(I)=\det\left(Q^\mathrm{T}Q\right)=\det\left(Q^\mathrm{T}\right)\det(Q)=\bigl(\det(Q)\bigr)^2 .\)

그 전환은 참이 아닙니다; 다음 반대예제에서 볼 수 있듯이, 행렬식이 ±1이라는 것은 직교 열을 가지더라고 직교성을 보장하지 않습니다:

\(\quad\displaystyle \begin{bmatrix}
2 & 0 \\
0 & \frac{1}{2}
\end{bmatrix}\)

순열 행렬과 함께 행렬식은 시그니처(signature)와 일치하며, 순열의 패리티가 짝수 또는 홀수이므로 +1 또는 −1이 되는데, 왜냐하면 행렬식은 행의 교대 함수이기 때문입니다.

행렬식 제한보다 더 강력한 것은 직교 행렬이 복소수에 걸쳐 항상 대각화되어 고윳값(eigenvalues)의 전체 집합을 나타낼 수 있다는 사실이며, 그것의 모두는 (복소수) 모듈러스 1을 가져야 합니다.

Group properties

모든 각 직교 행렬의 역은 두 직교 행렬의 행렬 곱과 같이 다시 직교입니다. 사실, 모든 n × n 직교 행렬의 집합은 그룹(group)의 모든 공리를 만족시킵니다. 그것은 직교 그룹이라고 불리고 O(n)에 의해 표시되는 차원 \(\tfrac{n(n-1)}{2}\)의 컴팩트 리 그룹(Lie group)입니다.

행렬식이 +1인 직교 행렬은 회전의 특수 직교 그룹(special orthogonal group) SO(n), 인덱스(index) 2의 O(n)경로-연결된(path-connected) 정규 부분그룹(normal subgroup)을 형성합니다. 몫 그룹(quotient group) O(n)/SO(n)은 행렬식에 따라 [+1] 또는 [−1]을 선택하는 투영 맵과 함께 O(1)과 동형적입니다. 행렬식 −1을 갖는 직교 행렬은 항등을 포함하지 않고, 따라서 부분그룹을 형성하지 않고 코셋(coset)만 형성합니다; 그것은 역시 (따로따로) 연결됩니다. 따라서 각 직교 그룹은 두 부분으로 됩니다; 그리고 투영 맵이 분할(splits)되기 때문에, O(n)SO(n)O(1)반직접 곱(semidirect product)입니다. 실질적으로, 비교-가능 명제는 임의의 직교 행렬은 2 × 2 행렬에서 본 것처럼 회전 행렬을 취하고 그것의 열 중 하나를 부정함으로써 생성될 수 있다는 것입니다. 만약 n이 홀수이면, 반직접 곱은 실제로 직접 곱이고, 임의의 직교 행렬은 회전 행렬을 취하고 모든 그것의 열을 부정함으로써 생성될 수 있습니다. 이것은 열을 부정하는 것은 행렬식을 부정하고, 따라서 열의 홀수 (짝수는 아님)를 부정하면 행렬식을 부정하는 행렬식의 속성에서 따릅니다.

이제 바닥 오른쪽 엔트리가 1과 같은 (n + 1) × (n + 1) 직교 행렬을 생각해 보십시오. 마지막 열 (및 마지막 행)의 나머지는 0이어야 하고, 임의의 두 개의 그러한 행렬의 곱은 같은 형식을 가집니다. 행렬의 남은 부분은 n × n 직교 행렬입니다; 따라서 O(n)O(n + 1) (및 모든 더 높은 그룹)의 부분그룹입니다.

\(\quad\displaystyle \begin{bmatrix}
  & & & 0\\
  & \mathrm{O}(n) & & \vdots\\
  & & & 0\\
  0 & \cdots & 0 & 1
\end{bmatrix}\)

하우스홀더 행렬(Householder matrix)의 형식의 기본 반사는 직교 행렬을 이 구속된 형식으로 줄일 수 있기 때문에, 일련의 그러한 반사는 직교 행렬을 항등으로 가져올 수 있습니다; 따라서 직교 그룹은 반사 그룹(reflection group)입니다. 마지막 열은 임의의 단위 벡터로 고정될 수 있고, 각 선택은 O(n + 1)에서 O(n)의 다른 사본을 제공합니다; 이런 식으로 O(n + 1)은 올 O(n)을 갖는 단위 구 \(S_n\)에 걸쳐 다발(bundle)입니다.

마찬가지로, SO(n)SO(n + 1)의 부분그룹입니다; 그리고 임의의 특수 직교 행렬은 유사한 절차를 사용하여 기븐스 평면 회전(Givens plane rotations)에 의해 생성될 수 있습니다. 다발 구조는 지속됩니다: SO(n) ↪ SO(n + 1) → \(S^n\). 단일 회전은 마지막 열의 첫 번째 행에서 0을 생성할 수 있고, 일련의 n − 1 회전은 n × n 회전 행렬의 마지막 열의 마지막 행을 제외한 모든 것을 0으로 만들 것입니다. 평면이 고정되어 있기 때문에, 각 회전은 하나의 자유도, 즉 각도만 가집니다. 귀납법에 의해, SO(n)은 따라서 다음과 같은 자유도를 가지고, O(n)도 마찬가지입니다:

\(\quad\displaystyle (n-1) + (n-2) + \cdots + 1 = \frac{n(n-1)}{2}\)

순열 행렬은 여전히 더 간단합니다; 그것들은 리 그룹이 아니라 오직 유한한 그룹, 차수 n! 대칭 그룹 \(S_n\)을 형성합니다. 같은 종류의 논증에 의해, \(S_n\)은 \(S_{n+1}\)의 부분그룹입니다. 짝수 순열은 행렬식 +1의 순열 행렬의 부분그룹, 차수 \(\tfrac{n!}{2}\) 교대 그룹(alternating group)을 생성합니다.

Canonical form

보다 광범위하게, 임의의 직교 행렬의 효과는 직교 2-차원 부분공간 위에 독립적인 동작으로 분리됩니다. 즉, 만약 Q가 특수 직교이면, Q를 블록 대각 형식으로 가져오는 (회전적) 기저의 변경, 직교 행렬 P를 항상 찾을 수 있습니다.

\(\quad\displaystyle P^\mathrm{T}QP = \begin{bmatrix}
R_1 & & \\ & \ddots & \\ & & R_k
\end{bmatrix}\ (n\text{ even}),
\ P^\mathrm{T}QP = \begin{bmatrix}
R_1 & & & \\ & \ddots & & \\ & & R_k & \\ & & & 1
\end{bmatrix}\ (n\text{ odd}).\)

여기서 행렬 \(R_1, ..., R_k\)는 2 × 2 회전 행렬이고, 나머지 엔트리는 0입니다. 예외적으로, 회전 블록은 대각, ±I일 수 있습니다. 따라서, 필요하다면 하나의 열을 부정하고, 2 × 2 반사가 +1과 −1로 대각선화된다는 점에 유의하여, 임의의 직교 행렬은 다음 형식으로 가져올 수 있습니다:

\(\quad\displaystyle P^\mathrm{T}QP = \begin{bmatrix}
\begin{matrix}R_1 & & \\ & \ddots & \\ & & R_k\end{matrix} & 0 \\
0 & \begin{matrix}\pm 1 & & \\ & \ddots & \\ & & \pm 1\end{matrix} \\
\end{bmatrix},\)

행렬 \(R_1,...,R_k\)는 복소 평면(complex plane)에서 단위 원 위에 놓인 고윳값의 켤레 쌍을 제공합니다; 따라서 이 분해는 모든 고윳값(eigenvalues)절댓값 1을 가짐을 확인합니다. 만약 n이 홀수이면, 적어도 하나의 실수 고윳값, +1 또는 −1이 있습니다; 3 × 3 회전에 대해, +1과 결합된 고유벡터가 회전 축입니다.

Lie algebra

Q의 엔트리가 t의 미분-가능 함수이고, t = 0Q = I를 제공한다고 가정합니다. 직교성 조건을 미분하여

\(\quad\displaystyle Q^\mathrm{T} Q = I \)

다음을 산출합니다:

\(\quad\displaystyle \dot{Q}^\mathrm{T} Q + Q^\mathrm{T} \dot{Q} = 0\)

그런-다음 t = 0 (Q = I)에서 평가는 다음을 의미합니다:

\(\quad\displaystyle \dot{Q}^\mathrm{T} = -\dot{Q} .\)

리 그룹 용어에서, 이것은 직교 행렬 그룹의 리 대수(Lie algebra)반-대칭 행렬(skew-symmetric matrices)로 구성됨을 의미합니다. 다른 방향으로 가면, 임의의 반-대칭 행렬의 행렬 지수(matrix exponential)는 직교 행렬 (사실상 특수 직교)입니다.

예를 들어, 각속도(angular velocity)라고 부르는 3-차원 대상 물리학은 미분 회전이며, 따라서 리 대수 \(\mathfrak{so}(3)\)에서 벡터는 SO(3)에 접합니다. ω = (, , )가 주어졌을 때, 이때 v = (x, y, z)가 단위 벡터이며, ω의 올바른 반-대칭 행렬 형식은 다음과 같습니다:

\(\quad\displaystyle 
\Omega = \begin{bmatrix}
0 & -z\theta & y\theta \\
z\theta & 0 & -x\theta \\
-y\theta & x\theta & 0
\end{bmatrix} .\)

이것의 지수는 축 v를 중심으로 각도 θ만큼 회전하기 위한 직교 행렬입니다; \(c=\cos \tfrac{\theta}{2}, s = \sin\tfrac{\theta}{2}\)를 설정하여,

\(\quad\displaystyle \exp(\Omega) = \begin{bmatrix}
1  -  2s^2  +  2x^2 s^2  &  2xy s^2  -  2z sc  &  2xz s^2  +  2y sc\\
2xy s^2  +  2z sc  &  1  -  2s^2  +  2y^2 s^2  &  2yz s^2  -  2x sc\\
2xz s^2  -  2y sc  &  2yz s^2  +  2x sc  &  1  -  2s^2  +  2z^2 s^2   
\end{bmatrix}.\)

Numerical linear algebra

Benefits

수치 해석(Numerical analysis)은 수치적 선형 대수에 대한 직교 행렬의 많은 속성의 이점을 취하고 그것들이 자연스럽게 발생합니다. 예를 들어, 그것은 종종 공간에 대한 직교정규 기저 또는 직교 기저의 변경을 계산하는 것이 바람직합니다; 둘 다 직교 행렬의 형식을 취합니다. 행렬식 ±1과 크기 1의 모든 고윳값을 가지는 것은 수치적 안정성(numeric stability)에 큰 이점이 있습니다. 한 가지 의미는 조건 숫자(condition number)가 1 (이것이 최솟값)이므로, 직교 행렬과 곱할 때 오류가 확대되지 않는다는 것입니다. 많은 알고리듬은 이러한 이유로 하우스홀더 반사 및 기븐스 회전(Givens rotations)과 같은 직교 행렬을 사용합니다. 역시, 직교 행렬이 역가능일 뿐만 아니라 그것은 역은 인덱스를 교환함으로써 기본적으로 자유롭게 사용할 수 있다는 점도 도움이 됩니다.

순열은 부분 피벗팅 (순열이 피봇팅을 수행하는 곳)을 갖는 가우스 소거법을 포함하여 많은 알고리듬의 성공에 필수적입니다. 어쨌든, 그것들은 명시적으로 행렬로 표시되는 경우는 거의 없습니다; 그것들의 특별한 형식은 n개의 인덱스 목록과 같은 보다 효율적인 표현을 허용합니다.

마찬가지로, 하우스홀더 행렬과 기븐스 행렬을 사용하는 알고리듬은 전형적으로 특수한 곱셈과 저장 방법을 사용합니다. 예를 들어, 기븐스 회전은 곱하는 행렬의 두 행에만 영향을 미쳐서, 차수 \(n^3\)의 전체 곱셈(multiplication)을 훨씬 더 효율적인 차수 n으로 변경합니다. 이들 반사와 회전을 사용하여 행렬에 0이 생길 때, 비어 있는 공간은 변환을 다시-생성하고, 이를 견고하게 수행하기에 충분한 데이터를 저장하기에 충분합니다. (Stewart (1976)에 따라, 우리는 비용이 많이 들고 잘못 작동하는 회전 각도를 저장하지 않습니다.)

Decompositions

많은 중요한 행렬 분해 (Golub & Van Loan 1996)에는 특히 다음을 포함하는 직교 행렬이 포함됩니다:

QR 분해 : M = QR, Q 직교, R 위쪽 삼각

특이값 분해 : \(M=U\sum V^{\text{T}}\), UV 직교, Σ 대각 행렬

대칭 행렬의 고유분해 (스펙트럼 정리에 따른 분해): \(S=Q\wedgd Q^{\text{T}}\), S 대칭, Q 직교, Λ 대각

극 분해 : M = QS, Q 직교, S 대칭 양수-반한정

Examples

실험적 오류를 보상하기 위해 물리적 현상을 반복적으로 측정할 때 발생할 수 있는 선형 방정식의 초과-결정된 시스템을 생각해 보십시오. Ax = b라고 쓰며, 여기서 Am × n, m > n입니다. QR 분해는 A를 위쪽 삼각 R로 줄입니다. 예를 들어, 만약 A5 × 3이면 R의 다음 형식을 가집니다:

\(\quad\displaystyle R = \begin{bmatrix}
\cdot & \cdot & \cdot \\
0 & \cdot & \cdot \\
0 & 0 & \cdot \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}.\)

선형 최소 제곱(linear least squares) 문제는 ||Axb||를 최소화하는 x를 찾는 것이며, 이는 bA의 열에 의해 스팬된 부분공간으로 투영하는 것과 동등합니다. A (따라서 R)의 열이 독립적이라고 가정하여, 투영 해는 \(A^{\text{T}}A \mathbf{x} = A^{\text{T}}\mathbf{b}\)에서 찾습니다. 이제 \(A^{\text{T}}A\)는 정사각 (n × n)이고 역-가능이고, 역시 \(R^{\text{T}}R\)와 같습니다. 그러나 R에서 영들의 아래쪽 행은 곱에서 불필요하며, 따라서 가우스 소거법 (숄레스키 분해(Cholesky decomposition))에서와 같이 이미 아래쪽-삼각형 위쪽-삼각형 인수화된 형식에 있습니다. 여기서 직교성은 \(A^{\text{T}}A=(R^{\text{T}}Q^{\text{T}})QR\)을 \(R^{\text{T}}R\)로 줄이는 데 중요할 뿐만 아니라, 수치 문제를 확대 없이 해를 허용하는 데에도 중요합니다.

미달-결정된 선형 시스템이나 그렇지 않으면 비-역가능 행렬의 경우에서, 특이값 분해 (SVD)가 똑같이 유용합니다. A를 \(U\sum V^{\text{T}}\)로 인수화와 함께, 만족스러운 해는 무어-펜로즈 유사-역행렬(pseudoinverse), \(V\sum^{+}U^{\text{T}}\)를 사용하며, 여기서 \(\sum^{+}\)는 각 비-영 대각 엔트리를 그 역수로 대체합니다. x를 \(V\sum^+U^{\text{T}}\mathbf{b}\)로 설정합니다.

정사각 역-가능 행렬의 경우에도 관심이 있습니다. 예를 들어, A가 수많은 꼬임과 회전의 합성으로 계산된 3 × 3 회전 행렬이라고 가정합니다. 부동-점은 실수의 수학적 이상과 일치하지 않으므로, A는 점차 진정한 직교성을 상실합니다. 그람–슈미트 과정(Gram–Schmidt process)은 열을 직교화할 수 있지만, 가장 신뢰할 수 있는 방법도, 가장 효율적인 방법도, 가장 불변적인 방법도 아닙니다. 극 분해(polar decomposition)는 행렬을 쌍으로 인수화하며, 그 중 하나는 주어진 행렬에 고유한 가장 가까운 직교 행렬이거나, 주어진 행렬이 특이이면 가장 가까운 행렬 중 하나입니다. (근접도는 스펙트럼 노름 또는 프로베니우스 노름과 같은 직교 기저의 변경 아래에서 임의의 행렬 노름(matrix norm) 불변에 의해 측정될 수 있습니다.) 직교에 가까운 행렬에 대해, 직교 인자로의 빠른 수렴은 Higham (1986) (1990)에 기인한 "뉴턴의 방법" 접근 방식에 의해 달성될 수 있으며, 반복적으로 역 전치로 행렬을 평균화합니다. Dubrulle (1999)은 편리한 수렴 테스트를 통해 가속화된 방법을 발표했습니다.

예를 들어, 간단한 평균화 알고리듬이 7단계를 거치는 비-직교 행렬을 생각해 보십시오:

\(\quad\displaystyle \begin{bmatrix}3 & 1\\7 & 5\end{bmatrix}
\rightarrow
\begin{bmatrix}1.8125 & 0.0625\\3.4375 & 2.6875\end{bmatrix}
\rightarrow \cdots \rightarrow
\begin{bmatrix}0.8 & -0.6\\0.6 & 0.8\end{bmatrix}\)

그리고 가속도는 두 단계로 트림됩니다 (γ = 0.353553, 0.565685를 가짐).

\(\quad\displaystyle \begin{bmatrix}3 & 1\\7 & 5\end{bmatrix}
\rightarrow
\begin{bmatrix}1.41421 & -1.06066\\1.06066 & 1.41421\end{bmatrix}
\rightarrow
\begin{bmatrix}0.8 & -0.6\\0.6 & 0.8\end{bmatrix}\)

그람-슈미트는 최솟값 8.12404 대신 프로베니우스 거리 8.28659로 표시되는 열등한 해를 생성합니다:

\(\quad\displaystyle \begin{bmatrix}3 & 1\\7 & 5\end{bmatrix}
\rightarrow
\begin{bmatrix}0.393919 & -0.919145\\0.919145 & 0.393919\end{bmatrix}\)

Randomization

몬테 카를로 방법(Monte Carlo methods)과 고차원 데이터 공간 탐색과 같은 일부 수치적 응용은 균등하게 분포된(uniformly distributed) 무작위 직교 행렬의 생성을 요구합니다. 이 문맥에서, "균등"은 하르 측정(Haar measure)의 관점에서 정의되며, 이는 기본적으로 임의의 자유롭게 선택된 직교 행렬을 곱해도 분포가 변경되지 않아야 합니다. 독립적으로 균등하게 분포된 무작위 엔트리를 갖는 직교화하는 것은 균등하게 분포된 직교 행렬을 초래하지 않지만, R의 대각선이 양수 엔트리만 포함하는 한 독립적인 정규적으로 분포된 무작위 엔트리의 QR 분해는 수행합니다 (Mezzadri 2006). Stewart (1980)는 이것을 Diaconis & Shahshahani (1987)가 나중에 "부분그룹 알고리듬" (순열과 회전에 대해서도 마찬가지로 작동하는 형식)으로 일반화한 보다 효율적인 아이디어로 대체했습니다. (n + 1) × (n + 1) 직교 행렬을 생성하기 위해, n × n 일과 차원 n + 1의 균등하게 분포된 단위 벡터를 취합니다. 벡터에서 하우스홀더 반사를 구성하고, 그런-다음 그것을 (바닥 오른쪽 모서리에 1을 갖는 더 큰 크기에 삽입된) 더 작은 행렬에 적용합니다.

Nearest orthogonal matrix

주어진 행렬 M에 가장 가까운 직교 행렬 Q를 찾는 문제는 직교 프로크루스테스 문제(Orthogonal Procrustes problem)와 관련이 있습니다. 고유한 해를 얻기 위한 여러 다른 방법이 있으며, 가장 간단한 방법은 M특이값 분해(singular value decomposition)를 취하고 특이값을 1로 대체하는 것입니다. 또 다른 방법은 R을 명시적으로 표현하지만 행렬 제곱근(matrix square root)의 사용을 요구합니다:

\(\quad\displaystyle Q = M \left(M^\mathrm{T} M\right)^{-\frac 1 2}\)

이것은 이차적으로 직교 행렬로 수렴하는 재귀를 제공하기 위해 행렬의 제곱근을 추출하는 바빌로니아 방법과 결합될 수 있습니다:

\(\quad\displaystyle Q_{n + 1} = 2 M \left(Q_n^{-1} M + M^\mathrm{T} Q_n\right)^{-1}\)

여기서 \(Q_0 = M\).

이들 반복은 M조건 숫자(condition number)가 3보다 작다는 조건으로 하여 안정적입니다.

역의 일-차 근사와 같은 초기화를 사용하는 것은 수정된 반복을 초래합니다:

\(\quad\displaystyle N_{n} = Q_n^\mathrm{T} Q_n\)

\(\quad\displaystyle P_{n} = \frac 1 2 Q_n N_{n}\)

\(\quad\displaystyle Q_{n + 1} = 2 Q_n + P_n N_n - 3 P_n\)

Spin and pin

직교 행렬의 일부 사용에 미묘한 기술적 문제가 있습니다. 행렬식 +1과 −1을 갖는 그룹 구성 요소가 서로 연결되어 있지 않을 뿐만 아니라, 심지어 +1 구성 요소, SO(n)단순 연결된 것이 아닙니다 (자명한 것인 SO(1)을 제외). 따라서, SO(n)의 덮는 그룹(covering group), 스핀 그룹(spin group), Spin(n)과 함께 작업하는 것이 때때로 유리하거나 심지어 필요합니다. 마찬가지로, O(n)은 덮는 그룹, 핀 그룹(pin groups), Pin(n)을 가집니다. n > 2에 대해, Spin(n)은 단순 연결된 것이고 따라서 SO(n)에 대한 보편적 덮는 그룹입니다. 지금까지 스핀 그룹의 가장 유명한 예제는 Spin(3)이며, 이는 SU(2), 또는 단위 쿼터니언(quaternions)의 그룹입니다.

Pin 및 Spin 그룹은 클리퍼드 대수(Clifford algebras) 내에서 찾을 수 있으며, 이것 자체는 직교 행렬에서 구성될 수 있습니다.

Rectangular matrices

만약 Q가 정사각 행렬이 아니면, 조건 \(Q^{\text{T}}Q = I\)와 \(QQ^{\text{T}}=I\)는 동등하지 않습니다. 조건 \(Q^{\text{T}}Q = I\)는 Q의 열이 직교정규임을 나타냅니다. 이것은 Q가 (선형 종속성으로 인해) nm를 갖는 m × n 행렬인 경우에만 발생할 수 있습니다. 유사하게, \(QQ^{\text{T}}=I\)는 Q의 행이 nm을 필요로 하는 직교정규라고 말합니다.

이들 행렬에 대한 표준 용어는 없습니다. 그것들은 "반-직교 행렬", "직교정규 행렬", "직교 행렬"로 다양하게 불리며, 때로는 간단히 "직교정규 행/열을 갖는 행렬"이라고도 합니다.

경우 nm에 대해, 직교 열을 갖는 행렬은 직교 k-프레임(orthogonal k-frames)이라고 참조될 수 있고 그것들은 스티펠 매니폴드(Stiefel manifold)의 원소입니다.

 

References

External links