(번역) Bernoulli process

Original article: w:Bernoulli process

확률과 통계학에서, 베르누이 과정(Bernoulli process)은, 야콥 베르누이(Jacob Bernoulli)의 이름을 따서 지어졌으며, 이진 확률 변수(random variable)의 유한 또는 무한 수열이므로, 그것은 정식적으로 0과 1의 오직 두 가지 값을 취하는 이산-시간 확률적 과정(discrete-time stochastic process)입니다. 구성 요소 베르누이 변수(Bernoulli variables) Xi는 동일하게 분포되고 독립적입니다. 무미건조하게, 베르누이 과정은 아마도 불공정 동전을 갖는 (하지만 일관된 불공정을 갖는) 반복된 동전 던지기입니다. 수열에서 모든 각 변수 \(X_i\)는 베르누이 시행(Bernoulli trial) 또는 실험과 결합됩니다. 그들 모두는 같은 베르누이 분포(Bernoulli distribution)를 가집니다. 베르누이 과정에 대해 말할 수 있는 것의 대부분은 역시 (육면체 주사위에 대한 과정과 같은) 두 가지 많은 결과로 일반화될 수 있습니다; 이 일반화는 베르누이 스킴(Bernoulli scheme)으로 알려져 있습니다.
오직 제한된 베르누이 시행의 표본이 주어지면, 과정을 결정하는 문제는 동전이 공정한 지를 검사하는 문제라고 불릴 수 있습니다.

Definition

베르누이 과정(Bernoulli process)은 다음임을 만족하는 독립(independent) 확률 변수(random variables) \(X_1, X_2, X_3, ...\)의 유한 또는 무한 수열입니다:

각 i에 대해, \(X_i\)의 값은 0 또는 1 중 하나입니다;
i의 모든 값에 대해, \(X_i=1\)일 확률은 같습니다.

다시 말해서, 베르누이 과정은 독립적인 동일하게 분포된(independent identically distributed) 베르누이 시행(Bernoulli trials)의 수열입니다.
시행의 독립성은 그 과정이 기억-없음(memoryless)임을 의미합니다. 확률 p가 알려진 것으로 주어지면, 과거 결과는 미래 결과에 대한 정보를 제공하지 않습니다. (만약 p가 알려져 있지 않으면, 어쨌든, 과거는 p에 대한 추론을 통해 간접적으로 미래를 알려줍니다.)
만약 그 과정이 무한하다면, 어떤 점에서든 미래 시행은 전체 과정과 동일한 베르누이 과정, 새롭게-시작 속성을 구성합니다.

Interpretation

각 \(X_i=1\)의 두 가지 가능한 값은 종종 "성공"과 "실패"라고 불립니다. 따라서, 숫자 0 또는 1로 표현될 때, 결과는 i번째 "시행"의 성공의 횟수라고 불릴 수 있습니다.
값의 두 개의 다른 공통적인 해석은 "참" 또는 "거짓"과 "예" 또는 "아니오"입니다. 두 값의 임의의 해석 아래에서, 개별 변수 \(X_i=1\)는 매개변수 p를 갖는 베르누이 시행(Bernoulli trials)이라고 불릴 수 있습니다.
많은 응용에서, 지수 i가 증가함에 따라 시행 사이에 시간이 경과합니다. 사실상, 시행 \(X_1,X_2, ..., X_i,...\)는 "시점" 1, 2, ..., i, ...에서 발생합니다. 시간의 경과와 결합된 "과거"와 "미래"의 개념은, 어쨌든, 필요하지 않습니다. 가장 일반적으로, 과정에서 임의의 \(X_i\)와 \(X_j\)는 유한한 경우, {1, 2, ..., n}, 또는, 무한한 경우, {1, 2, 3, ...}에 의해 인덱스된 확률 변수의 집합에서 단순히 두 개입니다.
보통 1과 0으로 인코딩되는, 종종 "성공"과 "실패"라고 참조되는, 오직 두 가지 가능한 결과를 갖는 하나의 실험은 베르누이 분포(Bernoulli distribution)로 모델링될 수 있습니다. 베르누이 외에 여러 확률 변수와 확률 분포는 베르누이 과정에서 다음과 같은 도출될 수 있습니다:

처음 n번 시행에서 성공한 횟수, 이는 이항 분포(binomial distribution) B(n, p)를 가집니다.
r번 성공하는 데 필요한 실패 횟수, 이는 음의 이항 분포(negative binomial distribution) NB(r, p)를 가집니다.
한 번 성공하는 데 필요한 실패 횟수, 이는 기하 분포(geometric distribution) NB(1, p), 음의 이항 분포의 특수한 경우를 가집니다.

음의 이항 변수는 무작위 대기 시간(waiting times)으로 해석될 수 있습니다.

Formal definition

베르누이 과정은 앞면 또는 뒷면의 값을 취할 수 있는 확률 변수의 독립적 실현의 무작위 순서로 확률 공간(probability spaces)의 언어로 형식화될 수 있습니다. 개별 값에 대해 상태 공간은 \(2=\{H,T\} \)에 의해 표시됩니다.

Borel algebra

\(2=\{H,T\}\)의 복사본의 셀-수-있는 무한(countably infinite) 직접 곱(direct product)을 생각해 보십시오. 한-측 집합 \(\Omega=2^\mathbb{N}=\{H,T\}^\mathbb{N}\) 또는 두-측 집합 \(\Omega=2^\mathbb{Z}\)를 검사하는 것이 공통적입니다. 이 공간 위에, 곱 토폴로지(product topology)라고 불리는, 자연스러운 토폴로지(topology)가 있습니다. 그 토폴로지에서 집합은 유한한 동전 던짐의 순서열, 즉, H와 T의 유한-길이 문자열이며 (H는 앞면을 나타내고 T는 뒷면을 나타냄), 나머지 (무한하게 긴) 순서열은 "상관하지 않음"으로 취합니다. 이들 유한 순서열의 집합은 곱 토폴로지에서 원기둥 집합(cylinder sets)이라고 참조됩니다. 모든 그러한 문자열의 집합은 시그마 대수(sigma algebra), 특히, 보렐 대수(Borel algebra)를 형성합니다. 이 대수는 그런-다음 공통적으로 \((\Omega, \mathcal{B})\)로 작성되며, 여기서 \(\mathcal{B}\)의 원소는 동전 던짐의 유한-길이 순서열 (원기둥 집합)입니다.

Bernoulli measure

만약 앞면 또는 뒷면 뒤집기의 기회가 확률 \(\{p,1-p\}\)에 의해 주어지면, \(P=\{p, 1-p\}^\mathbb{N}\) (또는 두-측 과정에 대해 \(P=\{p, 1-p\}^\mathbb{Z}\))에 의해 주어진, 곱 공간 위의 자연스러운 측정(measure)을 정의할 수 있습니다. 다시 말해서, 만약 이산 확률 변수(discrete random variable) X가 매개변수 p를 갖는 베르누이 분포를 가지면, 여기서 0 ≤ p ≤ 1이고, 확률 질량 함수(probability mass function)는 다음에 의해 제공됩니다:
\(\quad\displaystyle pX(1)=P(X=1)=p\) and \(pX(0)=P(X=0)=1-p\).
이 분포를 Ber(p)로 표시합니다.
원기둥 집합, 즉, 시간 \(1,2,\cdots,n\)에서 동전 던지기 결과 \([\omega_1, \omega_2,\cdots\omega_n]\)의 특정 순서열이 주어지면, 이 특정 순서열을 관찰할 확률은 다음에 의해 주어집니다:
\(\quad\displaystyle P([\omega_1, \omega_2,\cdots ,\omega_n])= p^k (1-p)^{n-k}\)
여기서 k는 H가 순서열에 나타나는 횟수이고, n−k는 T가 순서열에 나타나는 횟수입니다. 위의 표기법에는 여러 종류가 있습니다; 공통적인 것은 다음과 같이 쓰는 것입니다:
\(\quad\displaystyle P(X_1=x_1, X_2=x_2,\cdots, X_n=x_n)= p^k (1-p)^{n-k}\)
여기서 각 \(X_i\)는 아이버슨 괄호(Iverson bracket) 표기법에서 \(x_i=[\omega_i=H]\)를 갖는 이진-값 확률 변수(random variable)로, \(\omega_i=H\)이면 \(1\), \(\omega_i=T\)이면 \(0\)임을 의미합니다. 이 확률 \(P\)는 공통적으로 베르누이 측정(Bernoulli measure)이라고 불립니다.
임의의 특정, 무한하게 긴 동전 던지기 순서열의 확률은 정확히 영임을 주목하십시오; 이것은 임의의 \(0\le p<1\)에 대해 \(\lim_{n\to\infty}p^n=0\)이기 때문입니다. 확률이 1과 같다는 것은 임의의 주어진 무한 순서열이 측정 영(measure zero)을 가짐을 의미합니다. 그럼에도 불구하고, 동전 던지기의 무한한 순서열의 일부 클래스는 다른 클래스보다 훨씬 더 가능성이 높다고 말할 수 있으며, 이것은 점근적 등분할 속성(asymptotic equipartition property)에 의해 제공됩니다.
형식적 정의를 결론짓기 위해, 베르누이 과정은 위에서 정의된 대로 확률 세-쌍 \((\Omega, \mathcal{B}, P)\)에 의해 제공됩니다.

Law of large numbers, binomial distribution and central limit theorem

\( H \)가 1로 표시되고 \( T \)가 0으로 표시되는 정식의 과정을 가정해 보십시오. 큰 숫자의 법칙(law of large numbers)에 따르면 순서열의 평균, 즉, \( \bar{X}_{n}:=\frac{1}{n}\sum_{i=1}^{n}X_{i} \)는 기댓값(expected value)에 거의 확실히 근접할 것입니다. 즉, 이 극한을 만족시키지 않는 사건은 영 확률을 가집니다. 뒤집힌 ''머리''의 기댓값은 1로 표시되는 것으로 가정되고 \(p\)로 지정됩니다. 사실, 베르누이 과정을 구성하는 무한 순서열의 베르누이 시행(Bernoulli trials) 중 임의의 주어진 확률 변수 \(X_i\)에 대해. 다음을 가집니다:

\(\quad\displaystyle \mathbb{E}[X_i]=\mathbb{P}([X_i=1])=p,\)

사람들은 종종 n번 동전 던지기 순서열에서 H를 얼마나 자주 관찰할지 알고 싶어합니다. 이것은 단순히 세는 것으로써 제공됩니다: n번의 연속적인 동전 던지기가 주어지면, 즉, 길이 n의 모든 가능한 문자열(strings)의 집합이 주어지면, H의 k번 나타나는 문자열의 숫자 N(k,n)은 이항 계수(binomial coefficient)에 의해 제공됩니다:
\(\quad\displaystyle N(k,n) = {n \choose k}=\frac{n!}{k! (n-k)!}\)

만약 앞면이 뒤집힐 확률이 p로 주어지면, k번 앞면을 갖는 길이 n의 문자열을 볼 확률의 총합은 다음과 같습니다:
\(\quad\displaystyle \mathbb{P}([S_n=k]) = {n\choose k} p^k (1-p)^{n-k} , \)

여기서 \(\displaystyle S_n=\sum_{i=1}^{n}X_i \)입니다. 이렇게 정의된 확률 측정은 이항 분포(Binomial distribution)로 알려져 있습니다.

위 공식에서 알 수 있듯이, n=1이면 이항 분포가 베르누이 분포로 바뀔 것입니다. 따라서 베르누이 분포는 n이 1과 같을 때 정확히 이항 분포의 특별한 경우임을 알 수 있습니다.
특히 흥미로운 것은 충분히 긴 동전 던지기 순서열, 즉, 극한 \(n\to\infty\)에 대한 \(S_{n}\)의 값의 문제입니다. 이 경우에서, 팩토리얼에 대한 스털링의 근사(Stirling's approximation)를 사용할 수 있고, 다음과 같이 쓸 수 있습니다:

\(\quad\displaystyle n! = \sqrt{2\pi n} \;n^n e^{-n} \left(1 + \mathcal{O}\left(\frac{1}{n}\right)\right)\)

이것을 P(k,n)에 대한 식에 대입하면, 정규 분포(Normal distribution)를 얻습니다; 이것이 중심 극한 정리(central limit theorem)의 내용이고, 이것이 그것의 가장 간단한 예제입니다.
큰 숫자의 법칙과 중심 극한 정리의 조합은 흥미롭고 아마도 놀라운 결과: 점근적 등분할 속성(asymptotic equipartition property)으로 이어집니다. 비공식적으로 말하면, 예, 많은 동전 던지기에서 H가 정확하게 시간의 p 부분을 관찰하고, 이것이 가우스의 정점과 정확하게 일치한다는 점에 주목합니다. 점근적 등분할 속성은 본질적으로 이 정점이 무한하게 날카롭고 어느 한쪽에서 무한히 감소함을 나타냅니다. 즉, 베르누이 과정에서 발생하는 H와 T의 모든 가능한 무한하게 긴 문자열의 집합이 주어지면, 이 집합은 확률 1로 발생하는 문자열과 확률 0으로 발생하는 문자열의 두 가지로 분할됩니다. 이 분할은 콜모고로프 0-1 법칙(Kolmogorov 0-1 law)으로 알려져 있습니다.
이 집합의 크기도 흥미롭고, 또한, 명시적으로 결정할 수 있습니다: 그것의 로그는 정확히 베르누이 과정의 엔트로피(entropy)입니다. 다시 한번, 길이 n의 모든 문자열 집합을 생각해 보십시오. 이 집합의 크기는 \(2^n\)입니다. 이들 중 특정 부분집합만 가능성이 있습니다; 이 집합의 크기는 \(H\le 1\)에 대해 \(2^{nH}\)입니다. 스털링의 근사를 사용하여, P(k,n)에 대한 식에 대입하여, 정점의 위치와 너비를 풀고, 마지막으로 \(n\to\infty\)를 취함으로써 다음임을 찾습니다:

\(\quad\displaystyle H=-p\log_2 p - (1-p)\log_2(1-p)\)

이 값은 베르누이 과정의 베르누이 엔트로피(Bernoulli entropy)입니다. 여기서, H는 엔트로피를 의미합니다; 머리를 나타내는 같은 기호 H와 혼동하지 마십시오.
존 폰 노이만(John von Neumann)은 베르누이 과정에 대해 흥미로운 질문을 제기했습니다: 동역학 시스템의 동형이라는 의미에서 주어진 과정이 또 다른 과정과 동형적(isomorphic)일 수 있습니까? 그 질문은 오랫동안 분석을 거부했지만, 마침내 오른슈타인 동형 정리(Ornstein isomorphism theorem)로 완전히 답을 얻었습니다. 이 돌파구는 베르누이 과정이 고유하고 보편적(universal)이라는 이해를 가져왔습니다; 어떤 의미에서, 그것은 가능한 한 가장 무작위 과정입니다; 베르누이 과정보다 '더' 무작위적인 것은 없습니다 (비록 비공식적 명제에 주의해야 함에도 불구하고; 확실하게, 혼합되는 시스템은 어떤 의미에서 단순히 에르고딕하지만 혼합되지는 않는 베르누이 과정보다 '강력'합니다. 어쨌든, 그러한 과정은 독립적인 확률 변수로 구성되지 않습니다: 실제로, 많은 순수하게 결정론적이고, 비-무작위 시스템이 혼합될 수 있습니다).

Dynamical systems

베르누이 과정은 역시 에르고딕 시스템의 예제로서 동역학적 시스템(dynamical system)과, 특히 여러 다른 방법 중 하나에서 측정-보존하는 동역학적 시스템(measure-preserving dynamical system)으로 이해될 수 있습니다. 한 가지 방법은 미는 공간(shift space)이고, 다른 하나는 주행거리계(odometer)입니다. 이것들은 아래에서 검토됩니다.

Bernoulli shift

베르누이 과정에서 동역학적 시스템을 생성하기 위해 한 가지 방법은 미는 공간(shift space)입니다. 미는 연산자(shift operator)에 의해 주어진 곱 공간 \(\Omega=2^\mathbb{N}\) 위에 자연스러운 평행이동 대칭이 있습니다:

\(\quad\displaystyle T(X_0, X_1, X_2, \cdots) = (X_1, X_2, \cdots)\)

위에 정의된 베르누이 측정은 평행이동-불변입니다; 즉, 임의의 원기둥 집합 \(\sigma\in\mathcal{B}\)가 주어지면, 다음을 가집니다:

\(\quad\displaystyle P(T^{-1}(\sigma))=P(\sigma)\)

그리고 따라서 베르누이 측정(Bernoulli measure)은 하르 측정(Haar measure)입니다; 그것은 곱 공간 위에 불변 측정(invariant measure)입니다.
확률 측정 \(P:\mathcal{B}\to\mathbb{R}\) 대신, 어떤 임의적인 함수 \(f:\mathcal{B}\to\mathbb{R}\)를 생각해 보십시오. \(\left(f\circ T^{-1}\right)(\sigma) = f(T^{-1}(\sigma))\)에 의해 정의된 다음 밂(pushforward)은

\(\quad\displaystyle f\circ T^{-1}\)

다시 어떤 함수 \(\mathcal{B}\to\mathbb{R}\)입니다. 따라서, 맵 \(T\)는 모든 함수 \(\mathcal{B}\to\mathbb{R}\)의 공간 위에 또 다른 맵 \(\mathcal{L}_T\)를 유도합니다. 즉, 일부 \(f:\mathcal{B}\to\mathbb{R}\)가 주어지면, 다음을 정의합니다:

\(\quad\displaystyle \mathcal{L}_T f = f \circ T^{-1}\)

맵 \(\mathcal{L}_T\)는 (분명히) 함수 \(f,g\)와 상수 \(a\)에 대해 \(\mathcal{L}_T(f+g)= \mathcal{L}_T(f) + \mathcal{L}_T(g)\)와 \(\mathcal{L}_T(af)= a\mathcal{L}_T(f)\)를 가질 때 선형 연산자(linear operator)입니다. 이 선형 연산자는 전송 연산자(transfer operator) 또는 Ruelle–Frobenius–Perron operator라고 불립니다. 이 연산자는 스펙트럼, 즉, 고유-함수(eigenfunctions)와 해당 고윳값의 모음을 가집니다. 가장 큰 고윳값은 프로베니우스–페론 고윳값(Frobenius–Perron eigenvalue)이고, 이 경우에서, 그것은 1입니다. 결합된 고유-벡터는 불변 측정입니다: 이 경우에서, 그것은 베르누이 측정입니다. 즉, \(\mathcal{L}_T(P)= P\)이다.

만약 \(\mathcal{L}_T\)를 다항식 위에 작용하도록 제한하면, 고유-함수는 (이상하게도) 베르누이 다항식(Bernoulli polynomials)입니다! 이 이름의 우연은 아마도 베르누이에게 알려지지 않았을 것입니다.

The 2x mod 1 map

위의 것은 더 정확하게 만들 수 있습니다. 이진 자릿수 \(b_0, b_1, \cdots\)의 무한한 문자열이 주어지면, 다음을 씁니다:

\(\quad\displaystyle y=\sum_{n=0}^\infty \frac{b_n}{2^{n+1}}.\)

결과 \(y\)는 단위 구간 \(0\le y\le 1\)의 실수입니다. 미는 \(T\)는 단위 구간 위에 \(T\)라고도 불리는 준동형(homomorphism)을 유도합니다. \(T(b_0, b_1, b_2, \cdots) = (b_1, b_2, \cdots)\)이므로, \(T(y)=2y\bmod 1\)임을 쉽게 알 수 있습니다. 이 맵은 이원적 변환(dyadic transformation)이라고 불립니다; 비트 \(\Omega=2^\mathbb{Z}\)의 이중으로-무한 순서열 대해, 유도된 준동형은 베이커의 맵(Baker's map)입니다.

이제 \(y\)에서 함수의 공간을 생각해 보십시오. 일부 \(f(y)\)가 주어지면, 다음임을 쉽게 찾을 수 있습니다:

\(\quad\displaystyle \left[\mathcal{L}_T f\right](y) = \frac{1}{2}f\left(\frac{y}{2}\right)+\frac{1}{2}f\left(\frac{y+1}{2}\right)\)

연산자 \(\mathcal{L}_T\)의 동작을 다항식 위에 있는 함수로 제한하면, 다음에 의해 주어진 이산 스펙트럼(discrete spectrum)을 가짐을 찾습니다:

\(\quad\displaystyle \mathcal{L}_T B_n= 2^{-n}B_n\)

여기서 \(B_n\)은 베르누이 다항식(Bernoulli polynomials)입니다. 실제로, 베르누이 다항식은 다음 항등식을 따릅니다:

\(\quad\displaystyle \frac{1}{2}B_n\left(\frac{y}{2}\right)+\frac{1}{2}B_n\left(\frac{y+1}{2}\right) = 2^{-n}B_n(y)\)

The Cantor set

다음 합이 전통적으로 정의된 대로 칸토어 함수(Cantor function)를 제공함을 주목하십시오:
\(\quad\displaystyle y=\sum_{n=0}^\infty \frac{b_n}{3^{n+1}}\)
이것이 집합 \(\{H,T\}^\mathbb{N}\)이 때때로 칸토어 집합(Cantor set)이라고 불리는 이유 중 하나입니다.

Odometer

동역학적 시스템을 만들기 위한 또 다른 방법은 주행기록계(odometer)를 정의하는 것입니다. 비공식적으로, 이것은 정확히 다음과 같이 들리는 것입니다: 첫 번째 위치에 단지 "1을 추가"하고, 주행거리계가 "롤 오버"될 때 캐리 비트(carry bits)를 사용함으로써 주행거리계가 "롤 오버"되도록 합니다. 이것은 무한 문자열의 집합에 대한 밑수-2 덧셈에 지나지 않습니다. 덧셈은 그룹을 형성하고, 베르누이 과정은 위에서 이미 토폴로지를 제공하기 때문에, 이것은 토폴로지적 그룹(topological group)의 간단한 예제를 제공합니다.
이 경우에서, 변환 \(T\)는 다음에 의해 제공됩니다:
\(\quad\displaystyle T\left(1,\dots,1,0,X_{k+1},X_{k+2},\dots\right) = \left(0,\dots,0,1,X_{k+1},X_{k+2},\dots \right).\)
그것은 \(p=1/2\) ("공정한 동전")의 특수한 경우에만 베르누이 측정을 불변으로 남깁니다; 그렇지 않으면 아닙니다. 따라서, \(T\)는 이 경우에서 동역학적 시스템을 보존하는 측정이고, 그렇지 않으면, 그것은 단지 보존 시스템(conservative system)입니다.

Bernoulli sequence

베르누이 수열(Bernoulli sequence)이라는 용어는 종종 베르누이 과정의 실현(realization)을 참조하기 위해 비공식적으로 사용됩니다. 어쨌든, 그 용어는 아래와 같이 완전히 다른 형식적 정의를 가지고 있습니다.
형식적으로 단일 확률 변수로 정의된 베르누이 과정을 가정합니다 (이전 섹션 참조). 동전 던지기의 모든 각 무한 수열 x에 대해, 베르누이 과정과 결합된 베르누이 베르누이 수열(Bernoulli sequence)이라고 불리는 다음과 같은 정수의 수열(sequence)이 있습니다:
\(\quad\displaystyle \mathbb{Z}^x = \{n\in \mathbb{Z} : X_n(x) = 1 \} \, \)
예를 들어, 만약 x가 동전 던지기의 수열을 나타내면, 결합된 베르누이 수열은 동전 던지기 결과가 앞면인 자연수 또는 시간-점의 목록입니다.
이렇게 정의된, 베르누이 수열 \(\mathbb{Z}^x\)은 인덱스 집합, 자연수 \(\mathbb{N}\)의 무작위 부분집합이기도 합니다.
거의 모든(Almost all) 베르누이 수열 \(\mathbb{Z}^x\)은 에르고딕 수열(ergodic sequences)입니다.

Randomness extraction

임의의 베르누이 과정에서 폰 노이만 추출기(von Neumann extractor)에 의해 p = 1/2을 갖는 베르누이 과정을 유도할 수 있으며, 이는 실제로 균등 무작위성을 추출하는 최초의 무작위성 추출기(randomness extractor)입니다.

Basic von Neumann extractor

관찰된 과정을 0과 1 또는 비트의 수열로 나타내고, 해당 입력 스트림을 (11)(00)(10)...과 같이 연속 비트의 겹치지 않는 쌍으로 그룹화합니다. 그런-다음 각 쌍에 대해,

만약 비트가 같으면, 버립니다;
만약 비트가 같지 않으면, 첫 번째 비트를 출력합니다.

이 테이블은 계산을 요약합니다.

input	output
00	discard
01	0
10	1
11	discard

예를 들어, 8비트 10011011의 입력 스트림은 (10)(01)(10)(11)으로 쌍으로 그룹화됩니다. 그런-다음 위의 테이블에 따라, 이들 쌍은 절차의 출력: (1)(0)(1)() (=101)으로 변환됩니다.
출력 스트림에서, 0과 1은 확률이 동일하며, 10과 01은 원래에서 확률이 같고, 둘 다 확률 p(1−p) = (1−p)p를 가집니다. 이러한 균등 무작위성의 추출은 입력 시행이 독립적일 필요는 없으며, 단지 비-상관적(uncorrelated)이어야 합니다. 보다 일반적으로, 그것은 비트의 임의의 교환-가능한 수열(exchangeable sequence)에 대해 작동합니다: 유한 재배열인 모든 수열은 같은 가능성이 있습니다.
폰 노이만 추출기는 2개의 입력 비트를 0 또는 1 출력 비트를 생성하기 위해 사용하므로, 출력은 적어도 2의 인수만큼 입력보다 짧습니다. 평균적으로, 계산은 입력 쌍(00와 11)의 비율 \(p^2+(1-p)^2\)을 버리며, 이는 p가 0 또는 1에 가까울 때 1에 가깝고, 원래 과정에 대해 p = 1/2일 때 1/4에서 최소화됩니다 (이 경우에서 출력 스트림 길이는 평균적으로 입력 스트림의 1/4 길이입니다).
폰 노이만 (고전적) 주요 연산 유사-코드(pseudocode):

if (Bit1 ≠ Bit2) {
   output(Bit1)
}

Iterated von Neumann extractor

이러한 효율성 감소, 또는 입력 스트림에 존재하는 무작위성의 낭비는 입력 데이터에 걸쳐 알고리듬을 반복함으로써 완화될 수 있습니다. 이 방법으로 출력을 "엔트로피 경계에 임의적으로 가깝게" 만들 수 있습니다.
고급 다중-수준 전략(Advanced Multi-Level Strategy, 줄여서 AMLS)로도 알려진 폰 노이만 알고리듬의 반복된 버전은 1992년에 유발 페레스(Yuval Peres)에 의해 도입되었습니다. 그것은 두 가지 원천: 버림/비-버림의 수열에서 "낭비된 무작위성"과 버려진 쌍의 값 (00에 대해 0과 11에 대해 1)을 재활용하여 재귀적으로 작동합니다. 직관적으로, 그것은 이미 생성된 수열이 주어지면, 두 원천 모두 여전히 교환-가능한 비트의 수열이고, 따라서 또 다른 추출 회에 적합하다는 사실에 의존합니다. 그러한 추가 수열의 생성은 모든 사용-가능한 엔트로피를 추출하기 위해 무한하게 반복될 수 있지만, 무한한 계산적 자원의 총량이 요구되며, 따라서 반복의 횟수는 전형적으로 낮은 값으로 고정됩니다 – 이 값은 미리 고정되거나 실행-시간에 계산됩니다.
보다 구체적으로, 입력 수열에서, 알고리듬은 입력 비트를 쌍으로 소비하여, 두 개의 새로운 수열과 함께 출력을 생성합니다:

input	output	new sequence 1	new sequence 2
00	none	0	0
01	0	1	none
10	1	1	none
11	none	0	1

(만약 입력의 길이가 홀수이면, 마지막 비트는 완전하게 폐기됩니다.) 그런-다음 알고리듬은 입력이 비어 있을 때까지 두 개의 새로운 수열 각각에 재귀적으로 적용됩니다.
예제: 위의 입력 스트림, 10011011은 이러한 방법에서 처리됩니다:

step number	input	output	new sequence 1	new sequence 2
0	(10)(01)(10)(11)	(1)(0)(1)()	(1)(1)(1)(0)	()()()(1)
1	(11)(10)	()(1)	(0)(1)	(1)()
1.1	(01)	(0)	(1)	()
1.1.1	1	none	none	none
1.2	1	none	none	none
2	1	none	none	none

1단계부터, 입력은 이 과정에서 앞으로 나아갈 마지막 단계의 새로운 sequence1이 됩니다. 따라서 출력은 (101)(1)(0)()()() (=10110)이므로, 위의 기본 알고리듬을 통해 3비트가 아닌 8비트의 입력에서 5비트의 출력이 생성되었습니다. 회 당 정확하게 2비트의 일정한 출력 (고전적 VN에서 변수 0에서 1비트와 비교)은 역시 타이밍 공격(timing attacks)에 저항하는 일정한-시간 구현을 허용합니다.
폰 노이만-페레스 (반복된) 주요 연산 유사-코드:

if (Bit1 ≠ Bit2) {
   output(1, Sequence1)
   output(Bit1)
} else {
   output(0, Sequence1)
   output(Bit1, Sequence2)
}

2016년에는 Sequence2 채널이 많은 처리량을 제공하지 않는다는 관찰 결과와 한정된 수준의 하드웨어 구현이 Sequence1의 더 많은 수준을 처리하는 대가로 더 일찍 폐기함으로써 이점을 얻을 수 있다는 관찰에 기반하여 또 다른 조정이 제시되었습니다.

External links

Using a binary tree diagram for describing a Bernoulli process

Dawoum

(번역) Bernoulli process

Definition

Interpretation

Formal definition

Borel algebra

Bernoulli measure

Law of large numbers, binomial distribution and central limit theorem

Dynamical systems

Bernoulli shift

The 2x mod 1 map

The Cantor set

Odometer

Bernoulli sequence

Randomness extraction

Basic von Neumann extractor

Iterated von Neumann extractor

Further reading

External links

티스토리툴바

(번역) Bernoulli process

Definition

Interpretation

Formal definition

Borel algebra

Bernoulli measure

Law of large numbers, binomial distribution and central limit theorem

Dynamical systems

Bernoulli shift

The 2x mod 1 map

The Cantor set

Odometer

Bernoulli sequence

Randomness extraction

Basic von Neumann extractor

Iterated von Neumann extractor

Further reading

External links

관련글

티스토리툴바