먼저, 이전 과정의 도수분포표에서
변량 \(X\) | \(x_1\) | \(x_2\) | \(x_3\) | \(\cdots\) | \(x_n\) | 합계 |
도수 | \(f_1\) | \(f_2\) | \(f_3\) | \(\cdots\) | \(f_n\) | N |
평균 \(m\)은 다음과 같이 구해집니다:
\(\quad\)\(\displaystyle m=\frac{x_1 f_1+x_2 f_2+x_3 f_3+\cdots+x_n f_n}{N}\)
이 식을 다음과 같이 조작하면,
\(\quad\)\(\begin{align}
m & =\frac{x_1 f_1+x_2 f_2+x_3 f_3+\cdots+x_n f_n}{N} \\
& = x_1\frac{f_1}{N}+x_2\frac{f_2}{N}+x_3\frac{f_3}{N}+\cdots+x_n\frac{f_n}{N} \\
& = x_1 p_1+x_2 p_2+x_3 p_3+\cdots+x_n p_n \\
& = \sum_{i=1}^n x_i p_i \\
\end{align}\)
평균이 도수분포표에서 많이 이용되었다면, 기댓값은, 겜블링(도박)에서 딸 수 있는 기대 금액의 의미로, 확률분포표에서 더 자주 이용됩니다.
일반적인 (이산)확률분포표에서,
\(X\) | \(x_1\) | \(x_2\) | \(x_3\) | \(\cdots\) | \(x_n\) | 합계 |
\(P(X=x_i)\) | \(p_1\) | \(p_2\) | \(p_3\) | \(\cdots\) | \(p_n\) | 1 |
그의 기댓값은 다음과 같이 표현됩니다:
\(\quad\)\(\displaystyle E(X)=x_1 p_1+x_2 p_2+x_3 p_3+\cdots+x_n p_n= \sum_{i=1}^n x_i p_i\)
이산확률변수의 분산과 표준편차
도수분포표에서 분산은 다음 2가지 방법으로 구했습니다.
- (분산) = (편차의 제곱의 평균)
- (분산) = (변량의 제곱의 평균) – (평균의 제곱)
첫 번째를 식으로 나타내고 다음과 같이 대수적으로 조작할 수 있습니다:
\(\quad\)\(\begin{align}
V & = \frac{(x_1-m)^2 f_1 + (x_2-m)^2 f_2 + (x_3-m)^2 f_3 + \cdots + (x_n-m)^2 f_n}{N} \\
& = (x_1-m)^2 \frac{f_1}{N} + (x_2-m)^2 \frac{f_2}{N} + (x_3-m)^2 \frac{f_3}{N} + \cdots + (x_n-m)^2 \frac{f_n}{N} \\
& = (x_1-m)^2 p_1 + (x_2-m)^2 p_2 + (x_3-m)^2 p_3 + \cdots + (x_n-m)^2 p_n \\
& = \sum_{i=1}^n (x_i - m)^2 p_i \\
\end{align}\)
두 번째를 식으로 나타내고 다음과 같이 대수적으로 조작할 수 있습니다:
\(\quad\)\(\begin{align}
V & = \frac{x_1^2 f_1 + x_2^2 f_2 + x_3^2 f_3 + \cdots + x_n^2 f_n}{N}- m^2 \\
& = x_1^2 \frac{f_1}{N} + x_2^2 \frac{f_2}{N} + x_3^2 \frac{f_3}{N} + \cdots + x_n^2 \frac{f_n}{N} - m^2 \\
& = x_1^2 p_1 + x_2^2 p_2 + x_3^2 p_3 + \cdots + x_n^2 p_n -m^2 \\
& = \sum_{i=1}^n x_i^2 p_i - m^2\\
\end{align}\)
한편, 분산 \(V\)는 \(\sigma^2\)으로 나타내기도 하고, 그의 양의 제곱근 \(\sqrt{V}\)는 표준편차 \(\sigma\)라고 합니다
정리하면,
이산확률변수 \(X\)의 확률질량함수가 \(P(X=x_i)=p_i\;(i=1,2,3,\cdots,n)\)이고, 기댓값(평균)을 \(E(X)(=m)\)라고 할 때, 분산 \(V(x)\)와 표준편차 \(\sigma(X)\)는 다음과 같이 나타낼 수 있습니다.
\(\quad\)\(\begin{align}
V(X) & = E\left((X-m)^2\right) \\
& = \sum_{i=1}^n \left(x_i - E(x)\right)^2 p_i \\
& = \sum_{i=1}^n x_i^2 p_i - \left\{E(X)\right\}^2 \\
& = E\left(X^2\right) - \left\{E(X)\right\}^2 \\
\end{align}\)
\(\quad\)\(\displaystyle \sigma(X)=\sqrt{V(X)}\)
분산 식의 전개 과정
분산 식은 시그마에 의한 표현이므로, 시그마의 성질을 이용해서 두 식이 같음을 보일 수 있습니다:
\(\quad\)\(\begin{align}
V(X) & = \sum_{i=1}^n \left(x_i - m\right)^2 pi \\
& = \sum_{i=1}^n \left(x_i^2 - 2m x_i + m^2\right) pi \\
& = \sum_{i=1}^n x_i^2 p_i - 2m \sum_{i=1}^n x_i p_i + m^2 \sum_{i=1}^n pi \\
& = \sum_{i=1}^n x_i^2 p_i - 2m \cdot m + m^2 \cdot 1 \\
& = \sum_{i=1}^n x_i^2 p_i + m^2 \\
& = E\left(X^2\right) - \left\{E(X)\right\}^2 \\
\end{align}\)
응용예제
응용예제1
주머니 안에 구별이 되지 않는 검은 공 4개와 흰 공 2개가 들어 있다. 이 주머니에서 차례로 한 개씩 꺼내어 순서를 기록할 때, 두 번째 검은 공이 나온 순서를 확률변수 \(X\)라 하자. \(X\)의 분산을 구하시오.