본문 바로가기
영문 위키피디아 번역

(번역) Margin of error

by 다움위키 2024. 3. 4.
Original article: w:Margin of error

 

오차의 한계(margin of error)는 설문조사(survey)의 결과에서 무작위 표본화 오차(sampling error)의 총양을 나타내는 통계량입니다. 오차의 한계가 클수록, 여론조사 결과가 전체 모집단(population)의 설문조사의 결과를 반영할 것이라는 더 작은 신뢰 구간을 가져야 합니다. 오차의 한계는 모집단이 불완전하게 샘플링되고 결과 측정이 양의 분산(variance)을 가질 때마다, 말하자면, 측정이 변할 때마다 양수일 것입니다.

용어 오차의 한계는 측정된 양을 보고하는 것에서 관측 오차(observational error)를 나타내기 위해 비-조사 문맥에서 자주 사용됩니다. 그것은 역시 구어체(colloquial speech)에서 목표를 달성할 때 가질 수 있는 공간의 총양 또는 유연성의 총양을 참조하기 위해 사용됩니다. 예를 들어, 그것은 스포츠에서 해설자(commentators)에 의해 목표, 점수, 또는 결과를 달성하기 위해 얼마나 많은 정밀도가 필요한지 설명할 때 종종 사용됩니다. 미국에서 사용되는 볼링 핀(bowling pin)의 너비는 4.75인치 폭이고, 공은 8.5인치 너비이고, 따라서 스페어를 얻기 위해 특정 핀을 치려고 시도할 때 볼링 선수는 21.75인치 오차의 한계를 가진다 (예를 들어, 레인에 남은 핀 1개)고 말할 수 있습니다.

Concept

모집단 \(N \text{, }(n << N)\)에서 추출된 \(n\) 응답자의 표본에서 응답의 백분율 \(p\)를 보고하는 단순한 예/아니오 투표 \(P\)를 생각해 보십시오. 우리는 \(p\)가 전체 모집단 \(N\)의 설문조사 결과에, 그것을 수행하지 않고도, 얼마나 가까운지 알고 싶습니다. 만약, 가설적으로, \(n\) 응답자 (새롭게 \(N\)에서 추출됨)의 후속 표본에 걸쳐 투표 \(P\)를 수행하면, 우리는 후속 결과 \(p_1,p_2,\ldots\)를 \(\overline{p}\)에 대해 정규적으로 분포된 것으로 기대합니다. 오차의 한계는 이들 결과의 지정된 백분율이 \(\overline{p}\)에서 달라질 것으로 예상되는 거리를 나타냅니다.

68-95-99.7 규칙에 따르면, 우리는 결과 \(p_1,p_2,\ldots\)의 95%가 실제 평균 \(\overline{p}\)의 양쪽 편에 이 표준 편차(standard deviation) (\(\pm 2\sigma_{P}\)) 내에 떨어질 것이라고 예상합니다. 이 구간은 신뢰 구간(confidence interval)이라고 하고, 반지름 (구간의 절반)은 오차의 한계라고 하며, 95% 신뢰 수준에 해당합니다.

일반적으로 신뢰 수준 \(\gamma\)에서, 예상된 표준편차 \(\sigma\)를 갖는 모집단의 크기 \(n\)인 표본은 다음 오차의 한계를 가집니다:

\(\quad\displaystyle MOE_\gamma = z_\gamma \times \sqrt{\frac{\sigma^2}{n}}\)

여기서 \(z_\gamma \)는 퀀타일을 나타내고 (역시, 공통적으로, z-score), \(\sqrt{\frac{\sigma^2}{n}}\)는 표준 오차(standard error)입니다.

Standard deviation and standard error

우리는 정규적으로 분포된 값 &nbsp;\(p_1,p_2,\ldots\)을 \(n\)에 따라 어떻게든 달라지는 표준 편차를 가지는 것으로 기대합니다. \(n\)이 작을수록 한계가 넓어집니다. 이것은 표준 오차\(\sigma_\overline{p}\)라고 합니다.

우리의 설문조사에서 단일 결과에 대해, 우리는 \(p = \overline{p}\), 및 모든 후속 결과 \(p_1,p_2,\ldots\)는 함께 분산 \(\sigma_{P}^2=P(1-P)\)를 가질 것이라고 가정합니다:

\(\quad\displaystyle \text{Standard error} = \sigma_\overline{p} \approx \sqrt{\frac{\sigma_{P}^2}{n}} \approx \sqrt{\frac{p(1-p)}{n}}\)

\(p(1-p)\)가 베르누이 분포(Bernoulli distribution)의 분산에 해당함에 주목하십시오.

Maximum margin of error at different confidence levels

신뢰 수준 \(\gamma\)에 대해, 평균 \(\mu\pm z_\gamma\sigma\)에 대한 신뢰 구간, 즉, \(P\)의 값이 확률 \(\gamma\)와 함께 그것 내에 떨어져야 하는 구간 \([\mu-z_\gamma\sigma,\mu+z_\gamma\sigma]\)이 있습니다. \(z_\gamma\)의 정확한 값은 정규 분포의 퀀타일 함수에 의해 제공됩니다 (68-95-99.7 규칙이 근사합니다).

\(z_\gamma\)가 \(|\gamma| \ge 1\)에 대해 정의되지 않으며, 즉, \(z_{1.00}\)는 \(z_{1.10}\)에서 처럼 정의되지 않음에 주목하십시오.

\(p = 0.5\)에서 \(\max \sigma_P^2 = \max P(1-P) = 0.25\)이므로, 우리는 심지어 실제 결과를 가지기 전에 \(p=\overline{p} = 0.5\)를 임의적으로 설정하고, 주어진 신뢰 수준  \(\gamma\)와 표본 크기 \(n\)에서 \(P\)에 대해 최대 오차의 한계를 얻기 위해 \(\sigma_{P}\), \(\sigma_\overline{p}\), 및 \(z_\gamma\sigma_\overline{p}\)를 계산할 수 있습니다. &nbsp;\(p=0.5,n=1013\)와 함께,

\(\quad\displaystyle MOE_{95}(0.5) = z_{0.95}\sigma_\overline{p} \approx z_{0.95}\sqrt{\frac{\sigma_{P}^2}{n}} = 1.96\sqrt{\frac{.25}{n}} = 0.98/\sqrt{n}=\pm 3.1 \%\)

\(\quad\displaystyle MOE_{99}(0.5) = z_{0.99}\sigma_\overline{p} \approx z_{0.99}\sqrt{\frac{\sigma_{P}^2}{n}} = 2.58\sqrt{\frac{.25}{n}} = 1.29/\sqrt{n}=\pm 4.1 \%\)

역시, 유용하게, 임의의 보고된 \(MOE_{95}\)에 대해,

\(\quad\displaystyle MOE_{99} = \frac{z_{0.99}}{z_{0.95}}MOE_{95} \approx 1.3 \times MOE_{95}\)

Specific margins of error

만약 투표가 여러 백분율 결과가를 가지면 (예를 들어, 단일 여러-선택 선호도를 측정하는 투표), 50%에 가장 가까운 결과가 가장 높은 오차의 한계를 가질 것입니다. 전형적으로, 전체 투표에 대해 오차의 한계로 보고되는 것은 이 숫자입니다. 투표 \(P\)가 \(p_{a},p_{b},p_{c}\)를 \(71 \%, 27 \%, 2 \%, n=1013\)로 보고한다고 생각해 보십시오:

\(\quad\displaystyle MOE_{95}(P_{a}) = z_{0.95}\sigma_\overline{p_{a}} \approx 1.96\sqrt{\frac{p_{a}(1-p_{a})}{n}} = 0.89/\sqrt{n}=\pm 2.8 \%\) (as in the figure above)

\(\quad\displaystyle MOE_{95}(P_{b}) = z_{0.95}\sigma_\overline{p_{b}} \approx 1.96\sqrt{\frac{p_{b}(1-p_{b})}{n}} = 0.87/\sqrt{n}=\pm 2.7 \%\)

\(\quad\displaystyle MOE_{95}(P_{c}) = z_{0.95}\sigma_\overline{p_{c}} \approx 1.96\sqrt{\frac{p_{c}(1-p_{c})}{n}} = 0.27/\sqrt{n}=\pm 0.8 \%\)

주어진 백분율이 0% 또는 100%의 극단에 접근함에 따라, 그것의 오차의 한계는 ±0%에 접근합니다.

Comparing percentages

여러-선택 투표 \(P\)가 \(p_{a},p_{b},p_{c}\)를 \(46 \%, 42 \%, 12 \%, n=1013\)로 보고한다고 생각해 보십시오. 위에서 설명된 것처럼, 투표에 대해 보고된 오차의 한계는 전형적으로 \(p_{a}\)가 50%에 가장 가까울 때 \(MOE_{95}(P_{a})\)일 것입니다. statistical tie 또는 statistical dead heat의 대중적인 개념은, 어쨌든, 개별 결과의 정확성이 아니라 결과의 순위의 정확성과 자체로 관련이 있습니다. 어느 것이 먼저입니까?

만약, 가설적으로, 우리가 \(n\) 응답자 (\(N\)에서 새로 추출)의 후속 표본에 걸쳐 투표 \(P\)를 실시하고, 결과 \(p_{w} = p_{a} - p_{b}\)를 보고하면, 우리는 차이의 표준 오차를 얼마나 \( p_{w_{1}},p_{w_{2}},p_{w_{3}},\ldots\)이 \( \overline{p_w}\)에 대해 떨어질 것으로 예상되는 것을 이해하기 위해 사용할 수 있습니다. 이를 위해, 우리는 새로운 분산, \( \sigma_{P_{w}}^2\)를 얻기 위해 분산의 합을 적용해야 합니다:

\(\quad\displaystyle  \sigma_{P_{w}}^2=\sigma_{P_{a}- P_{b}}^2 = \sigma_{P_{a}}^2 + \sigma_{P_{b}}^2-2\sigma_{P_{a},P_{b}} = p_{a}(1-p_{a}) + p_{b}(1-p_{b}) + 2p_{a}p_{b}
\)

여기서 \(\sigma_{P_{a},P_{b}} = -P_{a}P_{b}\)는 \(P_{a}\)와 \(P_{b}\)의 공분산(covariance)입니다.

따라서 (단순화 후에),

\(\quad\displaystyle  \text{Standard error of difference} = \sigma_{\overline{w}} \approx \sqrt{\frac{\sigma_{P_{w}}^2}{n}} = \sqrt{\frac{p_{a}+p_{b}-(p_{a}-p_{b})^2}{n}} = 0.029, P_{w}=P_{a}-P_{b}\)

\(\quad\displaystyle  MOE_{95}(P_{a}) = z_{0.95}\sigma_{\overline{p_{a}}} \approx \pm {3.1 \%}\)

\(\quad\displaystyle  MOE_{95}(P_{w}) = z_{0.95}\sigma_{\overline{w}} \approx \pm {5.8 \%}\)

이것은 \(P_{c}\)가 상수에 가깝다, 즉, A 또는 B를 선택하는 응답자는 C를 거의 선택하지 않는다고 가정했음을 주목하십시오 (\(P_{a}\)와 \(P_{b}\)는 완벽하게 음의 상관 관계에 가깝게 만들었습니다). 더 가까운 경쟁에서 셋 이상의 선택이 있을 때, \( \sigma_{P_{w}}^2\)에 대해 올바른 공식 선택이 더 복잡해지게 됩니다.

Effect of finite population size

오차의 한계에 대한 위의 공식은 무한하게 큰 모집단이 있고 따라서 모집단 \(N\)의 크기에 의존하지 않고, 오직 표본 크기 \(n\)에 의존함을 가정합니다. 표본화 이론(sampling theory)에 따르면, 이 가정은 표본화 분수(sampling fraction)가 작을 때 합리적입니다. 특정 표본화 방법에 대해 오차의 한계는 표본화 분수가 작은 한 관심 모집단이 학교, 도시, 주, 또는 국가의 크기인지 여부에 관계없이 본질적으로 같습니다.

표본화 분수가 더 큰 경우 (실제로는 5% 이상)에 대해, 분석가는 훨씬 더 많은 백분율의 모집단을 표본화함으로써 얻어진 추가 정밀도를 설명하기 위해 유한 모집단 보정(finite population correction)을 사용하여 오차의 한계를 조정할 수 있습니다. FPC는 다음 공식을 사용하여 계산될 수 있습니다:

\(\quad\displaystyle \operatorname{FPC} = \sqrt{\frac{N-n}{N-1}}\)

...그리고 따라서 만약 투표 \(P\)가 말하자면 300,000 유권자의 24% 넘게 실시되었다면:

\(\quad\displaystyle MOE_{95}(0.5) = z_{0.95}\sigma_\overline{p} \approx \frac{0.98}{\sqrt{72,000}}=\pm 0.4 \%\)

\(\quad\displaystyle MOE_{95_{FPC}}(0.5) = z_{0.95}\sigma_\overline{p}\sqrt{\frac{N-n}{N-1}}\approx \frac{0.98}{\sqrt{72,000}}\sqrt{\frac{300,000-72,000}{300,000-1}}=\pm 0.3 \%\)

직관적으로, 적절하게 큰 \(N\)에 대해,

\(\quad\displaystyle \lim_{n \to 0} \sqrt{\frac{N-n}{N-1}}\approx 1\)

\(\quad\displaystyle \lim_{n \to N} \sqrt{\frac{N-n}{N-1}} = 0\)

전자의 경우에 대해, \(n\)은 보정이 필요 없을 정도로 작습니다. 후자의 경우에 대해, 투표는 사실상 인구조사가 되고 표본화 오차는 문제가 됩니다.

References

  • Sudman, Seymour and Bradburn, Norman (1982). Asking Questions: A Practical Guide to Questionnaire Design. San Francisco: Jossey Bass. ISBN 0-87589-546-8
  • Wonnacott, T.H.; R.J. Wonnacott (1990). Introductory Statistics (5th ed.). Wiley. ISBN 0-471-61518-8.

External links