확률에서는 표본공간이 상황에 따라 달라지는 것처럼 보일 수 있습니다. 확률은 표본공간의 원소의 중에서 사건의 원소의 몫으로 표현되는데, 사건 자체에 조건이 있으면, 표본공간의 일부만 사용해서 확률을 구합니다.
학급도 오직 남학생, 또는 여학생으로 구성되는 경우가 있고, 남학생과 여학생이 함께 있는 경우도 있습니다.
이런 상황에서, 어떤 사건에 대한 확률이 달라질 수 있습니다. 예를 들어, 학급에서 한 명의 학생을 선택했을 때, 그 학생이 여학생이고 안경을 끼고 있는 학생일 확률은?
이 사건은 곱사건으로써, "학생이 여학생이다"라는 사건 \(A\)와 "안경을 끼고 있다"라는 사건 \(B\)를 동시에 만족해야 합니다.
만약, 남학생만 있는 학급에서는 사건 \(A\)는 공사건이므로, 집합의 연산#집합의 연산에 대한 여러 가지 성질에 의해, 우리의 질문은 \(P(A \cap B)=P(\emptyset)=0\)의 결과를 가집니다.
또한, 여학생만 있는 학급에서는 사건 \(A\)는 표본공간과 같으므로, 집합의 연산#집합의 연산에 대한 여러가지 성질에 의해, 우리의 질문은 \(P(A \cap B)=P(B)\)와 같아집니다.
마지막으로, 남학생과 여학생이 함께 있는 학급에서만, 두 사건의 곱사건이 그대로 유지되어 \(P(A \cap B)\)를 구해야 합니다.
\(\quad\)\(\displaystyle P(A \cap B)=\frac{n(A\cap B)}{n(S)}\)
한편, 질문을 조금 바꾸어서, 학급에서 한 명의 학생을 선택했는데, 그 학생이 여학생이었을 때, 그 학생이 안경을 끼고 있는 학생일 확률은?
보통, 확률은 표본공간에서 얻어질 수 있는 확률을 구하지만, 지금처럼, 문장에 조건이 있을 때에는 더이상 표본공간에서 얻어지는 확률을 구하지 않고, 표본공간 중에 조건에 맞는 일부에서 얻어질 수 있는 확률로 바뀝니다. 이런 사건에 대한 확률을 조건부 확률이라고 말합니다.
만약, 학급이 남학생 또는 여학생으로 이루어져 있는 경우에 대해, 앞의 질문과 같은 결과를 가지는데, 질문의 조건에 완전히 일치하거나, 완전히 일치하지 않은 표본공간으로 구성되어 있기 때문입니다. 아마도 이럴 경우에는 이런 질문 자체를 하지 않겠지요!!
반면에, 남학생과 여학생이 같이 있는 학급에서는 그 결과가 달라집니다. 왜냐하면, 조건에 맞지 않는 학생, 즉 남학생이 선택되면, 실험을 다시 할 것이기 때문입니다.
이것은 곱사건과 완전히 다른 사건이기 때문에, 사건의 확률에 대한 기호 자체가 달라지고, 구하는 방법도, 위에서 소개한 것처럼, 달라집니다.
\(\quad\)\(\displaystyle P(B|A)=\frac{n(A\cap B)}{n(A)}\cdots(1)\)
식 (1)에 왼쪽 변의 기호는 조건에 해당하는 집합이 수직 막대 뒤에 위치하고, 조건 아래에서 원하는 집합은 수직 막대 앞에 위치합니다. 식 (1)의 오른쪽 변은 확률을 구하는 식으로써, 표본공간에서 일부는 무시되므로, 무시되지 않는 원소들의 집합 \(A\)가 분모에 위치하고, 분자는 집합 \(A\) 중에서 \(B\)의 속성을 가진 원소를 뽑을 것인데, 왜냐하면, 실험에서 집합 \(A\)에 해당하지 않는 원소는 무시하고 다시 실험하기 때문입니다.
이 예제처럼, 남학생 15명, 여학생 14명의 학급에서, 여학생 중에서 안경 낀 학생이 5명이면, 첫 번째 질문의 확률은 \(\frac{5}{29}\)인 반면에, 두 번째 질문, 즉 조건부 확률은 \(\frac{5}{14}\)입니다.
조건부확률을 아래와 같이 생각하는 것은, 비록 값이 같아지는 경우가 있을지라도, 오류입니다.
\(\quad\)\(\displaystyle P(B|A) \neq \frac{n(B)}{n(A)}\)
이 경우에서, 사건 \(B\)는 남학생과 여학생을 구별하지 않기 때문에, 여학생이라는 조건에 맞지 않는 원소가 포함될 수 있기 때문입니다. 따라서, 조건을 잘 이해하지 못하면, 조건부확률을 잘못 구하는 경우가 있습니다.
조건에 따라 조건부확률이 달라지기 때문에, 조건부확률을 간편히 구하는 방법은 테이블로 만들어서 접근하는 것입니다. 위의 예제에 대해, 테이블을 만들면,
분류 | 안경 착용 | 안경 미착용 | 합계 |
남학생 | 6 | 9 | 15 |
여학생 | 7 | 7 | 14 |
합계 | 13 | 16 | 29 |
예를 들어,
- 어떤 학생이 남학생이고, 안경을 쓰지 않은 학생일 확률은? 곱사건 확률: \(\frac{9}{29}\)
- 뽑은 학생이 남학생이었을 때, 안경을 쓰지 않은 학생일 확률은? 조건부확률: \(\frac{9}{15}\)
한편, 조건부확률은 원소의 개수를 구할 수 있을 때에는 식 (1)을 사용하는 것이 편하지만, 원소의 개수로 표현하기 힘들 때에는 식 (1)의 분모와 분자를 표본 공간의 개수로 나누어서, 다음과 같이 쓸 수 있습니다.
\(\quad\)\(\displaystyle P(B|A)=\frac{P(A\cap B)}{P(A)}\)
문제에서 확률로 주어진 경우, 이 식을 사용할 수도 있지만, 가능한 위의 테이블로 만들어서 생각하는 것이 쉬울 수 있습니다.
예를 들어, 사건 \(A\)가 발생할 확률이 35%로 주어지면, 전체 인원을 100명으로 두고 \(A\)에 속하는 사람이 35명으로 생각할 수 있습니다.
만약, 분수가 나오면, 예를 들어, 사건 \(A\)가 발생할 확률이 \(\frac{4}{25}\)로 주어지면, 전체를 25명으로 두고, \(A\)에 속하는 사람이 4명이라고 생각할 수도 있고, 전체를 100명으로 두고, \(A\)에 속하는 사람이 16명이라고 생각할 수도 있습니다.
다른 응용
위와 다르게 테이블로 만드는 것이 잘 안 되는 경우가 있습니다.
예를 들어, 아침에 우산을 들고 학교에 갔다가 도서관을 들러, 노래방을 갔다가 집에 왔습니다. 집에 와서 보니 우산을 잃어버린 사실을 알았습니다. 이때, 학교, 도서관, 노래방에서 우산을 잃어버릴 확률이, 각각, \(\frac15, \frac13, \frac12\)이라고 할 때, 도서관에서 우산을 잃어버렸을 확률은?
이 경우에서, 우산을 두 장소에서 동시에 잃어버릴 수는 없으므로, 세 장소에서 우산을 잃어버리는 사건은 서로 사이에 배반 사건입니다. 게다가, 어떤 장소에서 우산을 잃어버렸다는 것은 그전까지 우산을 잃어버리지 않고 가지고 있어야 함을 전제합니다.
따라서, 우산을 잃어버리는 장소는 3곳이 있습니다.
- 학교에서 잃어버림: \(\frac15\)
- 도서관에서 잃어버림: \(\frac45 \times \frac13 \)
- 노래방에서 잃어버림: \(\frac45 \times \frac23 \times \frac12\)
도서관에서 우산을 잃어버리는 경우는 학교에서 우산을 잃어버리지 않고, 도서관에서 잃어버려야 하는 결합 사건입니다. 마찬가지로, 노래방에서는 앞의 두 장소에서 잃어버리지 않고, 여기서 잃어버리는, 세 장소의 결합 사건으로 해석될 수 있습니다.
따라서, 분모는 우산을 잃어버리는 전체의 확률이고, 분자는 그중에서 도서관에서 우산을 잃어버릴 확률로써, 다음과 같이 구해질 수 있습니다:
\(\begin{align}
& \frac{\frac 45 \times \frac 13}{\frac 15 + \left(\frac 45 \times \frac 13\right) + \left(\frac 45 \times \frac 23 \times \frac 12\right)} \\
& = \frac{ 4 \times 2}{ 3 \times 2 + 4 \times 2 + 4 \times 2} \\
& = \frac{4}{11} \\
\end{align}\)
응용예제
응용예제1
상자 속에 다음과 같은 쿠폰이 6장 들어 있습니다:
- "음료수 1병 무료": 3장
- "과자 1개 무료": 2장
- "아이스크림 1개 무료": 1장
이 상자에서 A, B, C 세 사람이 각각 2장씩의 쿠폰을 뽑아서 A, B, C의 순으로 쿠폰의 내용을 확인하려고 합니다. 먼저 A가 두 장의 쿠폰을 뽑아 확인하였더니 뽑은 쿠폰 중에는 "아이스크림 1개 무료"인 쿠폰이 없었을 때, 다음에 남은 4장 중에서 B가 "음료수 1병 무료" 한 장과 "과자 1개 무료" 한 장을 뽑을 확률은 얼마일까요?
응용예제2
어느 고등학교 2학년 전체 학생은 400명이고, 각 학생은 다음 해 선택과목 수업을 위해 수강신청 기간에 \(S\)과목과 \(T\)과목 중 한 과목을 선택하였다. 수강신청 이후 선택과목 변경기간에 과목을 변경한 학생의 수는 전체 학생의 \(\frac14\)이었고, 수강신청 기간에 \(S\)과목을 선택한 학생 중 30%의 학생은 선택과목 변경기간에 \(T\)과목으로 변경하였다.
이 학교 2학년 전체 학생 중 임의로 선택한 1명이 선택과목을 변경한 학생일 때, 이 학생이 \(T\)과목에서 \(S\)과목으로 변경한 학생일 확률은 \(\frac{16}{25}\)이다. 이 학교 2학년 전체 학생 중 수강신청 기간에 \(S\)과목을 선택한 학생의 수는?
응용예제3
\(4\)이상인 자연수 \(n\)에 대하여 \(1\)부터 \(n\)까지 자연수가 하나씩 적힌 \(n\)개의 공이 주머니에 들어있다. 이 주머니에서 현경이와 정모가 순서대로 공을 임의로 한 개씩 꺼내서 큰 수의 공을 꺼낸 사람이 승리하는 게임을 하였다. 현경이가 \(4\)의 배수가 적힌 공을 꺼내서 이겼을 때, 정모가 짝수가 적힌 공을 꺼냈을 확률은 \(\frac{4}{9}\)이다. 가능한 모든 자연수 \(n\)의 값의 합을 구하시오. (단, 꺼낸 공은 다시 집어넣는다.)
응용예제4
\(A\)반과 \(B\)반을 포함한 5개의 반이 그림과 같은 대진표에 따라 시합을 한다. \(A\)반이 우승했을 때, \(A\)반과 \(B\)반이 시합했을 확률은? (단, 각 반이 시합에서 이길 확률은 모두 \(\frac1|2\)이고, 비기거나 기권하는 경우는 없다고 한다.)
응용예제5
어느 회사 직원들의 어느 날의 출근 시간은 평균이 65분, 표준편차가 \(\sigma\)인 정규분포를 따른다고 한다. 이 날 출근시간이 60분 이상 75분 이하인 직원은 전체의 53%이었고, 출근시간이 50분 미만인 직원들 중에서 40%, 50분 이상인 직원들 중에서 10%가 버스를 타고 출근했다고 한다. 이 날 출근한 이 회사 직원들 중 한 사람이 버스를 타고 출근했을 때, 출근시간이 50분 이상 걸렸을 확률을 아래 표준정규분포표를 이용하여 구하면?
\(z\) | \(\rm P\left(0 \le Z \le z\right)\) |
0.5 | 0.19 |
1.0 | 0.34 |
1.5 | 0.42 |
2.0 | 0.48 |