본문 바로가기

취준/FRM part1

FRM part1. Reading 12: Fundamentals of Probability

 

FRM Part I -- Reading 12
확률의 기초
(Fundamentals of Probability)

EXAM FOCUS

핵심 학습 목표

이 Reading은 확률론(Probability Theory)의 기본 언어와 핵심 개념을 다룹니다. 금융 리스크 관리에서 모든 정량적 분석의 출발점이 되는 확률의 기초를 체계적으로 학습하며, 사건(Event)과 사건공간(Event Space)의 정의부터 시작하여, 독립사건(Independent Events)과 상호배타적 사건(Mutually Exclusive Events)의 명확한 구분, 이산형 확률함수(Discrete Probability Function), 조건부확률(Conditional Probability)과 무조건부확률(Unconditional Probability)의 차이, 그리고 베이즈 규칙(Bayes' Rule)을 통한 사전확률의 업데이트까지를 포괄합니다.

시험에서 반드시 알아야 하는 것

  • 조건부확률, 결합확률, 주변확률의 정확한 계산
  • 독립(Independent)배반(Mutually Exclusive)의 차이: 시험에서 가장 자주 혼동을 유도하는 개념
  • 이산형 확률함수에서 특정 사건의 확률 계산
  • 전체확률법칙(Total Probability Rule)을 이용한 무조건부확률 계산
  • 베이즈 규칙을 적용하여 새로운 정보로 사전확률을 사후확률로 업데이트하는 과정
  • 포함-배제 원리(Inclusion-Exclusion)에서 \(P(A \cap B)\)를 빼는 것을 잊지 않는 것

이 Reading은 계산형 문제가 주로 출제됩니다. 공식을 단순히 암기하는 것이 아니라, 문제 상황에서 어떤 확률(결합/조건부/주변)을 구해야 하는지 정확히 식별하고, 적절한 공식을 선택하여 적용할 수 있어야 합니다. 특히 베이즈 규칙 문제에서는 분모에 들어가는 \(P(B)\)를 전체확률법칙으로 계산해야 하는 단계를 놓치지 않도록 주의해야 합니다.


 

 

MODULE 12.1: 확률의 기초 (Basics of Probability)

1. 확률이란 무엇인가? -- 금융에서 확률이 중요한 이유

1.1 확률의 기본 정의

금융 리스크 관리에서 우리가 다루는 거의 모든 변수는 확실하지 않은 미래의 결과입니다. 내일의 주가, 다음 분기의 부도율, 향후 1년간의 금리 경로 -- 이 모든 것은 확률변수(Random Variable)로 표현됩니다. 확률변수란 그 결과(실현값, Realization)가 아직 확정되지 않은 변수를 의미하며, 동전 던지기의 결과나 내일 두바이의 최고 기온처럼 우리가 아직 관측하지 못한 모든 것이 이에 해당합니다.

확률(Probability)은 이러한 불확실한 결과가 실현될 가능성을 0과 1 사이의 숫자로 나타낸 것입니다. 공정한 동전을 던질 때 앞면이 나올 확률은 \(P(\text{heads}) = 0.5\), 즉 50%입니다. 이것은 동전을 100번 던지면 평균적으로 약 50번 앞면이 나올 것이라는 의미이기도 합니다. 여기서 중요한 점은 확률이 장기적 빈도(Long-run Frequency)를 반영한다는 것입니다. 단 한 번의 시행에서는 앞면이 나올 수도, 뒷면이 나올 수도 있지만, 시행 횟수가 충분히 많아지면 앞면의 비율은 0.5에 수렴하게 됩니다.

확률의 기본 공리 (Axioms of Probability)

(1) 모든 사건 A에 대해: \(0 \le P(A) \le 1\)

(2) 확실한 사건(전체 표본공간 S)의 확률: \(P(S) = 1\)

(3) 불가능한 사건(공집합)의 확률: \(P(\emptyset) = 0\)

확률이 0이라는 것은 해당 결과가 절대 일어나지 않음을 의미하고, 확률이 1이라는 것은 해당 결과가 확실히 일어남을 의미합니다. 확률은 0보다 작을 수 없고 1보다 클 수도 없습니다. 이 세 가지 공리는 이후 모든 확률 계산의 기반이 됩니다.

1.2 확률의 세 가지 유형: 주변확률, 조건부확률, 결합확률

확률론에서 가장 기본적이면서도 시험에서 가장 자주 혼동되는 것이 세 가지 확률 유형의 구분입니다. 이 세 가지를 명확히 구분하는 것이 이 Reading 전체를 관통하는 핵심입니다.

확률 유형 표기 의미 금융 예시
주변확률 (Marginal/Unconditional) \(P(A)\) 아무런 추가 정보 없이, A가 일어날 확률 내일 삼성전자 주가가 오를 확률
조건부확률 (Conditional) \(P(A \mid B)\) B가 일어났다는 정보 하에서 A가 일어날 확률 금리가 인하되었다는 조건 하에서 삼성전자 주가가 오를 확률
결합확률 (Joint) \(P(A \cap B)\) A와 B가 동시에 일어날 확률 금리가 인하되고 동시에 삼성전자 주가도 오를 확률

주변확률(Unconditional Probability)은 다른 어떤 정보도 고려하지 않은 상태에서 특정 사건이 발생할 확률입니다. 예를 들어, 시애틀의 하루 최고 기온이 70도에서 80도 사이일 확률이 바로 주변확률입니다. 반면 조건부확률(Conditional Probability)은 특정 조건이 주어진 상태에서의 확률입니다. "오늘 하늘이 흐린 날이라는 조건 하에서" 최고 기온이 70~80도 사이일 확률은 조건부확률입니다. 그리고 결합확률(Joint Probability)은 두 사건이 모두 동시에 발생할 확률입니다.

표기법 주의사항

교재에서 \(P(AB)\)는 \(P(A \cap B)\)와 동일한 의미로 사용됩니다. 또한 \(P(A \cup B)\)는 "A 또는 B(또는 둘 다)"가 일어날 확률을 나타냅니다. 시험에서는 두 표기법이 모두 등장할 수 있으므로 혼동하지 않도록 주의해야 합니다.

2. 사건과 사건공간 (Event and Event Space)

LO 12.a: 사건과 사건공간을 서술할 수 있다.

2.1 사건(Event)의 정의

사건(Event)이란 확률변수가 취할 수 있는 하나의 결과(Single Outcome) 또는 결과들의 조합(Combination of Outcomes)을 의미합니다. 이것은 매우 넓은 정의로, 단일 결과뿐 아니라 여러 결과를 묶은 부분집합(Subset)도 모두 사건에 해당합니다.

공정한 6면 주사위를 한 번 굴리는 상황을 생각해 봅시다. 양의 확률을 가진 결과(실현 가능한 결과)는 정수 1, 2, 3, 4, 5, 6입니다. 이때 다음은 모두 사건에 해당합니다.

사건의 유형 구체적 예시 확률
단일 결과 사건 \(x = 3\) \(P(3) = 1/6 \approx 16.7\%\)
복합 결과 사건 (OR) \(x = 3\) 또는 \(x = 4\) \(P(3 \text{ or } 4) = 2/6 \approx 33.3\%\)
조건 기반 사건 \(x\)가 짝수 \(P(\text{even}) = P(2, 4, 6) = 3/6 = 50\%\)
전체 사건 (확실한 사건) \(x = 1, 2, 3, 4, 5,\) 또는 \(6\) \(P = 6/6 = 100\%\)

여기서 핵심적으로 이해해야 할 점은, 사건이란 반드시 "하나의 숫자"만을 가리키는 것이 아니라는 것입니다. "결과가 2, 3, 4, 5, 6이 아닌 것" 역시 하나의 사건이며, 이 경우 \(x = 1\)에 해당합니다. 심지어 "아무 결과도 나오지 않는 것(공집합)"조차 사건공간의 한 원소입니다.

2.2 사건공간(Event Space)의 정의

사건공간(Event Space)은 어떤 확률변수에 대해 가능한 모든 결과의 부분집합들과 공집합을 포함하는 "사건의 전체 모음"입니다. 이것은 단순히 가능한 결과의 목록이 아니라, 그 결과들로 만들 수 있는 모든 조합까지 포함하는 더 넓은 개념입니다.

공정한 동전 던지기의 사건공간을 예로 들어 봅시다. 가능한 결과는 앞면(H)과 뒷면(T) 두 가지입니다. 이때 사건공간은 다음의 네 가지 원소를 포함합니다.

사건 의미 확률
{H} 앞면이 나온다 50%
{T} 뒷면이 나온다 50%
{H, T} 앞면 또는 뒷면 (즉, 반드시 무언가 나온다) 100%
공집합 앞면도 뒷면도 나오지 않는다 0%

핵심 포인트: 사건 vs 사건공간

사건(Event)은 하나의 결과 또는 결과들의 조합입니다. 사건공간(Event Space)은 가능한 모든 사건의 집합이며, 공집합까지 포함합니다. 시험에서 "다음 중 사건에 해당하는 것은?"이라는 문제가 나오면, 단일 결과, 복합 결과, 심지어 "아무것도 일어나지 않는 경우"까지 모두 사건이라는 점을 기억해야 합니다.

3. 독립사건과 상호배타적 사건 (Independent and Mutually Exclusive Events)

LO 12.b: 독립사건과 상호배타적 사건을 서술할 수 있다.

이 두 개념은 이 Reading에서 가장 중요하면서도 가장 자주 혼동되는 개념입니다. 시험에서는 이 두 개념을 의도적으로 섞어서 오답을 만드는 패턴이 매우 빈번하므로, 정의와 수학적 조건을 명확히 구분해야 합니다.

3.1 독립사건 (Independent Events)

독립(Independent)이란 하나의 사건이 일어났다는 정보가 다른 사건의 확률을 전혀 바꾸지 않는 것을 의미합니다. 직관적으로 말하면, "B가 일어났든 안 일어났든, A의 확률은 똑같다"는 뜻입니다.

동전을 두 번 던지는 상황을 생각해 봅시다. 첫 번째 던지기에서 앞면이 나왔다는 사실은 두 번째 던지기에서 앞면이 나올 확률에 아무런 영향을 주지 않습니다. 두 번째 던지기의 앞면 확률은 여전히 50%입니다. 이때 두 사건은 독립입니다.

독립의 동치 조건 (두 가지 중 하나만 만족하면 독립)

조건 1: \(P(A \cap B) = P(A) \times P(B)\)

조건 2: \(P(A \mid B) = P(A)\)

이 두 조건은 동치(Equivalent)입니다. 하나가 성립하면 다른 하나도 반드시 성립합니다.

조건 1은 "두 사건이 동시에 일어날 확률이 각각의 확률을 곱한 것과 같다"는 의미이고, 조건 2는 "B라는 정보가 추가되어도 A의 확률이 변하지 않는다"는 의미입니다. 이 두 조건은 같은 사실을 서로 다른 각도에서 표현한 것입니다.

독립사건의 곱셈 규칙은 여러 사건으로 확장됩니다. \(A_1, A_2, \ldots, A_n\)이 모두 독립이면, 이들의 결합확률은 단순히 각 확률의 곱입니다.

n개 독립사건의 결합확률

$$P(A_1 \cap A_2 \cap \cdots \cap A_n) = P(A_1) \times P(A_2) \times \cdots \times P(A_n)$$

예를 들어, 공정한 동전을 세 번 연속으로 던져서 모두 앞면이 나올 확률은 \(0.5 \times 0.5 \times 0.5 = 0.125 = 12.5\%\)입니다. 각 던지기가 독립이므로 단순히 곱하면 됩니다.

3.2 상호배타적 사건 (Mutually Exclusive Events)

상호배타(Mutually Exclusive, 배반)두 사건이 동시에 일어날 수 없는 것을 의미합니다. 하나가 일어나면 다른 하나는 절대 일어나지 않습니다.

주사위를 한 번 굴리는 상황에서, "짝수가 나오는 사건"과 "3이 나오는 사건"은 상호배타적입니다. 한 번의 굴림에서 결과가 짝수이면서 동시에 3일 수는 없기 때문입니다.

상호배타의 조건

A와 B가 상호배타이면: \(P(A \cap B) = 0\)

따라서: \(P(A \cup B) = P(A) + P(B)\) (중복이 없으므로 그냥 더하면 됨)

3.3 독립 vs 배반: 결정적 차이

이 두 개념이 왜 그토록 자주 혼동되는지를 이해하려면, 두 개념이 실제로는 거의 정반대에 가까운 관계임을 인식해야 합니다.

비교 항목 독립 (Independent) 배반 / 상호배타 (Mutually Exclusive)
핵심 의미 B의 발생이 A의 확률을 바꾸지 않음 A와 B가 동시에 발생할 수 없음
결합확률 \(P(A \cap B) = P(A) \times P(B) > 0\) (보통) \(P(A \cap B) = 0\) (항상)
조건부확률 \(P(A \mid B) = P(A)\) \(P(A \mid B) = 0\) (B가 일어나면 A는 불가능)
합사건 확률 \(P(A \cup B) = P(A) + P(B) - P(A)P(B)\) \(P(A \cup B) = P(A) + P(B)\)
동시 발생 가능? 가능 (오히려 보통 동시 발생함) 불가능 (절대 동시에 일어나지 않음)
금융 예시 주식A 상승과 동전 앞면 -- 서로 무관 금리 인상과 금리 인하 -- 동시에 불가능

시험 핵심 함정: "독립 = 배반"으로 착각하는 오류

많은 수험생이 "독립"과 "배반"을 비슷한 것으로 착각합니다. 하지만 이 두 개념은 본질적으로 다릅니다. 사실상, \(P(A) > 0\)이고 \(P(B) > 0\)인 두 사건이 배반이면, 이 두 사건은 절대 독립이 될 수 없습니다. 왜냐하면 배반이면 \(P(A \cap B) = 0\)인데, 독립이려면 \(P(A \cap B) = P(A) \times P(B) > 0\)이어야 하기 때문입니다. 즉, (확률이 양수인) 배반사건은 항상 종속(Dependent)입니다. B가 일어나면 A는 불가능해지므로, B의 발생은 A의 확률을 0으로 극적으로 바꾸기 때문입니다.

3.4 합사건(OR)의 확률: 포함-배제 원리

"A 또는 B(또는 둘 다)"가 일어날 확률을 구하는 공식은 확률론에서 가장 기본적이면서도 자주 실수가 발생하는 부분입니다.

포함-배제 공식 (Inclusion-Exclusion Principle)

$$P(A \cup B) = P(A) + P(B) - P(A \cap B)$$

왜 \(P(A \cap B)\)를 빼야 하는지 직관적으로 이해해 봅시다. \(P(A)\)를 계산할 때 "A이면서 동시에 B인 경우"가 이미 포함되어 있고, \(P(B)\)를 계산할 때도 "B이면서 동시에 A인 경우"가 포함되어 있습니다. 따라서 단순히 \(P(A) + P(B)\)를 하면 "둘 다 일어나는 경우"를 두 번 세게 됩니다. 이 중복을 제거하기 위해 \(P(A \cap B)\)를 한 번 빼주는 것입니다.

예를 들어, 주식 A가 내일 오를 확률이 60%, 주식 B가 내일 오를 확률이 55%라고 합시다. "A 또는 B 중 적어도 하나가 오를 확률"을 \(60\% + 55\% = 115\%\)로 계산할 수는 없습니다. 확률이 100%를 초과하기 때문입니다. 반드시 두 주식이 동시에 오를 확률(결합확률)을 빼야 합니다.

만약 A와 B가 상호배타적이면 \(P(A \cap B) = 0\)이므로, 공식은 단순히 \(P(A \cup B) = P(A) + P(B)\)가 됩니다. 이것이 배반사건에서 확률을 그냥 더할 수 있는 이유입니다.

4. 조건부 독립 (Conditionally Independent Events)

LO 12.c: 독립사건과 조건부 독립사건의 차이를 설명할 수 있다.

조건부 독립(Conditional Independence)은 독립의 개념을 한 단계 더 깊이 확장한 것입니다. 두 사건 A와 B가 어떤 제3의 사건 C를 조건으로 고정했을 때 독립이 되는 것을 말합니다.

조건부 독립의 정의

A와 B가 C가 주어졌을 때 조건부 독립이면:

$$P(A \cap B \mid C) = P(A \mid C) \times P(B \mid C)$$

이 개념을 직관적으로 이해하기 위해 교재의 예시를 자세히 살펴봅시다. 초등학교 전체 학생을 대상으로 다음 두 사건을 정의합니다.

  • 사건 A: "시험에서 평균 이상의 점수를 받는다"
  • 사건 B: "키가 평균보다 크다"

초등학생 전체로 보면 A와 B는 독립이 아닐 수 있습니다. 왜냐하면 키가 큰 학생은 나이가 많을 가능성이 높고(고학년), 고학년은 저학년 대비 더 높은 점수를 받을 가능성이 있기 때문입니다. 즉, "키가 크다"는 정보는 간접적으로 "시험 점수가 높다"는 정보를 제공합니다.

하지만 여기에 조건 C = "나이가 8살"을 추가하면 상황이 달라집니다. 같은 8살 학생들 사이에서는, 키의 차이가 학년 차이에서 오는 것이 아니라 단순히 개인차일 뿐이므로, 키와 시험 점수 사이의 관계가 사라질 수 있습니다. 이 경우 A와 B는 C가 주어졌을 때 조건부 독립이 됩니다.

시험 핵심 함정: 독립과 조건부 독립의 관계

다음의 네 가지 조합이 모두 가능합니다. 어느 한쪽이 다른 쪽을 자동으로 보장하지 않습니다.

(무조건) 독립? 조건부 독립? 가능 여부
독립 조건부 독립 가능
독립 조건부 종속 가능
종속 조건부 독립 가능 (위 예시가 바로 이 경우)
종속 조건부 종속 가능

따라서 "독립이면 조건부 독립이다" 또는 "조건부 독립이면 독립이다"라는 진술은 모두 거짓입니다. 시험에서 이 점을 묻는 문제가 자주 출제됩니다.

MODULE QUIZ 12.1

문제 1. 공정한 6면 주사위를 한 번 굴릴 때, 다음 중 사건(Event)으로 분류되는 것은 몇 개인가?

  • 결과가 3이다.
  • 결과가 짝수이다.
  • 결과가 2, 3, 4, 5, 또는 6이 아니다.

A. 1개   B. 2개   C. 3개   D. 0개

정답: C

해설: 세 가지 모두 사건(Event)에 해당합니다. "결과가 3이다"는 단일 결과 사건이고, "결과가 짝수이다"는 {2, 4, 6}이라는 복합 결과 사건입니다. "결과가 2, 3, 4, 5, 또는 6이 아니다"는 \(x = 1\)에 해당하는 사건으로, 이것 역시 유효한 결과이므로 사건입니다. 사건공간의 정의에 따르면, 가능한 결과의 모든 부분집합은 사건에 해당합니다.


문제 2. 다음 등식 중 사건 A와 B가 독립이라는 것을 함의하지 않는 것은?

A. \(P(AB) = P(A) \times P(B)\)   B. \(P(A \text{ or } B) = P(A) + P(B) - P(AB)\)   C. \(P(A \mid B) = P(A)\)   D. \(P(AB) / P(B) = P(A)\)

정답: B

해설: \(P(A \cup B) = P(A) + P(B) - P(AB)\)는 포함-배제 공식이며, 이것은 A와 B가 독립이든 종속이든 항상 성립하는 범용 공식입니다. 따라서 이 등식이 성립한다고 해서 독립을 의미하지는 않습니다. 반면 A, C, D는 모두 독립의 정의 또는 독립에서 도출되는 조건입니다. 특히 D는 \(P(AB)/P(B) = P(A \mid B) = P(A)\)로, 독립의 정의와 동치입니다.


문제 3. 두 독립사건에 대해 올바른 설명은?

A. 반드시 조건부 독립이다.   B. 조건부 독립이 될 수 없다.   C. 조건부 독립일 수도 있고 아닐 수도 있다.   D. 상호배타적일 때만 조건부 독립이다.

정답: C

해설: (무조건) 독립과 조건부 독립은 서로 독립적인 개념입니다. 두 사건이 (무조건) 독립이라고 해서 반드시 조건부 독립이 되는 것도 아니고, 그 반대도 아닙니다. 네 가지 조합이 모두 가능합니다. 따라서 정답은 C입니다.


 

 

MODULE 12.2: 조건부확률, 무조건부확률, 결합확률 (Conditional, Unconditional, and Joint Probabilities)

5. 이산형 확률함수 (Discrete Probability Function)

LO 12.d: 이산형 확률함수에서 사건의 확률을 계산할 수 있다.

이산형 확률함수(Discrete Probability Function)란 확률변수가 취할 수 있는 결과가 유한개이고, 각 결과에 대해 확률을 할당하는 함수를 말합니다. 이 함수를 \(p(x) = P(X = x)\)로 표기하며, "확률변수 X가 특정 값 x를 취할 확률"을 제공합니다.

유효한 확률함수가 되기 위해서는 두 가지 조건을 반드시 만족해야 합니다.

이산형 확률함수의 유효성 조건

(1) 각 결과의 확률은 0 이상: \(p(x) \ge 0\) (모든 가능한 x에 대해)

(2) 모든 가능한 결과의 확률 합은 1: \(\sum_{x} p(x) = 1\)

예제: \(P(x) = x/10\)인 확률함수

확률변수 X의 가능한 결과가 \(x = 1, 2, 3, 4\)이고, 확률함수가 \(P(x) = x/10\)으로 정의된다고 합시다.

\(x\) \(P(x) = x/10\)
1 \(1/10 = 10\%\)
2 \(2/10 = 20\%\)
3 \(3/10 = 30\%\)
4 \(4/10 = 40\%\)
합계 \(10/10 = 100\%\)

모든 확률이 0 이상이고 합이 100%이므로, 유효한 확률함수입니다.

이 함수를 이용한 계산 예시:

  • \(P(X = 3) = 3/10 = 30\%\)
  • \(P(X = 2 \text{ or } X = 4) = 2/10 + 4/10 = 6/10 = 60\%\) (배반사건이므로 단순 합)

시험 빈출 유형: \(P(x) = x/21\)인 주사위 확률함수

6면 주사위에서 \(P(X = x) = x/21\) (\(x = 1, 2, 3, 4, 5, 6\))로 정의된 확률함수를 생각합시다.

먼저 유효성 검증: \(1/21 + 2/21 + 3/21 + 4/21 + 5/21 + 6/21 = 21/21 = 1\) -- 유효합니다.

\(P(X > 4)\)를 구하라:

\(X > 4\)인 결과는 \(x = 5\)와 \(x = 6\)입니다. 이 두 사건은 배반(한 번의 굴림에서 동시에 5이면서 6일 수 없음)이므로:

$$P(X > 4) = P(X = 5) + P(X = 6) = \frac{5}{21} + \frac{6}{21} = \frac{11}{21} \approx 0.5238 = 52.4\%$$

6. 조건부확률과 무조건부확률 (Conditional and Unconditional Probabilities)

LO 12.e: 조건부확률을 정의, 설명, 계산할 수 있다.

LO 12.f: 조건부확률과 무조건부확률을 구분할 수 있다.

6.1 결합확률과 조건부확률의 관계: 가장 중요한 공식

이 Reading에서 가장 핵심적인 관계식은 결합확률과 조건부확률을 연결하는 곱셈 규칙(Multiplication Rule)입니다. 이 공식 하나에서 조건부확률의 정의, 결합확률 계산, 그리고 베이즈 규칙까지 모두 파생됩니다.

곱셈 규칙 (Multiplication Rule)

$$P(A \cap B) = P(A \mid B) \times P(B)$$

동치 표현:

$$P(A \cap B) = P(B \mid A) \times P(A)$$

이 공식의 직관은 명확합니다. "A와 B가 동시에 일어날 확률"은 "먼저 B가 일어나고, 그 조건 하에서 A도 일어날 확률"입니다. 순서를 바꿔도 결과는 같으므로, \(P(A \mid B) \times P(B) = P(B \mid A) \times P(A)\)가 성립합니다.

이 곱셈 규칙을 재배열하면 조건부확률의 정의를 얻습니다.

조건부확률의 정의

$$P(A \mid B) = \frac{P(A \cap B)}{P(B)} \quad \text{(단, } P(B) > 0\text{)}$$

이 공식은 "전체 확률 공간을 B가 일어난 세계로 좁히고, 그 좁혀진 세계 안에서 A가 차지하는 비율"을 계산하는 것입니다. 분모 \(P(B)\)가 "B의 세계"의 크기이고, 분자 \(P(A \cap B)\)가 "B의 세계 안에서 A도 일어나는 부분"의 크기입니다.

6.2 Acme 회사 예시: 교육수준별 소득 분석

교재의 Acme 회사 예시를 통해 세 가지 확률의 관계를 체계적으로 살펴봅시다.

Acme 회사 직원의 교육수준은 세 가지로 분류됩니다. 이 세 범주는 상호배타적(한 직원은 하나의 범주에만 속함)이며 전체포괄적(모든 직원이 반드시 하나의 범주에 속함)입니다.

교육수준 약어 비율 (주변확률) \(P(40+ \mid \text{교육수준})\) (조건부확률)
학위 없음 ND \(P(\text{ND}) = 60\%\) \(P(40+ \mid \text{ND}) = 10\%\)
학사 학위만 BD \(P(\text{BD}) = 30\%\) \(P(40+ \mid \text{BD}) = 70\%\)
학사 이상 학위 HBD \(P(\text{HBD}) = 10\%\) \(P(40+ \mid \text{HBD}) = 100\%\)

여기서 \(P(40+)\)는 연봉 4만 달러 이상을 받는 사건입니다. 각 교육수준별로 4만 달러 이상을 받을 조건부확률이 주어져 있습니다.

Step 1: 결합확률 계산 -- 곱셈 규칙 적용

교육수준 결합확률 계산 결과
ND \(P(40+ \cap \text{ND}) = P(40+ \mid \text{ND}) \times P(\text{ND}) = 10\% \times 60\%\) \(6\%\)
BD \(P(40+ \cap \text{BD}) = P(40+ \mid \text{BD}) \times P(\text{BD}) = 70\% \times 30\%\) \(21\%\)
HBD \(P(40+ \cap \text{HBD}) = P(40+ \mid \text{HBD}) \times P(\text{HBD}) = 100\% \times 10\%\) \(10\%\)

6.3 전체확률법칙 (Total Probability Rule)

전체확률법칙은 조건부확률과 결합확률의 개념을 확장하여, 여러 상호배타적이고 전체포괄적인 조건 하에서의 조건부확률들을 종합하여 무조건부확률(주변확률)을 구하는 공식입니다.

전체확률법칙 (Total Probability Rule)

\(B_1, B_2, \ldots, B_n\)이 상호배타적(Mutually Exclusive)이고 전체포괄적(Exhaustive)이면:

$$P(A) = \sum_{i=1}^{n} P(A \mid B_i) \times P(B_i)$$

이것은 결합확률들의 합과 같습니다: \(P(A) = \sum_{i} P(A \cap B_i)\)

직관적으로, 전체확률법칙은 "A가 일어날 수 있는 모든 경로를 나누어 각각의 확률을 구한 뒤 합산하는 것"입니다. A가 일어나려면 반드시 \(B_1, B_2, \ldots, B_n\) 중 하나의 조건 하에서 일어나야 하므로, 각 경로의 확률을 모두 더하면 A의 전체 확률이 됩니다.

Step 2: 전체확률법칙 적용 -- Acme 예시 계속

$$P(40+) = P(40+ \mid \text{ND}) \times P(\text{ND}) + P(40+ \mid \text{BD}) \times P(\text{BD}) + P(40+ \mid \text{HBD}) \times P(\text{HBD})$$ $$= 6\% + 21\% + 10\% = 37\%$$

즉, Acme 회사 전체 직원 중 37%가 연봉 4만 달러 이상을 받습니다. 이 37%라는 무조건부확률은, 교육수준이라는 조건에 따른 각 경로의 확률을 모두 종합한 결과입니다.

Step 3: 조건부확률 역계산 -- 결합확률에서 조건부확률로

곱셈 규칙을 재배열하면 결합확률과 주변확률로부터 조건부확률을 역으로 계산할 수 있습니다.

$$P(40+ \mid \text{BD}) = \frac{P(40+ \cap \text{BD})}{P(\text{BD})} = \frac{21\%}{30\%} = 70\%$$

이렇게 결합확률을 조건 사건의 주변확률로 나누면 조건부확률을 얻게 됩니다.

7. 베이즈 규칙 (Bayes' Rule)

LO 12.g: 베이즈 규칙을 설명하고 적용할 수 있다.

7.1 베이즈 규칙의 핵심 아이디어: "새로운 정보로 확률을 업데이트하라"

베이즈 규칙은 확률론에서 가장 강력하면서도 실용적인 도구 중 하나입니다. 그 핵심 아이디어는 매우 직관적입니다: 새로운 정보(관측, 데이터)가 들어오면, 기존에 가지고 있던 확률(사전확률, Prior)을 업데이트하여 더 정확한 확률(사후확률, Posterior)을 얻는다는 것입니다.

금융 리스크 관리에서 이것이 왜 중요한지 생각해 봅시다. 어떤 기업의 부도 확률에 대한 사전적 추정치가 있을 때, 해당 기업의 신용등급이 하향 조정되었다는 새로운 정보가 들어오면, 우리는 부도 확률을 상향 조정해야 합니다. 이 과정이 바로 베이즈 업데이트입니다.

7.2 베이즈 규칙의 유도

베이즈 규칙의 유도는 놀라울 정도로 간단합니다. 출발점은 결합확률의 대칭성입니다.

곱셈 규칙에 의해:

$$P(A \cap B) = P(A \mid B) \times P(B)$$ $$P(A \cap B) = P(B \mid A) \times P(A)$$

좌변이 같으므로 우변끼리 등호가 성립합니다:

$$P(A \mid B) \times P(B) = P(B \mid A) \times P(A)$$

양변을 \(P(B)\)로 나누면:

베이즈 규칙 (Bayes' Rule)

$$P(A \mid B) = \frac{P(B \mid A) \times P(A)}{P(B)}$$

여기서:

  • \(P(A)\): 사전확률 (Prior) -- 새로운 정보 B가 들어오기 전의 A의 확률
  • \(P(B \mid A)\): 우도 (Likelihood) -- A가 참일 때 B가 관측될 확률
  • \(P(B)\): 증거 (Evidence) -- B가 관측될 전체 확률 (정규화 상수)
  • \(P(A \mid B)\): 사후확률 (Posterior) -- B를 관측한 후 업데이트된 A의 확률

분모 \(P(B)\)는 보통 직접 주어지지 않고, 전체확률법칙을 이용하여 계산해야 합니다:

$$P(B) = P(B \mid A) \times P(A) + P(B \mid A^c) \times P(A^c)$$

이 단계가 베이즈 문제에서 수험생이 가장 자주 놓치는 부분입니다. 분모를 단순히 \(P(B \mid A)\)와 혼동하면 안 됩니다. 분모는 반드시 "B가 일어날 수 있는 모든 경로의 확률 합"이어야 합니다.

7.3 예제 1: 경제 상태와 주식 수익률

예제: 베이즈 규칙을 이용한 경제 상태 추론

주어진 정보:

  • 경제가 호조(Outperform)일 확률: \(P(A) = 0.60\)
  • 경제가 부진(Underperform)일 확률: \(P(A^c) = 0.40\)
  • 경제 호조 시 주식 상승 확률: \(P(B \mid A) = 0.70\)
  • 경제 호조 시 주식 하락 확률: \(P(B^c \mid A) = 0.30\)
  • 경제 부진 시 주식 상승 확률: \(P(B \mid A^c) = 0.20\)
  • 경제 부진 시 주식 하락 확률: \(P(B^c \mid A^c) = 0.80\)

문제: 주식이 상승했다(B)는 정보가 주어졌을 때, 경제가 호조였을 확률 \(P(A \mid B)\)를 구하라.

풀이: 확률트리(Probability Tree)를 이용한 체계적 접근

Step 1: 각 경로(말단)의 결합확률을 구합니다.

경로 결합확률 계산 결과
경제 호조 + 주식 상승 \(P(A) \times P(B \mid A) = 0.60 \times 0.70\) \(0.42\)
경제 호조 + 주식 하락 \(P(A) \times P(B^c \mid A) = 0.60 \times 0.30\) \(0.18\)
경제 부진 + 주식 상승 \(P(A^c) \times P(B \mid A^c) = 0.40 \times 0.20\) \(0.08\)
경제 부진 + 주식 하락 \(P(A^c) \times P(B^c \mid A^c) = 0.40 \times 0.80\) \(0.32\)
합계   1.00 (검증 완료)

Step 2: 전체확률법칙으로 \(P(B)\)를 구합니다. "주식이 상승하는" 모든 경로를 합산합니다.

$$P(B) = P(B \mid A) \times P(A) + P(B \mid A^c) \times P(A^c) = 0.42 + 0.08 = 0.50$$

Step 3: 베이즈 규칙을 적용합니다.

$$P(A \mid B) = \frac{P(B \mid A) \times P(A)}{P(B)} = \frac{0.42}{0.50} = 0.84$$

해석: 아무 정보가 없을 때 경제 호조 확률은 60%였습니다(사전확률). 그런데 "주식이 올랐다"는 정보가 들어오자, 경제 호조 확률이 60%에서 84%로 상향 조정되었습니다(사후확률). 이것이 베이즈 업데이트의 본질입니다. 주식 상승은 경제 호조와 더 강하게 연관되어 있기 때문에(\(P(B \mid A) = 0.70\) vs \(P(B \mid A^c) = 0.20\)), 주식 상승이라는 관측은 경제 호조 가설을 강하게 지지합니다.

7.4 예제 2: 자동차 색상과 운전자 보조 기술 -- 종합 예제

종합 예제: 모든 확률 개념을 하나의 문제에서 적용

1,000대의 자동차가 주차장에 있습니다.

  • 파란차(B): 600대, 이 중 150대에 운전자 보조 기술(DA) 장착
  • 빨간차(R): 400대, 이 중 200대에 운전자 보조 기술(DA) 장착

이 정보를 2x2 분할표(Contingency Table)로 정리하면 다음과 같습니다.

  DA 장착 DA 미장착 합계
파란차 (B) 150 450 600
빨간차 (R) 200 200 400
합계 350 650 1,000

(1) 주변확률 (Unconditional Probabilities):

$$P(B) = \frac{600}{1{,}000} = 0.60 = 60\%, \quad P(R) = \frac{400}{1{,}000} = 0.40 = 40\%$$

(2) 조건부확률 (Conditional Probabilities):

"파란차라는 조건 하에서" DA가 장착되어 있을 확률과, "빨간차라는 조건 하에서" DA가 장착되어 있을 확률을 각각 구합니다.

$$P(DA \mid B) = \frac{150}{600} = 0.25 = 25\%, \quad P(DA \mid R) = \frac{200}{400} = 0.50 = 50\%$$

빨간차가 DA를 장착할 확률이 파란차보다 두 배 높습니다. 즉, 색상은 DA 장착 여부에 대한 정보를 제공합니다 -- 두 사건은 독립이 아닙니다.

(3) 결합확률 (Joint Probabilities):

곱셈 규칙을 적용합니다.

$$P(B \cap DA) = P(DA \mid B) \times P(B) = 0.25 \times 0.60 = 0.15 = 15\%$$ $$P(R \cap DA) = P(DA \mid R) \times P(R) = 0.50 \times 0.40 = 0.20 = 20\%$$

검증: 분할표에서 직접 확인하면 \(150/1000 = 0.15\), \(200/1000 = 0.20\)으로 일치합니다.

(4) 전체확률법칙 (Total Probability Rule):

DA가 장착될 전체 확률을 구합니다. 색상(B와 R)은 상호배타적이고 전체포괄적이므로:

$$P(DA) = P(DA \mid B) \times P(B) + P(DA \mid R) \times P(R) = 0.15 + 0.20 = 0.35 = 35\%$$

검증: 분할표에서 DA 장착 합계 350대 / 1,000대 = 35%로 일치합니다.

(5) 베이즈 규칙 (Bayes' Rule):

"DA가 장착된 차를 무작위로 뽑았을 때, 그 차가 파란차일 확률"을 구합니다. 이것은 \(P(B \mid DA)\)입니다.

$$P(B \mid DA) = \frac{P(B \cap DA)}{P(DA)} = \frac{0.15}{0.35} = \frac{15}{35} = \frac{3}{7} \approx 0.4286 = 42.9\%$$

해석: 아무 정보가 없을 때 무작위로 뽑은 차가 파란차일 확률은 60%였습니다. 그런데 "DA가 장착되어 있다"는 정보가 주어지자, 파란차일 확률이 60%에서 42.9%로 하향 조정되었습니다. 왜냐하면 빨간차가 DA를 더 많이 장착하고 있으므로, DA 장착이라는 정보는 오히려 빨간차 쪽을 더 지지하기 때문입니다. 분할표에서 직접 확인하면, DA 장착 350대 중 파란차는 150대이므로 \(150/350 \approx 42.9\%\)로 일치합니다.

7.5 독립성 판별: 컨버터블 예시

독립성 판별 추가 예시

위 예시에 추가 정보가 주어집니다: 파란차 600대 중 40%(240대)가 컨버터블이고, 빨간차 400대 중에서도 40%(160대)가 컨버터블입니다. 따라서 전체 1,000대 중 400대가 컨버터블입니다.

이 경우 색상과 컨버터블 여부가 독립인지 확인해 봅시다.

$$P(B \mid C) = \frac{240}{400} = 0.60 = P(B)$$ $$P(R \mid C) = \frac{160}{400} = 0.40 = P(R)$$

\(P(B \mid C) = P(B)\)이고 \(P(R \mid C) = P(R)\)이므로, 독립의 조건을 만족합니다. "컨버터블이다"라는 정보는 차가 파란색인지 빨간색인지에 대해 아무런 추가 정보를 제공하지 않습니다. 색상 비율이 컨버터블이든 아니든 동일하기 때문입니다.

이것을 앞서의 DA 예시와 비교하면, DA의 경우 \(P(B \mid DA) = 42.9\% \neq 60\% = P(B)\)였으므로 색상과 DA는 종속(Dependent)이었습니다. 같은 데이터셋에서도 어떤 변수 쌍은 독립이고 어떤 변수 쌍은 종속일 수 있다는 것을 보여주는 좋은 예시입니다.

MODULE QUIZ 12.2

문제 1. 6면 주사위의 확률함수가 \(P(X = x) = x/21\)로 주어질 때, \(P(X > 4)\)는 얼마인가?

A. 16.6%   B. 23.8%   C. 33.3%   D. 52.4%

정답: D

해설: \(X > 4\)인 결과는 5와 6입니다. 이 두 결과는 상호배타적이므로:

$$P(X > 4) = P(X = 5) + P(X = 6) = \frac{5}{21} + \frac{6}{21} = \frac{11}{21} \approx 0.524 = 52.4\%$$

문제 2. 사건 A와 B가 모두 발생할 확률(결합확률)과, B가 주어졌을 때 A의 조건부확률 사이의 관계는?

A. \(P(AB) = P(A \mid B) \times P(B)\)   B. \(P(AB) = P(A \mid B) / P(B)\)   C. \(P(AB) = P(B \mid A) / P(A)\)   D. \(P(AB) = P(A \mid B) \times P(A)\)

정답: A

해설: 이것은 곱셈 규칙의 정의 그 자체입니다. "A와 B가 동시에 일어날 확률"은 "B가 일어날 확률"에 "B가 주어졌을 때 A가 일어날 조건부확률"을 곱한 것입니다. 이 관계식은 확률론의 가장 기본적인 관계식이며, 조건부확률의 정의와 동치입니다. B, C는 나눗셈이 아닌 곱셈이어야 하고, D는 \(P(A)\)가 아닌 \(P(B)\)가 곱해져야 합니다.


문제 3. Acme 주식이 다음 달 상승할 확률이 50%이고, Acme와 Best 주식이 모두 상승할 확률이 40%이다. Acme 주식이 상승했을 때 Best 주식이 상승할 확률은?

A. 20%   B. 40%   C. 80%   D. 90%

정답: C

해설: 이 문제는 결합확률과 주변확률이 주어졌을 때 조건부확률을 역산하는 문제입니다. 베이즈/곱셈 규칙을 적용합니다.

주어진 정보: \(P(\text{Acme 상승}) = 0.50\), \(P(\text{Acme 상승} \cap \text{Best 상승}) = 0.40\)

$$P(\text{Best 상승} \mid \text{Acme 상승}) = \frac{P(\text{Acme 상승} \cap \text{Best 상승})}{P(\text{Acme 상승})} = \frac{0.40}{0.50} = 0.80 = 80\%$$

Acme가 상승했다는 조건 하에서 Best도 상승할 확률은 80%입니다. 두 주식 사이에 상당한 양의 상관관계가 있음을 시사합니다.


 

 

KEY CONCEPTS -- 핵심 개념 정리

LO 12.a: 사건과 사건공간

사건(Event)은 확률변수의 가능한 결과 중 하나 또는 결과들의 조합(부분집합)입니다. 동전 던지기에서 "앞면"은 단일 결과 사건이고, 주사위에서 "짝수"는 {2, 4, 6}이라는 복합 결과 사건입니다. 사건공간(Event Space)은 가능한 모든 결과의 모든 부분집합과 공집합(아무 결과도 일어나지 않는 경우)을 포함하는 전체 집합입니다. 동전의 사건공간은 {H}, {T}, {H, T}, 공집합의 네 원소로 구성됩니다.

LO 12.b: 독립사건과 상호배타적 사건

두 사건이 독립(Independent)이면 다음 두 조건 중 하나(따라서 둘 다)가 성립합니다: (1) \(P(A \cap B) = P(A) \times P(B)\), (2) \(P(A \mid B) = P(A)\). 독립이란 한 사건의 발생이 다른 사건의 확률에 영향을 주지 않는다는 뜻입니다. 두 사건이 상호배타적(Mutually Exclusive)이면 \(P(A \cap B) = 0\)이며, 이때 \(P(A \cup B) = P(A) + P(B)\)입니다. 확률이 양수인 두 배반사건은 항상 종속(Dependent)입니다.

LO 12.c: 조건부 독립

두 사건이 제3의 사건 C를 조건으로 독립이면 조건부 독립(Conditionally Independent)이라 합니다. 즉 \(P(A \cap B \mid C) = P(A \mid C) \times P(B \mid C)\)입니다. (무조건) 독립과 조건부 독립은 서로 독립적인 개념이며, 한쪽이 성립한다고 다른 쪽이 반드시 성립하지 않습니다. 네 가지 조합(독립+조건부독립, 독립+조건부종속, 종속+조건부독립, 종속+조건부종속)이 모두 가능합니다.

LO 12.d: 이산형 확률함수

이산형 확률함수(Discrete Probability Function)는 유한개의 가능한 결과 각각에 대해 확률을 할당하는 함수입니다. 유효하려면 (1) 모든 확률이 0 이상이고 (2) 확률의 합이 1이어야 합니다. 예: \(P(x) = x/25\) (\(x = 1, 2, 3, 4, 5\)).

LO 12.e: 조건부확률의 정의와 계산

두 사건의 결합확률(Joint Probability)은 \(P(A \cap B) = P(A \mid B) \times P(B)\)로 계산됩니다. 이를 재배열하면 조건부확률은 \(P(A \mid B) = P(A \cap B) / P(B)\)입니다.

LO 12.f: 조건부확률 vs 무조건부확률

무조건부확률(Unconditional/Marginal Probability)은 추가 정보 없이 사건이 발생할 확률이고, 조건부확률(Conditional Probability)은 다른 사건이 발생했다는 조건 하에서의 확률입니다. 전체확률법칙에 의해, 상호배타적이고 전체포괄적인 조건 사건들에 대해 \(P(A) = \sum_i P(A \mid B_i) \times P(B_i)\)로 무조건부확률을 구할 수 있습니다.

LO 12.g: 베이즈 규칙

베이즈 규칙은 \(P(A \mid B) = P(B \mid A) \times P(A) / P(B)\)로, 새로운 관측(B)이 주어졌을 때 사전확률 \(P(A)\)를 사후확률 \(P(A \mid B)\)로 업데이트합니다. 분자의 \(P(B \mid A) \times P(A)\)는 결합확률 \(P(A \cap B)\)이며, 분모 \(P(B)\)는 전체확률법칙으로 계산합니다.


 

 

시험 함정 패턴 (Exam Trap Patterns)

함정 유형 오답 패턴 (틀리는 방향) 올바른 방향
독립 = 배반 혼동 "독립이면 결합확률이 0이다" / "배반이면 \(P(AB) = P(A)P(B)\)이다" 독립이면 \(P(AB) = P(A)P(B) > 0\), 배반이면 \(P(AB) = 0\). 완전히 다른 개념
포함-배제 누락 \(P(A \cup B) = P(A) + P(B)\)로 계산 반드시 \(P(A \cup B) = P(A) + P(B) - P(A \cap B)\). 배반일 때만 빼는 항이 0
베이즈 분모 착각 \(P(A \mid B) = P(B \mid A) \times P(A) / P(B \mid A)\)처럼 분모를 잘못 설정 분모 \(P(B)\)는 전체확률법칙으로 계산: \(P(B) = \sum_i P(B \mid A_i)P(A_i)\)
조건부독립 방향 "독립이면 당연히 조건부 독립이다" (또는 그 역) 독립과 조건부 독립은 상호 독립적. 네 가지 조합 모두 가능
곱셈 규칙 방향 \(P(AB) = P(A \mid B) \times P(A)\)로 잘못 적용 \(P(AB) = P(A \mid B) \times P(B)\) -- 조건부확률에 곱하는 것은 조건 사건의 주변확률
확률함수 유효성 확률의 합이 1인지 확인하지 않고 바로 계산 항상 먼저 \(\sum p(x) = 1\)인지 검증한 후 계산

 

 

핵심 공식 일람표 (Formula Summary)

공식 이름 수식 적용 조건 / 비고
곱셈 규칙 \(P(A \cap B) = P(A \mid B) \times P(B)\) 항상 성립. 조건부확률의 정의와 동치
조건부확률 정의 \(P(A \mid B) = P(A \cap B) / P(B)\) \(P(B) > 0\)일 때
포함-배제 원리 \(P(A \cup B) = P(A) + P(B) - P(A \cap B)\) 항상 성립. 배반이면 마지막 항 = 0
독립 조건 1 \(P(A \cap B) = P(A) \times P(B)\) 독립의 필요충분조건
독립 조건 2 \(P(A \mid B) = P(A)\) 위 조건과 동치
배반 조건 \(P(A \cap B) = 0\) 동시 발생 불가
전체확률법칙 \(P(A) = \sum_i P(A \mid B_i) \times P(B_i)\) \(B_i\)가 상호배타 + 전체포괄
베이즈 규칙 \(P(A \mid B) = \frac{P(B \mid A) \times P(A)}{P(B)}\) 분모는 전체확률법칙으로 계산
조건부 독립 \(P(A \cap B \mid C) = P(A \mid C) \times P(B \mid C)\) (무조건) 독립과 별개의 개념
n개 독립사건 결합 \(P(A_1 \cap \cdots \cap A_n) = \prod_i P(A_i)\) 모든 사건이 상호 독립일 때

 

 

한 줄 암기 체크리스트

번호 핵심 암기 포인트
1 확률은 항상 0 이상 1 이하
2 사건(Event)은 단일 결과뿐 아니라 결과들의 조합도 포함
3 사건공간(Event Space)은 모든 부분집합 + 공집합
4 독립: \(P(A \mid B) = P(A)\) -- B의 정보가 A의 확률을 바꾸지 않음
5 독립: \(P(A \cap B) = P(A) \times P(B)\) -- 결합확률이 곱
6 배반(상호배타): \(P(A \cap B) = 0\) -- 동시 발생 불가능
7 확률이 양수인 배반사건은 절대 독립이 아님 (반드시 종속)
8 합사건: 반드시 중복 제거 -- \(P(A \cup B) = P(A) + P(B) - P(A \cap B)\)
9 독립과 조건부 독립은 서로 독립적인 개념 (네 가지 조합 모두 가능)
10 확률함수 유효성: 모든 \(p(x) \ge 0\)이고 \(\sum p(x) = 1\)
11 곱셈 규칙: \(P(AB) = P(A \mid B) \times P(B)\) -- 조건사건의 주변확률을 곱함
12 전체확률법칙: 모든 경로의 결합확률을 합산하여 주변확률 도출
13 베이즈 분모 \(P(B)\)는 직접 주어지지 않으면 전체확률법칙으로 계산
14 베이즈 = 사전확률을 새로운 정보로 업데이트하여 사후확률을 얻는 과정
15 포함-배제에서 \(-P(A \cap B)\)를 빼는 것을 절대 잊지 말 것