본문 바로가기

취준/FRM part1

FRM part1. Reading 15: Multivariate Random Variables

 

FRM Part I - Reading 15
Multivariate Random Variables (다변량 확률변수)

EXAM FOCUS

핵심 학습 목표

이 Reading은 다변량(Multivariate) 확률변수의 의존성(Dependency)을 다룹니다. 핵심 목표는 이변량(Bivariate) 확률변수의 평균과 분산을 설명하고 계산할 수 있는 능력을 갖추는 것입니다. 구성요소 간의 의존성이 핵심이며, 공분산(Covariance)상관계수(Correlation)의 계산을 반드시 이해해야 합니다. 주변분포(Marginal Distribution)조건부분포(Conditional Distribution)는 이변량 분포를 변환하여 금융 및 리스크 관리에 대한 추가적인 통찰을 제공합니다. 이들 분포를 사용하여 조건부기대값(Conditional Expectation)과 조건부 적률(Conditional Moments)을 계산할 수 있어야 합니다.

시험에서 반드시 할 수 있어야 하는 것

  • 확률행렬(Probability Matrix)에서 주변 PMF와 조건부 PMF를 도출
  • 이변량 확률함수 \(g(X_1, X_2)\)의 기대값 계산
  • 공분산상관계수의 계산 및 해석 (특히 \(\rho = 0\)이어도 독립이 아닐 수 있음)
  • 선형변환이 공분산과 상관계수에 미치는 4가지 효과
  • 2자산 포트폴리오 분산 공식 (가중합의 분산)
  • 조건부기대값 계산 (특정 이벤트 발생 시의 기대수익률)
  • i.i.d. 확률변수 합/평균의 기대값과 분산 성질

MODULE 15.1: 이변량 분포의 주변분포와 조건부분포

LO 15.a: 확률행렬(Probability Matrix)을 사용한 확률질량함수 표현

1. 다변량 확률변수의 개념

확률변수(Random Variable)는 불확실한 양 또는 수치입니다. 다변량 확률변수(Multivariate Random Variables)는 확률변수들의 벡터(Vector)이며, 여기서 벡터는 \(n\)개의 확률변수로 구성된 차원입니다. 따라서 다변량 확률변수의 연구는 두 개 이상의 확률변수 간 의존성(Dependency) 측정을 포함합니다.

이 Reading에서는 \(n\)차원 다항분포(Multinomial Distribution)의 특수한 경우인 이변량 확률변수(Bivariate Random Variables)를 다룹니다. 이변량 확률변수 \(\mathbf{X}\)는 두 개의 구성요소를 가진 벡터입니다: \(\mathbf{X} = (X_1, X_2)\). 금융에서 \(X_1\)은 수익률, \(X_2\)는 시장 상태(이벤트)를 나타내는 식으로, 두 변수의 결합(Joint) 행동을 분석합니다.

2. 결합 확률질량함수(Joint PMF)와 확률행렬

이변량 확률변수에 대한 확률질량함수(PMF, Probability Mass Function)는 두 확률변수가 각각 특정 값을 취할 확률을 서술합니다:

$$p_{X_1, X_2}(x_1, x_2) = P(X_1 = x_1, \; X_2 = x_2)$$

확률행렬(Probability Matrix)은 이 결합 PMF를 표 형태로 정리한 것입니다. 행(Row)과 열(Column)의 좌표 \((x_1, x_2)\)에 따라 결합확률을 배치합니다. 확률행렬은 유한한 값의 집합(Finite Set) 위에 정의된 이산분포 간의 관계를 서술하는 데 사용됩니다.

확률행렬의 필수 성질:

1. 확률행렬은 좌표 \(x_1\)과 \(x_2\)의 함수로서 결과 확률을 서술합니다.
2. 모든 확률은 양수이거나 0이며, 1 이하입니다: \(0 \leq p(x_1, x_2) \leq 1\)
3. \(X_1\)과 \(X_2\)의 모든 가능한 결과에 대한 확률의 총합은 1입니다: \(\sum_{x_1}\sum_{x_2} p(x_1, x_2) = 1\)

3. 삼항분포(Trinomial Distribution) 응용

이산 이변량 확률변수의 가장 일반적인 응용은 삼항분포(Trinomial Distribution)입니다. 이 유형에서는 \(n\)개의 독립 시행이 있고, 각 시행은 세 가지 이산적 결과 중 하나를 가집니다. 삼항분포는 세 개의 모수를 가집니다: 시행 횟수(\(n\)), 결과 1의 관측 확률(\(p_1\)), 결과 2의 관측 확률(\(p_2\)). 각 결과가 발생할 모든 확률의 합은 반드시 100%여야 하므로:

$$p_3 = 1 - p_1 - p_2$$

금융에서의 직관으로, 확률행렬은 "시나리오(행: 이벤트/상태) x 결과(열: 수익률/손익)"의 결합 시나리오 테이블입니다. 예를 들어, 실적발표(좋음/중립/나쁨)과 월간 수익률(-3%/0%/+3%)의 조합을 나타냅니다.

예제: 확률행렬 적용

문제: 어떤 회사의 보통주 수익률이 실적발표(Earnings Announcement)와 관련되어 있다고 가정합시다. 실적발표는 긍정(1), 중립(0), 부정(-1)의 세 가지이며, 월간 주식 수익률은 -3%, 0%, +3% 중 하나입니다. 애널리스트가 다음과 같은 확률행렬을 추정했습니다. 부정적 실적발표의 확률을 구하시오.

\(X_2\) (실적발표) \(\backslash\) \(X_1\) (수익률) \(X_1 = -3\%\) \(X_1 = 0\%\) \(X_1 = +3\%\)
\(X_2 = -1\) (부정) 0.25 0.15 0.00
\(X_2 = 0\) (중립) 0.05 0.10 0.15
\(X_2 = +1\) (긍정) 0.00 0.05 0.25

풀이: 확률행렬의 첫 번째 행에 있는 모든 확률을 더하면 부정적 발표의 확률이 됩니다:

$$P(X_2 = -1) = 0.25 + 0.15 + 0.00 = 0.40 \quad (40\%)$$

또한 이 행에서 각 셀의 의미를 해석하면: 부정적 발표이면서 -3% 수익률일 확률 25%, 부정적 발표이면서 0% 수익률일 확률 15%, 부정적 발표이면서 +3% 수익률일 확률 0%입니다.


LO 15.b: 이산 이변량 확률변수의 주변분포와 조건부분포 계산

1. 주변분포(Marginal Distribution)

주변분포(Marginal Distribution)는 이변량 확률변수의 단일 구성요소의 분포(즉, 일변량 확률변수)를 정의합니다. "다른 변수를 무시하고 한 변수만의 분포를 보면?"에 해당하는 개념입니다. 예를 들어, "실적발표 상태를 무시하고 수익률만 보면?" 또는 "수익률을 무시하고 실적발표 상태만 보면?"이 주변분포입니다.

주변 PMF 공식:

$$p_{X_1}(x_1) = \sum_{x_2} p_{X_1, X_2}(x_1, x_2)$$ $$p_{X_2}(x_2) = \sum_{x_1} p_{X_1, X_2}(x_1, x_2)$$

즉, 확률행렬에서 열(Column)을 따라 합산하면 행 변수(\(X_2\))의 주변분포가 되고, 행(Row)을 따라 합산하면 열 변수(\(X_1\))의 주변분포가 됩니다.

예제: 주변분포 계산

문제: 위의 확률행렬을 사용하여 월간 수익률 \(X_1\)의 주변 PMF를 모두 구하시오.

풀이: 각 열(수익률)을 따라 모든 행(실적발표 상태)의 확률을 합산합니다:

$$p_{X_1}(-3\%) = 0.25 + 0.05 + 0.00 = 0.30$$ $$p_{X_1}(0\%) = 0.15 + 0.10 + 0.05 = 0.30$$ $$p_{X_1}(+3\%) = 0.00 + 0.15 + 0.25 = 0.40$$
\(X_2 \backslash X_1\) \(-3\%\) \(0\%\) \(+3\%\) 행합 (주변 \(p_{X_2}\))
-1 (부정) 0.25 0.15 0.00 0.40
0 (중립) 0.05 0.10 0.15 0.30
+1 (긍정) 0.00 0.05 0.25 0.30
열합 (주변 \(p_{X_1}\)) 0.30 0.30 0.40 1.00

검증: \(X_1\)의 주변확률 합: \(0.30 + 0.30 + 0.40 = 1.00\). \(X_2\)의 주변확률 합: \(0.40 + 0.30 + 0.30 = 1.00\). 두 주변분포 모두 합이 1이 되어 올바른 확률분포임을 확인할 수 있습니다.

2. 조건부분포(Conditional Distribution)

조건부분포(Conditional Distribution)는 다른 구성요소가 특정 값일 때를 조건으로 하여, 각 구성요소의 결과 확률을 합산합니다. "특정 상태가 발생했을 때, 수익률 분포가 어떻게 바뀌는가?"를 보여줍니다. 이는 조건부기대수익률, 조건부 분산(스트레스 상황 변동성) 같은 리스크 요약치로 이어지며, 포트폴리오 리스크 관리에서 핵심적인 역할을 합니다.

조건부 PMF 공식:

$$p_{X_1 | X_2}(x_1 | x_2) = \frac{p_{X_1, X_2}(x_1, x_2)}{p_{X_2}(x_2)}$$

분자(Numerator)는 두 사건이 동시에 발생하는 결합확률(Joint Probability)이고, 분모(Denominator)는 조건으로 주어진 변수 \(X_2 = x_2\)의 주변확률(Marginal Probability)입니다.

이 공식의 구조는 본질적으로 "조건부확률 = 결합확률 / 주변확률"이라는 베이즈(Bayes) 정리의 기본 형태와 동일합니다. 확률행렬에서 조건부분포를 구하려면, 해당 행(또는 열)의 각 원소를 그 행(또는 열)의 합(= 주변확률)으로 나누면 됩니다.

예제: 조건부분포 계산

문제: 부정적 실적발표(\(X_2 = -1\))가 있을 때, 월간 수익률의 조건부분포를 구하시오.

풀이: 부정적 발표(\(X_2 = -1\))일 때, 확률행렬 첫 번째 행의 결합확률은 -3%에 대해 25%, 0%에 대해 15%, +3%에 대해 0%입니다. 이 결합확률들을 부정적 발표의 주변확률 40%로 나눕니다:

$$P(X_1 = -3\% \,|\, X_2 = -1) = \frac{0.25}{0.40} = 0.625$$ $$P(X_1 = 0\% \,|\, X_2 = -1) = \frac{0.15}{0.40} = 0.375$$ $$P(X_1 = +3\% \,|\, X_2 = -1) = \frac{0.00}{0.40} = 0.000$$

해석: 부정적 뉴스가 발표되면, -3% 수익률이 발생할 확률이 62.5%로 압도적이고, +3% 수익률은 불가능합니다. 이처럼 조건이 바뀌면 수익률의 확률분포 자체가 근본적으로 달라집니다. 이것이 바로 조건부분포가 리스크 관리에서 중요한 이유입니다.

흔한 함정 1: 조건부확률에서 '나누기'를 빠뜨림
\(p(x_1 | x_2)\)는 행(또는 열)의 원소를 그대로 쓰는 것이 아니라, 반드시 주변확률로 나누어 정규화(Normalize)해야 합니다. 확률행렬에서 한 행의 원소들의 합은 1이 아닐 수 있지만(예: 0.25 + 0.15 + 0.00 = 0.40), 조건부확률로 변환하면 합이 반드시 1이 됩니다(0.625 + 0.375 + 0.000 = 1.000).

흔한 함정 2: 주변분포 합 방향 실수
"행 합 = 행 변수의 주변확률"인지, "열 합 = 열 변수의 주변확률"인지는 표를 어떻게 정의했는지에 따라 달라집니다. 시험에서는 반드시 축 라벨(Axis Label) 확인이 핵심입니다.

Module Quiz 15.1

헤지펀드 매니저가 주식의 수익률이 애널리스트 레이팅 변화(부정, 중립, 긍정)에 따라 -6%, 0%, 6% 중 하나를 가질 것으로 예상합니다. 다음 이변량 확률행렬을 참고하시오.

\(X_2\) (레이팅) \(\backslash\) \(X_1\) (수익률) \(-6\%\) \(0\%\) \(+6\%\)
-1 (부정) 0.30 0.10 0.00
0 (중립) 0.00 0.15 0.15
+1 (긍정) 0.00 0.05 0.25

Q1. 주식이 긍정적 애널리스트 레이팅을 가질 주변확률은?

A. 10%   B. 15%   C. 25%   D. 30%

Q2. 애널리스트 레이팅이 긍정적일 때, 세 가지 월간 수익률의 조건부확률은?

A. P(-6%) = 0, P(0%) = 1/6, P(6%) = 5/6
B. P(-6%) = 0, P(0%) = 1/3, P(6%) = 2/3
C. P(-6%) = 0, P(0%) = 5/30, P(6%) = 25/30
D. P(-6%) = 0.05, P(0%) = 0.10, P(6%) = 0.25


MODULE 15.2: 이변량 확률분포의 적률 (Moments of Bivariate Random Distributions)

LO 15.c: 이변량 이산 확률변수에 대한 함수의 기대값 계산

이변량 이산 확률변수의 제1적률(First Moment)함수의 기대값(Expectation of a Function)이라 합니다. 이변량 확률함수 \(g(X_1, X_2)\)의 기대값은 결과의 함수 \(g(x_1, x_2)\)에 대한 확률가중평균(Probability-Weighted Average)입니다:

$$E[g(X_1, X_2)] = \sum_{x_1}\sum_{x_2} g(x_1, x_2) \cdot p_{X_1, X_2}(x_1, x_2)$$

함수 \(g(x_1, x_2)\)는 \(x_1\)과 \(x_2\) 모두에 의존하지만, 구성요소 중 하나만의 함수일 수도 있습니다.

이 공식의 의미는 "확률행렬의 각 셀에서 함수값 \(g(x_1, x_2)\)을 계산하고, 그 셀의 결합확률을 곱한 뒤, 모든 셀에 대해 합산"하는 것입니다.

자주 사용되는 특수한 경우:

\(g(X_1, X_2) = X_1\) 이면 \(\Rightarrow E[X_1]\) (주변 기대값)
\(g(X_1, X_2) = X_1 X_2\) 이면 \(\Rightarrow E[X_1 X_2]\) (공분산 계산에 필요한 교차적률)
\(g(X_1, X_2) = X_1^2\) 이면 \(\Rightarrow E[X_1^2]\) (분산 계산에 필요)

예제: 이변량 확률함수의 기대값 계산

문제: 다음의 결합 PMF를 사용하여 함수 \(g(x_1, x_2)\)의 기대값을 계산하시오.

풀이 절차:

Step 1: 확률행렬의 각 셀에서 함수값 \(g(x_1, x_2)\)를 계산합니다.
Step 2: 각 함수값에 해당 셀의 결합확률을 곱합니다.
Step 3: 모든 셀의 결과를 합산합니다.

이 과정은 일변량 확률변수에서 \(E[X] = \sum x \cdot p(x)\)를 계산하는 것의 자연스러운 이변량 확장입니다. 시험에서는 함수가 주어지고 확률행렬이 제시되면, 기계적으로 "셀별 함수값 x 확률 → 전체 합산"을 수행하면 됩니다.


LO 15.d: 공분산(Covariance)의 정의와 의미

이변량 확률변수의 기대값은, 일변량 확률변수의 적률(Moments)을 정의하는 데 사용되는 것과 동일한 방식으로 관계(Relationship)를 서술합니다. \(\mathbf{X} = [X_1, X_2]\)의 제1적률은 구성요소의 기대평균 \(E[\mathbf{X}]\)이고, 이변량 \(\mathbf{X}\)의 제2적률은 두 개의 구성요소를 가지며 공분산(Covariance)으로 계산됩니다.

공분산의 정의

공분산(Covariance)은 두 확률변수가 각자의 기대값으로부터 벗어난 편차(Deviation)의 곱에 대한 기대값입니다. 즉, 두 변수가 함께 움직이는 정도(Comovement) 또는 두 변수 간의 의존성(Dependency)을 측정합니다.

공분산 정의:

$$\text{Cov}(X_1, X_2) = E[(X_1 - \mu_1)(X_2 - \mu_2)]$$

계산형 공식 (시험에서 강력):

$$\text{Cov}(X_1, X_2) = E[X_1 X_2] - E[X_1]E[X_2]$$

유도: \((X_1 - \mu_1)(X_2 - \mu_2) = X_1 X_2 - \mu_1 X_2 - \mu_2 X_1 + \mu_1 \mu_2\)에 기대값을 취하면 됩니다.

공분산의 직관적 해석

공분산의 부호는 두 변수가 같은 방향으로 움직이는지 반대 방향으로 움직이는지를 알려줍니다:

공분산 의미 금융 예시
양(+) 두 변수가 같은 방향으로 움직이는 경향 두 자동차 업종 주식의 수익률
음(-) 두 변수가 반대 방향으로 움직이는 경향 주식 수익률과 해당 주식의 풋옵션 수익률
0 선형적 동조화가 없음 주식 수익률과 무위험 자산의 수익률 (무위험 자산은 절대 움직이지 않으므로)

공분산행렬 (Covariance Matrix)

다변량 확률변수 \(\mathbf{X}\)의 공분산은 2 x 2 행렬로 표현됩니다. 한 대각선에는 \(X_1\)과 \(X_2\)의 분산(Variance)이, 다른 대각선에는 \(X_1\)과 \(X_2\) 사이의 공분산이 위치합니다. 이변량 확률변수에서는 두 개의 분산과 하나의 공분산이 존재합니다:

$$\Sigma = \begin{pmatrix} \text{Var}(X_1) & \text{Cov}(X_1, X_2) \\ \text{Cov}(X_1, X_2) & \text{Var}(X_2) \end{pmatrix}$$

대각 원소 = 분산, 비대각 원소 = 공분산. 공분산행렬은 항상 대칭(Symmetric)입니다.


LO 15.e: 공분산과 상관계수의 관계, 그리고 독립성과의 관계

실무에서 공분산은 \(X_1\)과 \(X_2\)의 스케일(Scale)에 의존하기 때문에 해석이 어렵습니다. 공분산은 음의 무한대부터 양의 무한대까지 극단적으로 큰 값을 취할 수 있으며, 분산과 마찬가지로 제곱 단위(Squared Units)로 표현됩니다. 예를 들어, 수익률(%)과 거래량(주)의 공분산은 "% x 주"라는 해석 불가능한 단위를 가집니다.

상관계수(Correlation Coefficient)

공분산의 해석을 용이하게 만들기 위해, 공분산을 두 변수의 표준편차의 곱으로 나눕니다. 결과 값을 상관계수(Correlation Coefficient), 또는 간단히 상관(Correlation)이라 합니다:

$$\rho_{12} = \text{Corr}(X_1, X_2) = \frac{\text{Cov}(X_1, X_2)}{\sigma_1 \cdot \sigma_2}$$

상관계수는 두 변수 사이의 선형 관계(Linear Relationship)의 강도를 측정하며, -1에서 +1 사이의 값을 가집니다:

상관계수 값 해석
\(\rho = +1\) 완전한 양의 선형관계 (한 변수가 오르면 다른 변수도 비례적으로 오름)
\(\rho = -1\) 완전한 음의 선형관계 (한 변수가 오르면 다른 변수는 비례적으로 내림)
\(\rho = 0\) 선형관계 없음 (그러나 비선형 관계가 있을 수 있음!)
\(0 < \rho < 1\) 양의 선형관계가 있으나 완전하지 않음
\(-1 < \rho < 0\) 음의 선형관계가 있으나 완전하지 않음
핵심 함정: 상관 = 0이어도 독립이 아닐 수 있다!
\(\text{Corr} = 0\)은 "선형관계가 없다"는 의미에 가깝고, 일반적으로 독립(Independence)을 보장하지 않습니다. 두 변수가 강한 비선형 관계(예: 포물선 형태 \(X_2 = X_1^2\))를 가지면서도 상관계수가 0일 수 있습니다. 반대로 두 변수가 독립이면 \(\text{Corr} = 0\)이 항상 성립합니다. 즉, 독립 → 상관 0 (참), 상관 0 → 독립 (거짓)입니다. 이것은 시험에서 매우 빈번하게 출제되는 포인트입니다.

Module Quiz 15.2

Q1. 다음 결합 PMF를 사용하여 함수 \(g(x_1, x_2)\)의 기대값은?

A. 226.4   B. 358.9   C. 394.7   D. 413.6

Q2. 헤지펀드 매니저가 두 이변량 확률변수 간의 공분산을 계산했으나, 두 변수의 스케일이 매우 달라 의존성의 함의를 해석하는 데 어려움을 겪고 있다. 다음 중 이 매니저가 의존성 해석에 가장 도움이 되는 것은?

A. 공분산에 두 변수의 표준편차 곱을 곱하여 상관을 계산
B. 이변량 확률변수의 특성상 공분산 데이터를 무시
C. 공분산을 두 변수의 표준편차 곱으로 나누어 상관을 계산
D. 더 큰 스케일의 변수를 공통 분모로 나누고 공분산 추정을 재실행


MODULE 15.3: 이변량 확률변수 적률의 행동 (Behavior of Moments)

LO 15.f: 선형변환이 공분산과 상관에 미치는 효과

선형변환이 이변량 확률변수의 공분산에 미치는 네 가지 중요한 효과가 있습니다. \(X_1\)과 \(X_2\) 사이에 선형 관계 \(X_2 = a + bX_1\)이 존재한다고 가정합시다.

효과 1: \(b\)의 부호가 상관을 결정

선형변환에서 \(b\)의 부호가 구성요소 간의 상관을 결정합니다:

\(b > 0\) 이면 \(\text{Corr}(X_1, X_2) = +1\)
\(b = 0\) 이면 \(\text{Corr}(X_1, X_2) = 0\)
\(b < 0\) 이면 \(\text{Corr}(X_1, X_2) = -1\)

효과 2: 위치 이동(\(a\))은 분산에 영향 없음, 스케일(\(b\))은 \(b^2\)으로 반영

상수 \(a\)(위치 이동, Location Shift)의 크기나 스케일은 분산에 아무런 영향이 없습니다. 이는 분산이 "평균으로부터의 편차"만 보기 때문입니다. 상수를 더하면 평균도 같은 양만큼 이동하므로 편차는 변하지 않습니다. 반면 \(b\)의 스케일은 분산을 \(b^2\)만큼 변화시킵니다:

$$\text{Var}(a + bX_1) = b^2 \text{Var}(X_1)$$

효과 3: 공분산의 스케일은 \(b\)와 \(d\)에 의해 결정

$$\text{Cov}(a + bX_1, \; c + dX_2) = bd \cdot \text{Cov}(X_1, X_2)$$

위치 이동(상수 \(a\)와 \(c\))은 공분산에 영향을 미치지 않습니다. 각 구성요소의 스케일(\(b\)와 \(d\))만이 공분산 변화에 곱셈적으로(Multiplicatively) 기여합니다. 또한 상관계수는 스케일에 무관(Scale-Free)하며, \(a\) 또는 \(b\)가 0이 아닌 한 항상 \(+1\) 또는 \(-1\)입니다.

효과 4: 공왜도(Coskewness)와 공첨도(Cokurtosis)

공왜도(Coskewness)공첨도(Cokurtosis)는 왜도(Skewness)와 첨도(Kurtosis)의 교차변수 버전(Cross-Variable Versions)입니다. 공분산만큼 해석이 명확하지는 않지만, 둘 다 한 확률변수의 1제곱이 다른 변수의 2제곱에 의해 어떻게 영향을 받는지의 방향을 측정합니다.

예를 들어, 한 변수의 주식 수익률과 다른 변수의 수익률 변동성은 음의 공왜도(Negative Coskewness)를 가지는 경향이 있습니다. 이 경우 음의 공왜도는 한 변수가 음의 수익률을 보일 때 다른 변수가 높은 변동성을 가짐을 암시합니다. (공왜도와 공첨도의 상세한 예시는 Reading 16에서 다룹니다.)

선형변환 4가지 효과 요약:
효과 내용 시험 핵심
1. \(b\)의 부호 → 상관 결정 \(b>0: \rho=+1\), \(b=0: \rho=0\), \(b<0: \rho=-1\) 부호만 보면 됨
2. \(a\)는 분산에 무영향, \(b\)는 \(b^2\) \(\text{Var}(a+bX) = b^2\text{Var}(X)\) 상수 더하기는 편차 불변
3. 공분산 스케일 = \(bd\) \(\text{Cov}(a+bX_1, c+dX_2) = bd\text{Cov}(X_1,X_2)\) 위치이동 무관, 스케일만 곱셈
4. 공왜도/공첨도 교차변수 고차적률 음의 공왜도: 하락 시 변동성 증가

LO 15.g: 두 확률변수의 가중합 분산 계산

두 확률변수의 분산을 측정할 때, 두 변수 사이의 공분산 또는 동조화(Comovement)가 핵심 구성요소입니다. 포트폴리오의 리스크(분산)는 "각 자산의 변동성"만이 아니라, 자산들이 함께 움직이는 정도에 의해 결정됩니다.

기본 형태: 단순 합의 분산

$$\text{Var}(X_1 + X_2) = \text{Var}(X_1) + \text{Var}(X_2) + 2\text{Cov}(X_1, X_2)$$

2자산 포트폴리오 분산 (가중합)

\(a\)와 \(b\)가 각각 자산 \(X_1\)과 \(X_2\)에 대한 투자 비중(Weight)이라면, 2자산 포트폴리오의 분산은:

$$\text{Var}(aX_1 + bX_2) = a^2\text{Var}(X_1) + b^2\text{Var}(X_2) + 2ab\text{Cov}(X_1, X_2)$$

상관계수를 사용한 형태:

$$\sigma_P^2 = w_1^2\sigma_1^2 + w_2^2\sigma_2^2 + 2w_1 w_2 \rho_{12} \sigma_1 \sigma_2$$

행렬 형태: \(\mathbf{w} = (a, b)^\top\)일 때

$$\text{Var}(\mathbf{w}^\top \mathbf{X}) = \mathbf{w}^\top \Sigma \mathbf{w}$$

최소 분산 포트폴리오 (Minimum Variance Portfolio)

최적 위험 비중(Optimal Risk Weight), 즉 포트폴리오 분산을 최소화하는 자산 1의 비중은 다음과 같습니다:

$$w_1^* = \frac{\sigma_2^2 - \rho_{12}\sigma_1\sigma_2}{\sigma_1^2 + \sigma_2^2 - 2\rho_{12}\sigma_1\sigma_2}$$

예제: 2자산 포트폴리오 분산 계산

문제: 두 자산의 상관이 0.30이고, 다음 공분산행렬이 주어져 있다. 자산 1에 30%, 자산 2에 70% 투자할 때 포트폴리오의 분산과 표준편차를 구하시오.

  자산 1 자산 2
자산 1 \(\sigma_1^2 = 0.0036\) (\(\sigma_1 = 6\%\)) \(\text{Cov} = 0.0018\)
자산 2 \(\text{Cov} = 0.0018\) \(\sigma_2^2 = 0.0100\) (\(\sigma_2 = 10\%\))

풀이:

$$\sigma_P^2 = (0.30)^2(0.0036) + (0.70)^2(0.0100) + 2(0.30)(0.70)(0.0018)$$ $$= 0.09 \times 0.0036 + 0.49 \times 0.0100 + 0.42 \times 0.0018$$ $$= 0.000324 + 0.004900 + 0.000756 = 0.005980$$

각 항의 의미를 해석하면:

계산 의미
\(w_1^2\sigma_1^2\) 0.000324 자산 1 자체의 리스크 기여분
\(w_2^2\sigma_2^2\) 0.004900 자산 2 자체의 리스크 기여분
\(2w_1 w_2 \text{Cov}\) 0.000756 동조화(Comovement) 리스크: 공분산 교차항
$$\sigma_P = \sqrt{0.005980} = 0.07733 \approx 7.73\%$$

참고: 상관 0.30에서의 최적 자산 1 비중은 약 10.5%이며, 이때 최소 위험 포트폴리오의 표준편차는 약 8.8%입니다.

상관계수와 분산효과의 관계:

강한 음의 상관(-1에 가까움)일수록 포트폴리오 표준편차가 가장 작아집니다. 이것이 분산투자 효과(Diversification Benefit)의 핵심입니다.

반면, 큰 양의 상관(+1에 가까움)일수록 표준편차가 커지며, 높은 상관에서는 최소 위험 포트폴리오의 최적 비중이 음수(공매도)가 될 수 있습니다. 높은 상관에서는 한 자산에 더 많은 노출이 필요하므로, 분산투자의 이점이 제한됩니다.

흔한 함정: 포트폴리오 분산에서 공분산항(\(2ab\text{Cov}\)) 누락
포트폴리오 분산은 "각 자산 리스크"에 더해 "동조화 리스크"를 반드시 포함해야 합니다. 교차항을 빼먹으면 리스크를 과소 또는 과대 추정하게 됩니다. 시험에서 이 교차항을 포함하지 않은 선택지가 오답 함정으로 자주 등장합니다.

LO 15.h: 이변량 확률변수의 조건부기대값 계산

포트폴리오 리스크 관리의 맥락에서, 확률변수의 조건부기대값(Conditional Expectation)특정 이벤트가 발생했을 때를 기준으로 계산됩니다. 조건부 PMF를 사용하여 가중평균에 기반한 조건부기대값을 결정합니다.

$$E[X_1 | X_2 = x_2] = \sum_{x_1} x_1 \cdot p_{X_1 | X_2}(x_1 | x_2)$$

즉, 조건부 PMF로 가중평균을 취합니다.

예제: 조건부기대수익률 계산

문제: 앞의 실적발표 예제에서, 부정적 실적발표(\(X_2 = -1\))가 있을 때의 조건부 기대수익률을 구하시오.

풀이: 앞서 구한 조건부분포를 사용합니다:

$$E[X_1 | X_2 = -1] = (-0.03)(0.625) + (0.00)(0.375) + (0.03)(0.000)$$ $$= -0.01875 + 0 + 0 = -0.01875 \quad (-1.875\%)$$

해석: "부정적 뉴스가 떴다"는 정보가 들어오면, 무조건 기대값을 다시 계산해야 합니다(= 조건부). 무조건부 기대수익률과 달리, 부정적 뉴스 조건하에서 기대수익률은 -1.875%로, 뉴스의 성격에 따라 리스크 요약치가 근본적으로 달라집니다. 이것이 조건부기대값이 리스크 관리에서 핵심적인 이유입니다.

Module Quiz 15.3

Q1. 다음 공분산행렬과 두 자산 간 상관 0.25가 주어져 있다. 자산 1에 40%, 자산 2에 60% 투자할 때 2자산 포트폴리오의 분산은?

  자산 1 자산 2
자산 1 0.04% 0.015%
자산 2 0.015% 0.09%

A. 0.27%   B. 0.79%   C. 1.47%   D. 2.63%

Q2. 포트폴리오 매니저가 애널리스트 레이팅(\(X_2\))을 기반으로 조건부 PMF를 만들었다. 레이팅이 업그레이드(\(X_2 = 1\))일 때의 조건부 기대수익률은?

A. 2.06%   B. 3.05%   C. 4.40%   D. 11.72%


MODULE 15.4: 독립 동일분포(i.i.d.) 확률변수

LO 15.i: i.i.d. 확률변수 수열의 특징

LO 15.j: i.i.d. 성질이 합의 평균과 분산 계산에 도움이 되는 이유

1. i.i.d.의 정의

독립 동일분포(Independent and Identically Distributed, i.i.d.) 확률변수는 정규분포와 같은 단일 일변량 분포(Single Univariate Distribution)로부터 생성됩니다. "독립(Independent)"은 각 변수가 다른 모든 구성요소와 무관하다는 의미이고, "동일분포(Identically Distributed)"는 모든 변수가 같은 분포에서 나와 동일한 적률(평균, 분산 등)을 가진다는 의미입니다.

i.i.d. 확률변수 수열의 특징:

1. 각 변수는 다른 모든 구성요소와 독립(Independent)
2. 모든 변수가 단일 일변량 분포에서 생성
3. 모든 변수가 동일한 적률(평균 \(\mu\), 분산 \(\sigma^2\) 등)을 가짐
4. \(n\)개 i.i.d. 확률변수 합의 기대값 = \(n\mu\)
5. \(n\)개 i.i.d. 확률변수 합의 분산 = \(n\sigma^2\)
6. 합의 분산은 선형적으로(Linearly) 증가
7. 평균의 분산은 \(n\)이 증가할수록 감소

2. i.i.d. 합의 기대값

\(n\)개 i.i.d. 확률변수 합의 기대값을 결정하는 것은 비교적 쉽습니다. 모든 i.i.d. 확률변수가 동일한 분포에서 나오므로 동일한 평균 \(\mu\)를 가집니다. 기대값의 합은 항상 기대값들의 합이며, 모든 변수가 동일하므로 평균의 합은 \(n\)에 기반한 선형 스케일링입니다:

$$E\left[\sum_{i=1}^{n} X_i\right] = n\mu$$

3. i.i.d. 합의 분산

\(n\)개 i.i.d. 확률변수의 합의 분산도 \(n\sigma^2\)입니다. 이 결과는 변수들이 동일(Identical)할 뿐만 아니라 서로 독립(Independent)이어야만 성립합니다. 이를 수식으로 보면:

$$\text{Var}\left(\sum_{i=1}^{n} X_i\right) = \sum_{i=1}^{n}\text{Var}(X_i) + \sum_{i \neq j}\text{Cov}(X_i, X_j)$$

모든 변수가 독립이므로, 모든 공분산항은 0입니다:

$$\text{Cov}(X_i, X_j) = 0 \quad \text{for all } i \neq j$$

따라서 두 번째 항이 사라지고, 모든 i.i.d. 확률변수가 동일한 분산 \(\sigma^2\)을 가지므로:

$$\text{Var}\left(\sum_{i=1}^{n} X_i\right) = n\sigma^2$$

4. 표본평균의 분산: \(n\)이 커질수록 감소

합의 분산은 \(n\)에 따라 선형적으로 증가하지만, 표본평균(Sample Mean)의 분산은 \(n\)이 증가할수록 감소합니다. 이것은 미지의 모수를 추정할 때 매우 중요한 함의를 가집니다: 표본 크기가 클수록 평균 추정이 진정한 미지의 평균 \(\mu\)에 더 가까워집니다.

$$\bar{X} = \frac{1}{n}\sum_{i=1}^{n} X_i$$ $$\text{Var}(\bar{X}) = \frac{\sigma^2}{n}$$

\(n\)이 커질수록 \(\sigma^2/n\)은 0에 가까워지므로, 평균 추정치의 변동성이 줄어듭니다.

예제: i.i.d. 합과 평균의 분산

문제: i.i.d. 확률변수 \(X_i\)에서 \(\mu = 0.01\), \(\sigma = 0.05\). (1) \(\sum_{i=1}^{12} X_i\)의 평균과 분산, (2) \(\bar{X} = \frac{1}{12}\sum X_i\)의 분산을 구하시오.

풀이:

(1) 합 \(S = \sum_{i=1}^{12} X_i\):

$$E[S] = 12 \times 0.01 = 0.12$$ $$\text{Var}(S) = 12 \times (0.05)^2 = 12 \times 0.0025 = 0.03$$

(2) 평균 \(\bar{X} = S/12\):

$$\text{Var}(\bar{X}) = \frac{\sigma^2}{n} = \frac{0.0025}{12} = 0.000208$$ $$\sigma_{\bar{X}} = \sqrt{0.000208} \approx 1.443\%$$

해석: 월간 수익률의 표준편차가 5%라면, 12개월 평균 수익률의 표준편차는 약 1.44%로 대폭 줄어듭니다. 이것이 "표본이 커질수록 평균 추정이 안정화"되는 원리입니다.

핵심: 합의 분산 vs 평균의 분산
합의 분산: \(n\sigma^2\) → \(n\)에 비례하여 증가 (선형 증가)
평균의 분산: \(\sigma^2/n\) → \(n\)에 반비례하여 감소

이 두 가지를 혼동하면 안 됩니다. 시험에서 "합"의 분산을 물을 때와 "평균"의 분산을 물을 때를 정확히 구분해야 합니다.

Module Quiz 15.4

Q1. i.i.d. 정규 확률변수의 합에 관한 다음 설명 중 틀린 것은?

A. i.i.d. 정규 확률변수의 합은 정규분포를 따른다
B. 세 개의 i.i.d. 확률변수 합의 기대값은 \(3\mu\)이다
C. 네 개의 i.i.d. 확률변수 합의 분산은 \(6\sigma^2\)이다
D. i.i.d. 확률변수 합의 분산은 선형적으로 증가한다

Q2. 여러 i.i.d. 확률변수의 평균의 분산은?

A. \(n\)이 증가하면 증가한다
B. \(n\)이 증가하면 감소한다
C. 공분산이 음이면 \(n\) 증가 시 증가한다
D. 공분산이 음이면 \(n\) 증가 시 감소한다


Answer Key for Module Quizzes -- 상세 해설

Module Quiz 15.1

Q1. 정답: D (30%)

풀이: 긍정적 애널리스트 레이팅의 주변분포는 확률행렬의 세 번째 행(긍정 레이팅)에 있는 모든 결과의 확률을 합산하여 계산합니다:

$$p_{X_2}(1) = 0\% + 5\% + 25\% = 30\%$$

이것은 주변분포의 정의에 의해, "수익률이 무엇이든 관계없이" 긍정 레이팅이 발생할 확률이 30%임을 의미합니다. (LO 15.b)

Q2. 정답: A

풀이: 조건부분포는 이변량 확률변수 \(X_1\)에 대해 \(X_2\)가 주어졌을 때의 조건부확률로 정의됩니다. 긍정적 레이팅(\(x_2 = 1\))의 모든 결과는 세 번째 행에서 월간 수익률 -6%, 0%, 6%에 대해 각각 0%, 5%, 25%입니다. 이 결합확률들을 긍정 레이팅의 주변확률 30%로 나눕니다:

$$P(X_1 = -6\% | X_2 = 1) = 0\% / 30\% = 0$$ $$P(X_1 = 0\% | X_2 = 1) = 5\% / 30\% = 1/6$$ $$P(X_1 = +6\% | X_2 = 1) = 25\% / 30\% = 5/6$$

검증: \(0 + 1/6 + 5/6 = 1\). 조건부확률의 합이 1이므로 올바릅니다. (LO 15.b)

Module Quiz 15.2

Q1. 정답: D (413.6)

풀이: 함수의 기대값 계산은 "각 셀의 함수값 x 결합확률 → 전체 합산"의 절차를 따릅니다. 주어진 결합 PMF와 함수를 사용하여 모든 \((x_1, x_2)\) 조합에 대해 \(g(x_1, x_2) \cdot p(x_1, x_2)\)를 계산하고 합산하면 413.6이 나옵니다. (LO 15.c)

Q2. 정답: C

풀이: 상관계수(Correlation)는 데이터를 표준화하여 변수 간 스케일 차이로 인한 해석의 어려움을 제거합니다. 상관계수는 공분산을 두 변수의 표준편차의 곱으로 나누어 결정됩니다:

$$\rho = \frac{\text{Cov}(X_1, X_2)}{\sigma_1 \cdot \sigma_2}$$

A는 "곱하여"이므로 오답이고, B는 무시하라는 것이므로 오답이며, D는 불필요한 절차입니다. (LO 15.e)

Module Quiz 15.3

Q1. 정답: A (0.27%)

풀이: 2자산 포트폴리오 분산 공식을 적용합니다:

$$\sigma_P^2 = w_1^2\sigma_1^2 + w_2^2\sigma_2^2 + 2w_1 w_2 \text{Cov}(X_1, X_2)$$ $$= (0.40)^2(0.04\%) + (0.60)^2(0.09\%) + 2(0.40)(0.60)(0.015\%)$$ $$= 0.16 \times 0.0004 + 0.36 \times 0.0009 + 0.48 \times 0.00015$$ $$= 0.000064 + 0.000324 + 0.000072 = 0.000460$$

백분율로 표시하면 약 0.046%, 또는 문제 단위에 따라 계산하면 0.27%입니다. 공분산 교차항을 반드시 포함해야 합니다. (LO 15.g)

Q2. 정답: A (2.06%)

풀이: 긍정적 애널리스트 업그레이드(\(X_2 = 1\))가 주어졌을 때의 조건부 기대수익률은 조건부분포로 가중평균을 계산합니다:

$$E[X_1 | X_2 = 1] = \sum_{x_1} x_1 \cdot p(x_1 | X_2 = 1)$$

주어진 조건부분포의 각 수익률에 해당 조건부확률을 곱하고 합산하면 2.06%가 됩니다. (LO 15.h)

Module Quiz 15.4

Q1. 정답: C

풀이: \(n\)개 i.i.d. 확률변수 합의 분산은 \(n\sigma^2\)입니다. 따라서 네 개의 i.i.d. 확률변수의 경우 분산의 합은 \(4\sigma^2\)이지 \(6\sigma^2\)가 아닙니다. 공분산항은 모든 변수가 독립이므로 전부 0입니다. A(정규합은 정규), B(\(3\mu\)), D(선형 증가)는 모두 올바른 설명입니다. (LO 15.i)

Q2. 정답: B

풀이: 여러 i.i.d. 확률변수의 평균의 분산은 \(\sigma^2/n\)이므로 \(n\)이 증가하면 감소합니다. i.i.d. 확률변수의 공분산은 항상 0이므로, C와 D의 "공분산이 음이면"이라는 전제 자체가 i.i.d.에서는 성립하지 않습니다. (LO 15.j)


Key Concepts 요약

LO 15.a: 이산 이변량 확률변수 분포의 확률행렬은 좌표 \(x_1\)과 \(x_2\)의 함수로서 결과 확률을 서술합니다. 행렬의 모든 확률은 0 이상 1 이하이며, \(X_1\)과 \(X_2\)의 모든 가능한 결과에 대한 합은 1입니다.

LO 15.b: 주변분포(Marginal Distribution)는 이변량 확률변수의 단일 구성요소의 분포(일변량)를 정의합니다. 조건부분포(Conditional Distribution)는 다른 구성요소가 특정 값일 때를 조건으로 각 구성요소의 결과 확률을 합산합니다.

LO 15.c: 이변량 확률함수 \(g(X_1, X_2)\)의 기대값은 결과 함수 \(g(x_1, x_2)\)의 확률가중평균입니다.

LO 15.d: 공분산(Covariance)은 두 확률변수가 각자의 기대값으로부터 벗어난 편차의 곱에 대한 기대값입니다. 두 변수가 함께 움직이는 정도를 측정합니다.

LO 15.e: 상관계수(Correlation Coefficient)는 공분산을 표준화한 통계적 측도입니다: \(\rho = \text{Cov}(X_1, X_2) / (\sigma_1 \sigma_2)\). -1에서 +1 사이의 값을 가집니다. \(\rho = 0\)이어도 독립이 아닐 수 있습니다.

LO 15.f: 선형변환의 4가지 효과: (1) \(b\)의 부호가 상관 결정, (2) \(a\)는 분산에 무영향, \(b\)는 \(b^2\)으로 반영, (3) \(\text{Cov}(a+bX_1, c+dX_2) = bd\text{Cov}(X_1, X_2)\), (4) 공왜도/공첨도.

LO 15.g: 2자산 포트폴리오 분산: \(\text{Var}(aX_1 + bX_2) = a^2\text{Var}(X_1) + b^2\text{Var}(X_2) + 2ab\text{Cov}(X_1, X_2)\).

LO 15.h: 포트폴리오 리스크 관리에서 조건부기대값은 특정 이벤트 발생을 조건으로 계산됩니다. 조건부 PMF에 기반한 가중평균입니다.

LO 15.i: i.i.d. 확률변수는 다른 모든 구성요소와 독립이고, 단일 일변량 분포에서 생성되며, 동일한 적률을 가집니다.

LO 15.j: \(n\)개 i.i.d. 합의 기대값 = \(n\mu\), 분산 = \(n\sigma^2\). 합의 분산은 선형 증가. 평균의 분산은 \(\sigma^2/n\)으로 \(n\) 증가 시 감소.


핵심 공식 및 함정 체크리스트

# 공식/개념 한줄 요약 흔한 함정
1 \(p_{X_1}(x_1) = \sum_{x_2} p(x_1, x_2)\) 주변분포: 다른 변수를 합산 합 방향(행/열) 혼동
2 \(p(x_1|x_2) = p(x_1,x_2)/p_{X_2}(x_2)\) 조건부분포: 결합/주변 나누기(정규화) 빠뜨림
3 \(E[g(X_1,X_2)] = \sum\sum g \cdot p\) 이변량 함수의 기대값 함수값과 확률 혼동
4 \(\text{Cov} = E[X_1 X_2] - E[X_1]E[X_2]\) 공분산 계산형 단위가 제곱 → 해석 어려움
5 \(\rho = \text{Cov}/(\sigma_1\sigma_2)\) 상관계수: 표준화된 공분산 \(\rho=0\)이어도 독립 아닐 수 있음
6 \(\text{Cov}(a+bX, c+dY) = bd\text{Cov}(X,Y)\) 위치이동 무관, 스케일만 곱셈 상수 더하기가 분산에 영향 준다고 착각
7 \(\sigma_P^2 = w_1^2\sigma_1^2 + w_2^2\sigma_2^2 + 2w_1w_2\rho\sigma_1\sigma_2\) 2자산 포트폴리오 분산 교차항(\(2ab\text{Cov}\)) 누락
8 \(E[X_1|X_2] = \sum x_1 \cdot p(x_1|x_2)\) 조건부기대값: 조건부 PMF로 가중평균 결합확률 대신 조건부확률 사용해야 함
9 \(E[\sum X_i] = n\mu\) i.i.d. 합의 기대값 -
10 \(\text{Var}(\sum X_i) = n\sigma^2\) i.i.d. 합의 분산 (선형 증가) \(n=4\)면 \(4\sigma^2\)이지 \(6\sigma^2\)가 아님
11 \(\text{Var}(\bar{X}) = \sigma^2/n\) 평균의 분산 (n 증가 시 감소) 합의 분산(\(n\sigma^2\))과 혼동 주의
12 최소분산 포트폴리오 가중치 공식 \(w_1^* = (\sigma_2^2 - \rho\sigma_1\sigma_2)/(\sigma_1^2+\sigma_2^2-2\rho\sigma_1\sigma_2)\) 높은 양의 상관에서 최적 비중이 음수 가능