FRM Part I – Reading 23
수익률, 변동성, 상관관계의 측정
(Measuring Returns, Volatility, and Correlation)
EXAM FOCUS
핵심 학습 목표
이 Reading은 투자 수익률을 정의하고 계산하는 방법에서 출발하여, 변동성(Volatility)과 분산(Variance)의 개념, 그리고 금융수익률의 비정규성(Non-normality)을 다룹니다. 전통적으로 변동성은 리스크와 동의어로 사용되어 왔으며, 변동성의 정확한 추정은 잠재적 리스크 익스포저를 이해하는 데 필수적입니다. 또한 상관관계(Correlation)와 의존성(Dependence)의 다양한 측정 방법을 학습합니다.
시험에서 반드시 할 수 있어야 하는 것
- 단순수익률(Simple Return)과 로그수익률(Log Return)의 계산, 차이점, 상호 변환
- 변동성(Volatility), 분산율(Variance Rate), 내재변동성(Implied Volatility)의 정의와 구별
- 변동성의 연환산(Annualization): 일간, 주간, 월간 변동성을 연간으로 스케일링하는 방법
- Jarque-Bera(JB) 검정을 이용한 정규성 검정 수행 및 해석
- 멱법칙(Power Law)을 이용한 비정규분포의 꼬리(Tail) 특성 설명
- Spearman 순위상관과 Kendall's tau의 계산 및 해석
- 양의 정부호(Positive Definiteness) 조건과 등상관(Equicorrelation) 구조의 이해
이 Reading은 정량적 계산과 개념적 이해가 모두 중요합니다. 특히 단순수익률과 로그수익률의 변환, 변동성 스케일링, JB 검정 통계량 계산, 그리고 Spearman/Kendall 상관계수 계산이 시험에 자주 출제됩니다.
MODULE 23.1: 수익률의 정의와 변동성
LO 23.a: 단순수익률과 로그수익률의 계산, 차이점, 변환
1. 단순수익률 (Simple Return)
투자 수익률은 가장 기본적으로 단순수익률(Simple Return)과 연속복리수익률(Continuously Compounded Return, Log Return)로 표현됩니다. 단순수익률은 한 시간에서 1년까지 다양한 기간에 걸쳐 표현할 수 있으며, 가장 직관적으로 이해하기 쉬운 수익률 개념입니다.
시점 \(t-1\)에서 가격 \(P_{t-1}\)인 자산을 매수하고, 시점 \(t\)에서 가격 \(P_t\)에 매도한다고 가정하면, 단순수익률 \(R_t\)는 다음과 같이 정의됩니다:
배당(Dividend)이 포함된 경우:
$$R_t = \frac{P_t - P_{t-1} + D_t}{P_{t-1}}$$단순수익률의 핵심적인 성질은 다기간 누적이 곱셈(Multiplicative)으로 이루어진다는 점입니다. 이는 각 기간의 수익률이 이전 기간의 결과(원금 + 수익)에 대해 적용되는 복리(Compounding) 구조를 반영합니다. 예를 들어 3기간의 누적수익률은 다음과 같습니다:
이 곱셈 구조가 의미하는 바는, 단순수익률을 단순히 더하면 안 된다는 것입니다. 예를 들어 첫 해에 +10%, 둘째 해에 -10%의 수익률을 기록했다면, 누적수익률은 0%가 아니라 \((1.10)(0.90) - 1 = -1\%\)가 됩니다. 이는 손실이 더 큰 원금에 적용되기 때문입니다.
2. 로그수익률 (Continuously Compounded Return / Log Return)
로그수익률(연속복리수익률)은 가격비에 자연로그를 취하여 계산합니다. 수학적으로 매우 편리한 성질을 가지고 있어 금융공학과 리스크 관리에서 널리 사용됩니다.
로그수익률의 가장 중요한 성질은 다기간 누적이 덧셈(Additive)으로 이루어진다는 것입니다. 이는 로그의 기본 성질 \(\ln(ab) = \ln a + \ln b\)에서 직접적으로 도출됩니다:
이 덧셈적 성질 덕분에, 로그수익률은 통계 모델링에서 훨씬 다루기 쉽습니다. 독립이고 동일한 분포를 따르는(i.i.d.) 일간 로그수익률의 합이 곧 다기간 로그수익률이 되므로, 중심극한정리(CLT)의 적용이 자연스럽고, 분산의 가법성이 성립합니다.
- 짧은 시간 범위(Short Time Horizons)에서는 로그수익률이 단순수익률보다 더 적절합니다
- 반면, 단순수익률이 큰 경우(예: 50% 이상) 로그수익률은 단순수익률을 정확하게 근사하지 못합니다
- 작은 수익률에서는 \(e^r \approx 1 + r\)이므로 \(R \approx r\)로 근사할 수 있습니다
3. 단순수익률과 로그수익률의 변환
두 수익률 사이의 변환은 다음 관계식을 통해 이루어집니다. 이 변환식은 시험에서 매우 자주 출제됩니다:
중요: 단순수익률은 항상 로그수익률보다 큽니다 (\(R_t > r_t\))
단순수익률이 항상 로그수익률보다 큰 이유는 자연로그 함수 \(\ln(1+x)\)가 \(x\)보다 항상 작기 때문입니다(단, \(x > 0\)). 이는 \(\ln\) 함수의 오목성(Concavity)에서 기인하며, Jensen의 부등식과도 관련됩니다.
예시 1: 단순수익률에서 로그수익률로 변환
단순수익률이 5.00%인 경우, 로그수익률을 구하시오.
$$r = \ln(1 + R) = \ln(1.05) = 0.04879 \approx 4.88\%$$따라서 로그수익률(4.88%)은 단순수익률(5.00%)보다 약 12bp 작습니다.
예시 2: 다기간 누적 비교
1기: \(R_1 = +10\%\), 2기: \(R_2 = -10\%\)
단순수익률 누적:
$$1 + R_{0 \to 2} = (1.10)(0.90) = 0.99 \quad \Rightarrow \quad R_{0 \to 2} = -1\%$$로그수익률 누적:
$$r_{0 \to 2} = \ln(1.10) + \ln(0.90) = 0.09531 + (-0.10536) = -0.01005$$ $$R_{0 \to 2} = e^{-0.01005} - 1 = -1\%$$두 방법 모두 동일한 누적수익률(-1%)을 산출합니다. 핵심적인 차이는 계산 과정에 있습니다: 단순수익률은 곱셈, 로그수익률은 덧셈으로 누적됩니다.
- 단순수익률을 절대로 더해서 누적하지 마십시오. 반드시 \((1+R)\)들을 곱해야 합니다
- 로그수익률이 항상 "더 정확한" 수익률은 아닙니다. 큰 수익률에서는 단순수익률과의 차이가 크게 벌어집니다
- 변환 공식에서 \(1 + R = e^r\)과 \(r = \ln(1+R)\)을 혼동하지 마십시오
LO 23.b: 변동성, 분산율, 내재변동성의 정의와 구별
1. 변동성 (Volatility)과 분산율 (Variance Rate)
변동성은 금융에서 리스크를 측정하는 가장 기본적인 지표입니다. 변수의 변동성 \(\sigma\)는 수익률의 표준편차(Standard Deviation)로 표현되며, 분산(율) \(\sigma^2\)은 변동성의 제곱입니다. 변동성과 분산은 동일한 정보를 담고 있지만, 변동성은 원래 단위와 같은 차원을 가지므로 해석이 더 직관적입니다.
기본적인 수익률 모형에서는 평균(\(\mu\)), 변동성(\(\sigma\)), 그리고 평균이 0이고 분산이 1인 충격(Shock) \(e_t\)를 사용하여 수익률을 다음과 같이 표현합니다:
여기서 \(e_t \sim (0, 1)\): 평균 0, 분산 1인 충격(Innovation)
이 모형에서 \(\mu\)는 기대수익률을, \(\sigma \cdot e_t\)는 예측할 수 없는 랜덤한 변동 부분을 나타냅니다. \(\sigma\)가 클수록 수익률의 변동 폭이 커지므로, 더 큰 리스크를 의미합니다.
2. 변동성의 시간 스케일링 (Annualization)
변동성의 시간 스케일링은 수익률이 독립이고 동일한 분포(i.i.d.)를 따른다는 가정 하에 성립합니다. 이 가정 하에서, 분산은 시간에 비례하고 변동성은 시간의 제곱근에 비례합니다. 이를 "제곱근 시간 규칙(Square Root of Time Rule)"이라고 합니다.
예를 들어, 일간 수익률이 독립이라면 주간(5거래일) 수익률은 5개 일간 수익률의 합이 되고, 그 분산은 5배가 됩니다:
주간 평균: \(5\mu\), 주간 분산: \(5\sigma^2\), 주간 변동성: \(\sqrt{5}\,\sigma\)
연환산 변동성 (Annualized Volatility)
월간 수익률 기준:
$$\sigma_{\text{annual}} = \sigma_{\text{monthly}} \times \sqrt{12}$$일간 수익률 기준 (252 거래일 가정):
$$\sigma_{\text{annual}} = \sigma_{\text{daily}} \times \sqrt{252}$$예시 3: 일간 변동성의 연환산
일간 변동성 \(\sigma_d = 1.2\%\)인 경우, 연환산 변동성을 구하시오.
$$\sigma_{\text{annual}} = 0.012 \times \sqrt{252} = 0.012 \times 15.874 \approx 0.1905 = 19.05\%$$일간 1.2%의 변동성이 연간으로는 약 19%에 해당합니다. 이 큰 차이는 \(\sqrt{252} \approx 15.87\)이라는 배율 때문입니다.
3. 내재변동성 (Implied Volatility)
내재변동성은 옵션 가격으로부터 역으로 추출(Back Out)하는 연간 변동성 수치입니다. Black-Scholes-Merton(BSM) 모형을 이용하여 콜옵션 가격을 계산할 때 필요한 입력변수는 다음과 같습니다:
| 입력변수 | 관측 가능 여부 |
|---|---|
| 현재 자산가격 (Current Asset Price) | 관측 가능 |
| 행사가격 (Strike Price) | 관측 가능 |
| 잔존만기 (Time to Maturity) | 관측 가능 |
| 무위험이자율 (Risk-free Rate) | 관측 가능 |
| 연간 분산 (Annual Variance) | 관측 불가능 |
옵션의 시장가격이 주어지면, 위 5개 변수 중 유일하게 관측할 수 없는 연간 분산(변동성)을 BSM 공식에서 역으로 풀어낼 수 있습니다. 이렇게 구한 변동성이 바로 내재변동성입니다. 내재변동성은 시장 참여자들이 옵션 가격에 반영한 미래 변동성에 대한 기대를 나타냅니다.
4. VIX 지수 (VIX Index)
VIX 지수는 S&P 500 지수의 향후 30일(달력일) 내재변동성을 측정하는 지표입니다. BSM 모형과 달리 VIX는 다양한 만기와 여러 행사가격의 옵션 가격을 활용하여 계산하므로, 전방향적(Forward-looking) 변동성 지표로서 더 포괄적인 정보를 제공합니다.
VIX 방법론은 유동적이고 규모가 큰 파생상품 시장이 필요하며, 주가지수, 미국 국채, 원자재, 개별 주식 등에 대해서도 계산할 수 있습니다. VIX가 높을수록 시장 참여자들이 향후 30일간 더 큰 가격 변동을 예상하고 있음을 의미하며, 흔히 "공포 지수(Fear Index)"로 불립니다.
| 구분 | BSM 내재변동성 | VIX 지수 |
|---|---|---|
| 옵션 수 | 단일 옵션 | 다수의 옵션 (다양한 행사가/만기) |
| 분산 가정 | 시간에 따라 일정 | 분산 일정 가정 불필요 |
| 성격 | 모형 의존적 (Model-dependent) | 모형 비의존적 (Model-free) |
| 측정 기간 | 옵션 만기에 따라 다양 | 향후 30일 (달력일) |
MODULE 23.2: 정규분포와 비정규분포
LO 23.c: 비정규분포를 설명하기에 처음 두 모멘트가 불충분한 이유
1. 확률분포의 네 가지 모멘트
확률밀도함수(PDF)는 네 가지 주요 모멘트(Moment)로 특성화할 수 있습니다. 정규분포는 처음 두 모멘트(평균과 분산)만으로 완전히 기술되지만, 금융수익률은 정규분포를 따르지 않는 경우가 대부분이므로 세 번째와 네 번째 모멘트가 중요해집니다.
| 모멘트 | 명칭 | 의미 | 정규분포 값 |
|---|---|---|---|
| 1차 | 평균 (Mean) | 분포의 중심 위치 | 자유 |
| 2차 | 분산 (Variance) | 분포의 퍼짐 정도 | 자유 |
| 3차 | 왜도 (Skewness) | 분포의 비대칭성 | 0 |
| 4차 | 첨도 (Kurtosis) | 꼬리의 두께 (극단값 발생 확률) | 3 |
2. 금융수익률의 비정규성
정규분포는 대칭적(Symmetric)이고 얇은 꼬리(Thin Tails)를 가지며, 왜도가 0이고 초과첨도(Excess Kurtosis = Kurtosis - 3)가 0입니다. 그러나 실제 금융수익률은 이와 다릅니다:
- 왜도 (Skewness) ≠ 0: S&P 500과 JPY/USD 환율은 음의 왜도(Negative Skewness)를 보이며, 이는 큰 음의 수익률(폭락)이 큰 양의 수익률(급등)보다 더 자주 발생함을 의미합니다. 반면, 금(Gold)은 양의 왜도(Positive Skewness)를 나타냅니다.
- 첨도 (Kurtosis) > 3: 대부분의 금융자산은 3보다 큰 첨도(양의 초과첨도)를 가지며, 이는 팻테일(Fat Tails)이 존재함을 의미합니다. 즉, 정규분포가 예측하는 것보다 극단적인 수익률이 더 자주 발생합니다.
이러한 비정규성은 리스크 관리에서 매우 중요한 함의를 가집니다. 만약 VaR(Value at Risk)를 정규분포 가정 하에 계산한다면, 실제 꼬리 리스크를 과소평가하게 됩니다. 따라서 비정규분포의 특성을 정확히 파악하고 이를 리스크 모형에 반영하는 것이 필수적입니다.
- 음의 왜도 (Negative Skewness): 왼쪽 꼬리가 더 길다. 대형 손실이 대형 이익보다 더 빈번. 대부분의 주식수익률이 이 특성을 보임
- 양의 왜도 (Positive Skewness): 오른쪽 꼬리가 더 길다. 대형 이익이 대형 손실보다 더 빈번. 금, 일부 원자재가 이 특성을 보임
LO 23.d: Jarque-Bera 검정 통계량의 계산과 해석
1. Jarque-Bera(JB) 검정의 개요
Jarque-Bera(JB) 검정은 주어진 분포가 정규분포를 따르는지 여부를 통계적으로 검정하는 방법입니다. 이 검정은 왜도가 0이고 초과첨도가 0인지(즉 첨도가 3인지)를 동시에 테스트합니다.
귀무가설 (\(H_0\)): 왜도 \(S = 0\) 그리고 첨도 \(K = 3\) (즉, 초과첨도 \(K - 3 = 0\))
대립가설 (\(H_1\)): \(S \neq 0\) 또는 \(K \neq 3\) (적어도 하나가 성립하지 않음)
귀무가설이 기각되지 않으면 분포는 정규분포로 간주하고, 기각되면 비정규분포로 판단합니다.
2. JB 검정 통계량
여기서:
- \(T\) = 표본 크기 (Sample Size)
- \(S\) = 왜도 (Skewness)
- \(K\) = 첨도 (Kurtosis)
- \(K - 3\) = 초과첨도 (Excess Kurtosis)
JB 통계량의 두 구성요소(왜도 항과 첨도 항)는 대표본에서 각각 점근적으로 정규분포를 따르며 비상관이므로, 각각이 \(\chi^2(1)\) 분포를 따르고, 그 합인 JB 통계량은 근사적으로 \(\chi^2(2)\) 분포를 따릅니다.
| 유의수준 | 임계값 (\(\chi^2(2)\)) | 판정 기준 |
|---|---|---|
| 5% (95% 신뢰수준) | 5.99 | JB > 5.99이면 \(H_0\) 기각 |
| 1% (99% 신뢰수준) | 9.21 | JB > 9.21이면 \(H_0\) 기각 |
JB 값이 작을수록 귀무가설(정규분포)이 참일 가능성이 높고, JB 값이 클수록 귀무가설이 기각될 가능성이 높습니다. 또한, 일반적으로 측정 기간이 길어질수록 JB 통계량이 작아지고 금융수익률이 정규분포에 더 가깝게 근사하는 경향이 있습니다.
예시 4: JB 검정 수행 (귀무가설 비기각)
한 펀드의 60개 월간 수익률을 표본으로 추출하였으며, 왜도 \(S = 0.30\), 첨도 \(K = 3.50\)입니다. 95% 신뢰수준에서 이 펀드의 수익률이 정규분포를 따르는지 검정하시오.
$$JB = \frac{60}{6}\left(0.30^2 + \frac{(3.50 - 3)^2}{4}\right) = 10\left(0.09 + \frac{0.25}{4}\right) = 10(0.09 + 0.0625) = 10 \times 0.1525 = 1.525$$JB 통계량(1.525)이 임계값(5.99)보다 작으므로, 귀무가설을 기각하지 못합니다(Fail to reject). 즉, 이 펀드의 수익률이 정규분포를 따른다는 가설을 유지합니다.
예시 5: JB 검정 수행 (귀무가설 기각)
표본 크기 \(T = 100\), 왜도 \(S = -0.80\), 첨도 \(K = 6.00\)입니다. 1% 유의수준에서 정규성을 검정하시오.
$$JB = \frac{100}{6}\left((-0.80)^2 + \frac{(6.00 - 3)^2}{4}\right) = 16.67\left(0.64 + \frac{9}{4}\right) = 16.67 \times (0.64 + 2.25) = 16.67 \times 2.89 \approx 48.17$$JB 통계량(48.17)이 1% 임계값(9.21)보다 훨씬 크므로, 귀무가설을 강하게 기각합니다. 이 분포는 정규분포가 아닙니다. 높은 음의 왜도와 큰 초과첨도가 모두 기여하고 있습니다.
LO 23.e: 비정규분포에 대한 멱법칙(Power Law)의 활용
1. 멱법칙 꼬리 (Power Law Tails)
금융수익률이 비정규분포를 따른다면, 그 핵심적인 차이는 꼬리(Tail)에서 드러납니다. 정규분포는 첨도가 3(초과첨도 0)이고 꼬리가 매우 빠르게 감소(지수적 감소)하는 반면, 비정규분포의 꼬리는 훨씬 천천히 감소합니다.
멱법칙(Power Law)은 이러한 팻테일의 행동을 수학적으로 설명하는 모형으로, 특정 값 \(x\)보다 큰 수익률을 관측할 확률을 다음과 같이 표현합니다:
여기서:
- \(k > 0\): 스케일(Scale) 상수
- \(\alpha > 0\): 꼬리 지수(Tail Index). 꼬리의 두께를 결정
2. 꼬리 지수(\(\alpha\))의 해석
\(\alpha\)는 꼬리의 두께를 나타내는 핵심 파라미터입니다. \(\alpha\)가 작을수록 꼬리가 두꺼워지며(Fat Tail), 극단적 손실이 발생할 확률이 높아집니다. 반대로 \(\alpha\)가 클수록 꼬리가 얇아지며, 정규분포에 더 가까워집니다.
멱법칙 꼬리는 Student's t-분포에서도 관찰되며, 이는 정규분포보다 평균에서 멀리 떨어진 관측값이 더 자주 나타나는 이유를 설명합니다. 이 성질은 리스크 관리에서 매우 중요합니다: 정규분포 가정 하에서는 "거의 불가능"으로 간주되는 극단적 사건(예: 5-sigma 이벤트)이 팻테일 분포에서는 상당한 확률로 발생할 수 있기 때문입니다.
- 정규분포보다 꼬리가 훨씬 천천히 감소합니다 (Slow Decline)
- 평균에서 멀리 떨어진 극단적 관측값이 정규분포 예측보다 훨씬 자주 발생합니다
- \(\alpha\)가 작을수록 꼬리가 두꺼워지고 극단 손실 확률이 높아집니다
- 일반적으로 분포의 상위 5% 영역에서 적용됩니다
- Student's t-분포가 멱법칙 꼬리의 대표적인 예시입니다
| 특성 | 정규분포 | 멱법칙 꼬리 분포 |
|---|---|---|
| 꼬리 감소 속도 | 매우 빠름 (지수적 감소) | 느림 (다항식적 감소) |
| 초과첨도 | 0 | 양수 (> 0) |
| 극단값 발생 빈도 | 매우 드물다고 예측 | 상대적으로 자주 발생 |
| 대표적 분포 | 표준정규분포 | Student's t-분포 |
MODULE 23.3: 상관관계와 의존성
LO 23.f: 상관관계와 공분산의 정의, 상관관계와 의존성의 구별
1. 독립과 의존 (Independence vs. Dependence)
확률변수는 독립(Independent)이거나 의존적(Dependent)일 수 있습니다. 두 확률변수 \(X\)와 \(Y\)가 독립이면, 결합밀도함수(Joint Density)가 각각의 주변밀도함수(Marginal Density)의 곱과 같습니다:
변수들이 독립일 때는 분산효과(Diversification Benefits)가 극대화되고 꼬리 리스크(Tail Risk)가 감소합니다. 그러나 현실의 금융자산들은 선형적(Linear)으로나 비선형적(Nonlinear)으로나 강하게 의존하는 경향이 있으며, 특히 시장 위기 시에는 상관관계가 급격히 높아지는 경향이 있습니다.
2. 공분산 (Covariance)
공분산(Covariance)은 두 변수 간의 방향적 관계(Directional Relationship)를 나타냅니다. 양의 공분산은 두 변수가 같은 방향으로 움직이는 경향이 있음을, 음의 공분산은 반대 방향으로 움직이는 경향이 있음을 의미합니다.
공분산의 단점은 단위가 두 변수의 단위의 곱이므로 크기의 해석이 어렵다는 것입니다. 예를 들어 수익률(%)과 거래량(주)의 공분산은 "%×주"라는 의미 없는 단위를 가집니다.
3. 상관계수 (Correlation Coefficient)
상관계수(Correlation)는 공분산을 표준화한 것으로, 두 변수 간의 선형적 관계(Linear Relationship)의 강도와 방향을 -1에서 +1 사이의 값으로 나타냅니다.
| 상관계수 값 | 해석 |
|---|---|
| \(\rho = +1\) | 완전 양의 선형관계 |
| \(\rho = -1\) | 완전 음의 선형관계 |
| \(\rho = 0\) | 선형관계 없음 (독립을 의미하지 않음!) |
| \(0 < \rho < 1\) | 양의 선형관계 (값이 클수록 강함) |
| \(-1 < \rho < 0\) | 음의 선형관계 (절댓값이 클수록 강함) |
4. 회귀분석과 상관관계의 연결
상관관계와 선형 의존성을 연결하는 핵심 도구가 회귀분석(Regression)입니다. 표준 회귀식 \(Y_i = \alpha + \beta X_i + \varepsilon_i\)에서, 만약 \(X\)와 \(Y\)를 각각 평균 0, 분산 1로 표준화(Standardize)하면, 회귀 기울기 \(\beta\)가 곧 상관계수와 같아집니다:
이 관계는 상관계수가 본질적으로 "표준화된 회귀 기울기"라는 것을 보여줍니다. 상관이 높다는 것은 \(X\)의 변화가 \(Y\)의 변화를 선형적으로 잘 설명한다는 의미입니다.
이것은 틀린 명제입니다. 상관계수 0은 "선형 관계가 없다"는 의미일 뿐, "완전히 독립이다"를 의미하지 않습니다. 예를 들어 \(X\)와 \(Y = X^2\)의 관계에서, \(X\)가 대칭 분포를 따르면 상관계수는 0이지만, \(Y\)는 \(X\)에 완벽하게 (비선형적으로) 의존합니다.
독립 → 상관 0 (참) vs 상관 0 → 독립 (거짓)
LO 23.h: 의존성 측정을 위한 다양한 상관 측도의 비교
1. 비선형 의존성의 문제
피어슨 상관계수는 선형(Linear) 의존성만 포착합니다. 그러나 금융시장에서는 비선형적 의존 관계가 매우 흔합니다. 예를 들어, 시장 위기 시에는 평상시보다 상관관계가 급격히 높아지는 비대칭적 꼬리 의존성(Asymmetric Tail Dependence)이 관찰됩니다.
비선형 의존성을 측정하기 위해 Spearman 순위상관(Rank Correlation)과 Kendall's \(\tau\)(tau)가 사용됩니다. 이 두 측도의 공통 성질은 다음과 같습니다:
- 값의 범위: \(-1 \leq \text{값} \leq 1\)
- 두 변수가 완전히 독립이면 0
- 스케일 불변(Scale Invariant): 변수의 단위 변환에 영향 받지 않음
- 변수 간 관계가 증가(감소)하면 양(음)의 값
2. Spearman 순위상관 (Spearman's Rank Correlation)
Spearman 순위상관은 관측값 자체가 아닌 순위(Rank)에 대해 피어슨 상관계수를 계산하는 방법입니다. 원래 변수의 값 대신 순위를 사용함으로써, 이상치(Outlier)에 덜 민감하다는 중요한 장점을 가집니다.
계산 절차는 다음과 같습니다. 두 변수 \(X\)와 \(Y\)에 대해 각각 \(n\)개의 관측값이 있을 때, 각 변수의 관측값을 크기순으로 순위를 매기고, 순위 간의 상관을 계산합니다.
여기서:
- \(d_i = \text{Rank}_{X_i} - \text{Rank}_{Y_i}\): 각 관측치에서 두 변수 순위의 차이
- \(n\): 관측값의 개수
- \(\rho_s\) 가 1에 가까움: \(X\)의 높은 순위 값과 \(Y\)의 높은 순위 값이 함께 짝지어짐 (강한 양의 의존)
- \(\rho_s\) 가 -1에 가까움: 한 변수의 높은 순위 값이 다른 변수의 낮은 순위 값과 짝지어짐 (강한 음의 의존)
- \(\rho_s\) 가 0에 가까움: 순위 간에 체계적 관계가 없음
- 선형상관과 순위상관이 크게 다르다면, 중요한 비선형 관계가 존재할 가능성이 높음
예시 6: Spearman 순위상관 계산
주식 X와 Y의 4년간 수익률이 다음과 같을 때, Spearman 순위상관을 계산하시오.
| 연도 | X 수익률 | Y 수익률 | Rank X | Rank Y | \(d_i\) | \(d_i^2\) |
|---|---|---|---|---|---|---|
| 1 | -10% | 5% | 1 | 3 | -2 | 4 |
| 2 | -5% | -3% | 2 | 1 | 1 | 1 |
| 3 | 8% | -1% | 3 | 2 | 1 | 1 |
| 4 | 20% | 15% | 4 | 4 | 0 | 0 |
Spearman 순위상관은 0.4로, 순위 기준으로 약한 양의 의존 관계를 나타냅니다.
3. Kendall's \(\tau\) (Tau)
Kendall's \(\tau\)는 일치쌍(Concordant Pair)과 불일치쌍(Discordant Pair)의 상대적 빈도를 측정하는 방법입니다. 두 관측치 쌍 \((X_i, Y_i)\)와 \((X_j, Y_j)\)에 대해:
| 쌍의 유형 | 조건 | 의미 |
|---|---|---|
| 일치쌍 (Concordant) | \(X_i < X_j\)이고 \(Y_i < Y_j\) 또는 \(X_i > X_j\)이고 \(Y_i > Y_j\) |
X와 Y의 순서가 같은 방향 |
| 불일치쌍 (Discordant) | \(X_i < X_j\)이고 \(Y_i > Y_j\) 또는 \(X_i > X_j\)이고 \(Y_i < Y_j\) |
X와 Y의 순서가 반대 방향 |
여기서:
- \(C\) = 일치쌍(Concordant Pairs)의 수
- \(D\) = 불일치쌍(Discordant Pairs)의 수
- \(\binom{n}{2}\) = 총 가능한 쌍의 수
모든 쌍이 일치하면 \(\tau = 1\), 모든 쌍이 불일치하면 \(\tau = -1\)이 됩니다. 일치쌍이 많은 변수들은 강한 양의 의존성을 가지고, 불일치쌍이 많은 변수들은 강한 음의 관계를 가집니다.
예시 7: Kendall's \(\tau\) 계산
주식 X와 Y의 4개 관측값에 대한 순위가 다음과 같을 때, Kendall's \(\tau\)를 계산하시오.
| 관측치 | Rank X | Rank Y |
|---|---|---|
| 1 | 1 | 3 |
| 2 | 2 | 1 |
| 3 | 3 | 2 |
| 4 | 4 | 4 |
총 가능한 쌍의 수: \(\binom{4}{2} = 6\)
각 쌍의 일치/불일치 여부를 확인합니다:
| 쌍 (i, j) | X 순서 | Y 순서 | 판정 |
|---|---|---|---|
| (1, 2) | 1 < 2 | 3 > 1 | 불일치 |
| (1, 3) | 1 < 3 | 3 > 2 | 불일치 |
| (1, 4) | 1 < 4 | 3 < 4 | 일치 |
| (2, 3) | 2 < 3 | 1 < 2 | 일치 |
| (2, 4) | 2 < 4 | 1 < 4 | 일치 |
| (3, 4) | 3 < 4 | 2 < 4 | 일치 |
일치쌍(C) = 4, 불일치쌍(D) = 2
$$\tau = \frac{4 - 2}{6} = \frac{2}{6} \approx 0.33$$Kendall's \(\tau = 0.33\)으로, 약한 양의 의존 관계를 나타냅니다.
| 특성 | Spearman 순위상관 | Kendall's \(\tau\) |
|---|---|---|
| 측정 대상 | 순위 간 선형관계의 강도 | 일치/불일치 쌍의 상대적 빈도 |
| 계산 방식 | 순위에 대한 피어슨 상관 계산 | 모든 쌍을 일치/불일치로 분류 |
| 이상치 민감도 | 피어슨보다 덜 민감 | 피어슨보다 덜 민감 |
| 값 범위 | [-1, 1] | [-1, 1] |
| 비선형 의존성 | 포착 가능 | 포착 가능 |
LO 23.g: 양의 정부호와 상관행렬의 구조
1. 양의 정부호 (Positive Definiteness)
모든 확률변수가 단위분산(분산 = 1)을 가질 때, 상관행렬(Correlation Matrix)과 공분산행렬(Covariance Matrix)은 동일해집니다. 유효한 상관행렬이 되기 위해서는 양의 정부호(Positive Definiteness) 조건을 만족해야 합니다.
양의 정부호란, 어떤 가중치 벡터 \(\mathbf{w}\)에 대해서도 포트폴리오의 분산이 반드시 양수(Positive)여야 한다는 조건입니다:
여기서 \(\Sigma\)는 공분산(상관)행렬
이 조건이 위반되면, 어떤 포트폴리오 조합에서 분산이 음수가 되는 비현실적인 상황이 발생합니다. 이는 최적화, 시뮬레이션, Cholesky 분해 등에서 수치적 문제를 야기합니다.
2. 양의 정부호를 보장하는 구조적 상관
상관행렬이 양의 정부호가 되도록 보장하기 위해 두 가지 구조적 접근법이 일반적으로 사용됩니다:
| 구조 | 정의 | 조건 |
|---|---|---|
| 등상관 (Equicorrelation) | 모든 비대각 상관계수를 동일한 값 \(\rho\)로 설정 | 양의 정부호를 위해 \(\rho\)에 제약 필요 (예: \(n\)개 자산에서 \(\rho > -\frac{1}{n-1}\)) |
| 공통요인 구조 (Common Factor) |
상관이 공통 요인 노출에서 기인한다고 가정 \(\rho_{i,j} = Y_i \cdot Y_j\) |
각 요인 적재값 \(Y_i\)가 \(-1\)과 \(1\) 사이 |
MODULE QUIZ
Module Quiz 23.1
문제 1. 단순수익률이 5.00%일 때, 로그수익률은 다음 중 어느 값에 가장 가까운가?
A. 4.88%
B. 5.00%
C. 5.05%
D. 5.13%
문제 2. Black-Scholes-Merton(BSM) 가격결정모형을 사용하여 내재변동성을 계산하는 것에 관한 다음 설명 중 올바른 것은?
A. 옵션 가격은 계산에 필요하지 않다
B. 분산은 시간에 따라 일정하다고 가정한다
C. 잔존만기는 계산의 구성요소가 아니다
D. 현재 자산가격은 계산에서 일정하게 유지되어야 한다
Module Quiz 23.2
문제 1. 정규분포와 비교할 때, 금융수익률은 비정규분포를 따르는 경향이 있으며, 이 분포는 다음과 같은 특성을 가진다:
A. 얇은 꼬리
B. 3보다 큰 첨도
C. 최소한의 왜도 또는 왜도 없음
D. 대칭 분포
문제 2. Jarque-Bera(JB) 검정 통계량에 관한 다음 설명 중 가장 정확한 것은?
A. 귀무가설은 왜도가 0이 아니라고 진술한다
B. 대립가설은 첨도가 3과 같다고 진술한다
C. JB 통계량이 높으면 대립가설이 기각될 가능성이 높다
D. JB 통계량이 매우 작으면 귀무가설이 기각되지 않을 가능성이 높다
문제 3. 멱법칙(Power Law) 꼬리에 관한 다음 설명 중 가장 정확한 것은?
A. 더 많은 관측값이 평균에 가깝게 위치한다
B. 표준정규분포는 멱법칙 꼬리를 나타낸다
C. 꼬리가 정규분포의 꼬리보다 더 빠르게 감소한다
D. 정규분포의 꼬리보다 더 "두꺼운" 꼬리를 가진다
Module Quiz 23.3
문제 1. 한 분석가가 Spearman 순위상관을 0.48로 계산했다. 이 결과는 다음을 나타낸다:
A. 양의 선형 상관
B. 음의 선형 상관
C. 양의 비선형 의존성
D. 음의 비선형 의존성
문제 2. 다음 중 상관행렬에서 등상관(Equicorrelation)을 나타내는 상황은?
A. 모든 상관이 1과 같다
B. 상관이 0이 아닌 변수들
C. 음의 결정계수를 가진 변수들
D. 세 변수가 서로 1.25의 상관을 가진다
정답 및 해설
| 문제 | 정답 | 해설 |
|---|---|---|
| 23.1-1 | A | 변환 공식 \(r = \ln(1 + R) = \ln(1.05) = 0.04879 \approx 4.88\%\). 로그수익률은 항상 단순수익률보다 작습니다. |
| 23.1-2 | B | BSM 모형의 한계 중 하나는 분산이 시간에 따라 일정하다고 가정하는 것입니다. 옵션 가격과 잔존만기는 모두 계산에 필요하며, 현재 자산가격이 일정할 필요는 없습니다. |
| 23.2-1 | B | 비정규분포는 양 또는 음의 왜도와 3보다 큰 첨도(양의 초과첨도)를 가질 가능성이 높습니다. 정규분포가 얇은 꼬리, 첨도 3, 왜도 없음, 대칭 분포를 가집니다. |
| 23.2-2 | D | JB 통계량이 매우 작으면 귀무가설(정규분포)을 기각하지 않을 가능성이 높습니다. 귀무가설은 왜도 = 0, 첨도 = 3입니다. JB가 높으면 귀무가설이 기각됩니다(대립가설이 아님). |
| 23.2-3 | D | 멱법칙 꼬리는 정규분포의 꼬리보다 더 "두꺼운(fatter)" 꼬리를 가집니다. 평균에서 먼 관측값이 더 자주 발생하고, 꼬리가 더 느리게 감소합니다. 표준정규분포는 멱법칙 꼬리를 나타내지 않습니다. |
| 23.3-1 | C | Spearman 순위상관은 비선형 의존성을 측정하는 방법입니다. 0.48은 양수이므로 양의 비선형 의존성을 나타냅니다. (피어슨이 아닌 순위상관이므로 "선형"이 아닌 "비선형") |
| 23.3-2 | A | 등상관은 상관행렬의 모든 비대각 원소가 동일한 값인 구조입니다. 모든 상관이 1인 것은 등상관의 특수한 경우입니다. 결정계수(\(R^2\))는 음수가 될 수 없으며, 상관계수는 1을 초과할 수 없습니다. |
KEY CONCEPTS (핵심 개념 정리)
LO 23.a 핵심
- 단순수익률: \(R_t = (P_t - P_{t-1}) / P_{t-1}\), 다기간 누적은 \((1+R)\)의 곱
- 로그수익률: \(r_t = \ln(P_t / P_{t-1}) = \ln(1+R_t)\), 다기간 누적은 합
- 변환: \(1 + R_t = e^{r_t}\), 단순수익률이 항상 로그수익률보다 큼
- 로그수익률은 짧은 시간 범위에서 더 적절하며, 큰 수익률에서는 단순수익률과의 차이가 커짐
LO 23.b 핵심
- 변동성(\(\sigma\)): 수익률의 표준편차. 분산율(\(\sigma^2\)): 변동성의 제곱
- 연환산: \(\sigma_{\text{annual}} = \sigma_{\text{daily}} \times \sqrt{252}\) 또는 \(\sigma_{\text{monthly}} \times \sqrt{12}\)
- 내재변동성: 옵션가격에서 역으로 추출한 연간 변동성
- BSM의 한계: 분산이 시간에 따라 일정하다고 가정
- VIX: S&P 500의 30일 전방향 내재변동성 지표
LO 23.c 핵심
- 정규분포: 평균과 분산(1, 2차 모멘트)으로 완전 기술. 왜도 = 0, 첨도 = 3
- 금융수익률: 비정규분포를 따르는 경우가 많음. 왜도 ≠ 0, 초과첨도 > 0
- 대부분의 주식은 음의 왜도(폭락 위험), 양의 초과첨도(팻테일)를 보임
LO 23.d 핵심
- JB 검정: 정규성 검정. \(H_0\): \(S=0\) 그리고 \(K=3\)
- JB 통계량: \(\frac{T}{6}(S^2 + (K-3)^2/4)\), \(\chi^2(2)\) 근사
- JB가 작으면 정규성 비기각, JB가 크면 정규성 기각
- 임계값: 5% → 5.99, 1% → 9.21
LO 23.e 핵심
- 멱법칙: \(P(X > x) = kx^{-\alpha}\), 팻테일의 수학적 표현
- \(\alpha\)가 작을수록 꼬리가 두꺼움 (극단 손실 확률 증가)
- Student's t-분포가 멱법칙 꼬리의 대표 예시
LO 23.f, 23.h 핵심
- 상관계수: 두 변수 간 선형 관계 측정. 공분산: 방향적 관계 측정
- 상관 0 ≠ 독립 (비선형 의존이 존재할 수 있음)
- Spearman: 순위에 대한 상관, 이상치에 덜 민감
- Kendall's \(\tau\): 일치쌍/불일치쌍의 빈도 차이
- 두 측도 모두 [-1, 1] 범위, 스케일 불변, 비선형 의존성 포착 가능
LO 23.g 핵심
- 양의 정부호: 모든 가중 조합의 분산이 양수여야 함
- 등상관(Equicorrelation): 모든 비대각 상관을 동일 값으로 설정
- 공통요인 구조: \(\rho_{i,j} = Y_i Y_j\)로 상관 결정
시험 대비 한 줄 암기 체크리스트
| 주제 | 암기 포인트 |
|---|---|
| 단순 vs 로그 수익률 누적 | 단순 = 곱(Product), 로그 = 합(Sum) |
| 수익률 크기 비교 | 단순수익률 > 로그수익률 (항상) |
| 변환 공식 | \(1 + R = e^r\), \(r = \ln(1+R)\) |
| 연환산 변동성 (일간) | \(\sigma_{\text{ann}} = \sigma_d \times \sqrt{252}\) |
| BSM 관측 불가 변수 | 연간 분산(변동성)만 관측 불가, 나머지 관측 가능 |
| BSM 핵심 가정 한계 | 분산이 시간에 따라 일정하다고 가정 |
| VIX 측정 기간 | 향후 30일 (달력일) |
| 정규분포 4대 특성 | 대칭, 얇은 꼬리, 왜도=0, 첨도=3 |
| JB 검정 귀무가설 | \(S = 0\) 그리고 \(K = 3\) (정규분포) |
| JB 임계값 | 5% → 5.99, 1% → 9.21 |
| JB 판정 | JB 작으면 비기각(정규), 크면 기각(비정규) |
| 멱법칙 \(\alpha\) | \(\alpha\) 작을수록 꼬리 두꺼움 |
| 상관 0과 독립 | 상관 0 ≠ 독립! (비선형 의존 가능) |
| Spearman 특징 | 순위 기반, 이상치에 덜 민감, 비선형 의존 측정 |
| Kendall's \(\tau\) | 일치쌍 vs 불일치쌍 빈도 차이 측정 |
| 양의 정부호 | 모든 가중 조합의 분산 > 0 |
| 등상관 | 모든 비대각 상관이 동일한 값 |
'취준 > FRM part1' 카테고리의 다른 글
| FRM part1. Reading 25: Machine Learning Methods (0) | 2026.02.11 |
|---|---|
| FRM part1. Reading 24: Simulation and Bootstrapping (0) | 2026.02.11 |
| FRM part1. Reading 22: Non-Stationary Time Series (0) | 2026.02.11 |
| FRM part1. Reading 21: Stationary Time Series (0) | 2026.02.11 |
| FRM part1. Reading 20: Regression Diagnostics (0) | 2026.02.11 |