Vasicek 이자율 모형
Vasicek 모형은 이자율의 평균회귀(mean reversion) 현상을 최초로 수학적으로 포착한 이자율 모형으로서, 현대 금융공학에서 가장 근본적인 위치를 차지한다. 1977년 체코슬로바키아 출신의 수학자 올드리히 바시첵(Oldřich Vašíček)이 발표한 이 모형은, 물리학에서 유래한 Ornstein–Uhlenbeck(OU) 과정을 금리의 동학에 적용하여, 이자율이 장기 균형 수준 주변에서 확률적으로 변동하는 현실을 기술한다. 이 글에서는 확률미분방정식(SDE)의 기초가 되는 브라운 운동과 이토 미적분학(Itô calculus)부터 출발하여, Vasicek 모형의 정의와 해, 조건부분포, 할인채 가격의 닫힌형(closed-form) 유도, 선도이자율 및 일드곡선 분석, 그리고 수치적 응용과 한계에 이르기까지 전 과정을 점진적으로 전개한다. 모든 핵심 결과에 대해서는 증명을 포함하였으며, 각 단계에서 왜 그러한 수학적 도구가 필요한지를 직관적으로 설명하는 데 중점을 두었다.
Part 1. 확률미분방정식(SDE) 기초
Vasicek 모형은 확률미분방정식(Stochastic Differential Equation, SDE)으로 기술된다. SDE를 이해하려면 먼저 그 "엔진"에 해당하는 브라운 운동이 무엇인지, 그리고 브라운 운동을 다룰 때 일반적인 미적분학과 무엇이 달라지는지를 명확히 파악해야 한다. 이 파트에서는 브라운 운동의 정의와 성질을 설명한 뒤, 확률미적분에서 핵심적인 역할을 하는 이차변동과 이토 곱셈 규칙을 유도하고, 최종적으로 SDE의 일반적 형태를 소개한다.
1.1 브라운 운동(Brownian Motion)
1.1.1 역사적 배경
브라운 운동(Brownian motion)은 금융공학에서 가장 근본적인 확률과정(stochastic process)이다. 이 이름은 1827년 스코틀랜드의 식물학자 로버트 브라운(Robert Brown)에서 유래하였다. 브라운은 현미경을 통해 물 위에 떠 있는 꽃가루 입자들이 끊임없이, 그리고 예측 불가능하게 움직이는 현상을 관찰하였다. 당시에는 이 현상의 원인을 설명할 수 없었으나, 1905년 알베르트 아인슈타인이 물 분자들의 무작위 충돌이 이 현상을 일으킨다는 이론적 설명을 제시하면서 수학적 기초가 확립되었고, 이후 노르베르트 위너(Norbert Wiener)에 의해 엄밀한 수학적 구성이 완성되었다.
금융공학에서 브라운 운동은 연속시간 확률과정의 표준적인 "잡음(noise)" 역할을 한다. 주가, 이자율, 환율 등 금융변수들의 예측 불가능한 무작위적 변동을 모델링할 때, 그 변동의 원천으로 브라운 운동을 사용하는 것이다. 만약 브라운 운동이라는 도구가 없었다면, 금융 모형은 모두 결정론적(deterministic)이 되어 현실의 불확실성을 전혀 반영하지 못하게 된다. 따라서 브라운 운동을 이해하는 것은 확률적 이자율 모형의 첫 번째 단계이다.
1.1.2 수학적 정의
브라운 운동은 확률공간 \((\Omega, \mathcal{F}, P)\)와 정보의 흐름을 나타내는 필트레이션(filtration) \(\{\mathcal{F}_t\}\) 위에서 정의된다. 구체적으로, 다음의 네 가지 성질을 동시에 만족하는 확률과정 \(\{W(t)\}_{t \ge 0}\)을 표준 브라운 운동이라 부른다.
브라운 운동의 네 가지 성질
성질 1 — 시작점 조건: \(W(0) = 0\)이다. 브라운 운동은 항상 원점에서 출발한다. 이것은 일종의 정규화(normalization) 조건으로, "시간 0에서 아직 아무런 무작위적 변동도 일어나지 않았다"는 것을 의미한다. 만약 다른 출발점 \(x_0\)에서 시작하는 과정이 필요하다면, 단순히 \(x_0 + W(t)\)로 이동시키면 된다.
성질 2 — 독립 증분(Independent Increments): 서로 겹치지 않는(non-overlapping) 시간 구간에서의 증분(increment)들은 통계적으로 서로 독립이다. 구체적으로, \(0 \le t_1 < t_2 \le t_3 < t_4\)일 때 \(W(t_2) - W(t_1)\)와 \(W(t_4) - W(t_3)\)는 통계적으로 독립이다. 이 성질의 의미는 심오하다. 과거의 움직임을 아무리 자세히 분석하더라도 미래의 움직임에 대한 어떠한 정보도 얻을 수 없다는 것이며, 이는 금융에서 효율적 시장 가설(Efficient Market Hypothesis)의 수학적 표현이기도 하다.
성질 3 — 정규분포 증분(Gaussian Increments): 시점 \(s\)에서 시점 \(t\)까지의 증분은 평균이 0이고 분산이 \((t-s)\)인 정규분포를 따른다. 즉, \(W(t) - W(s) \sim N(0, t-s)\)이다. 평균이 0이라는 것은 브라운 운동 자체에 어떤 방향으로의 편향(drift)도 없다는 뜻이다. 분산이 \((t-s)\)에 비례하므로 표준편차는 \(\sqrt{t-s}\)에 비례하며, 이는 불확실성이 시간의 제곱근에 비례하여 증가함을 의미한다. 이 "제곱근 스케일링"은 금융에서 매우 중요한 개념으로, 예를 들어 연간 변동성 20%를 일간 변동성으로 환산할 때 \(20\%/\sqrt{252} \approx 1.26\%\)가 되는 근거이기도 하다.
성질 4 — 연속 경로(Continuous Paths): 확률 1로(almost surely) 경로 \(t \mapsto W(t)\)가 연속이다. 즉, 점프(jump)나 불연속점이 존재하지 않는다. 그러나 흥미롭게도 이 경로는 어디에서도 미분 가능하지 않다(nowhere differentiable). 경로는 끊어지지 않지만 너무나 "거칠어서" 어떤 점에서도 접선을 그을 수 없다는 것이다. 바로 이 성질 때문에 일반적인 미적분학(뉴턴-라이프니츠 체계)을 브라운 운동에 그대로 적용할 수 없으며, 이토 미적분(Itô calculus)이라는 완전히 새로운 체계가 필요하게 된다.
1.1.3 미분 형태 \(dW\)의 직관적 이해
확률미분방정식에서는 브라운 운동의 "미분"을 형식적으로 \(dW(t) := W(t + dt) - W(t)\)로 정의한다. 성질 3(정규분포 증분)에 의해 \(dW(t) \sim N(0, dt)\)이므로, \(dW(t)\)의 표준편차는 \(\sqrt{dt}\)이다.
이 점이 확률미적분과 일반 미적분의 근본적인 차이를 만든다. 일반적인 미적분학에서 변수 \(x\)의 변화량 \(dx\)는 \(dt\)와 같은 크기(order)를 가진다. 그런데 확률미적분에서 \(dW\)의 "크기(스케일)"는 \(\sqrt{dt}\)이며, \(dt\)가 매우 작을 때 \(\sqrt{dt}\)는 \(dt\)보다 훨씬 크다. 구체적인 예를 들면, \(dt = 0.0001\)일 때 \(\sqrt{dt} = 0.01\)로, \(dW\)는 \(dt\)의 100배나 "큰" 크기를 가진다. 이 스케일 차이가 이토 미적분의 핵심이며, 테일러 전개에서 2차항을 무시할 수 없게 만드는 근본적인 이유이다. 이 점은 Part 2에서 이토 공식을 유도할 때 결정적인 역할을 하게 된다.
1.2 이차변동과 이토 곱셈 규칙
1.2.1 이차변동(Quadratic Variation)
이차변동은 "브라운 운동의 경로가 얼마나 거칠게 움직이는가"를 정량적으로 측정하는 도구이다. 직관적으로, 매끄러운 함수의 경로는 잘게 쪼갤수록 각 조각의 변화량이 매우 작아져서, 변화량의 제곱합은 0으로 수렴한다. 그러나 브라운 운동의 경로는 너무 거칠기 때문에, 아무리 잘게 쪼개더라도 변화량의 제곱합이 0으로 수렴하지 않고 양수의 값으로 수렴한다.
구체적으로, 시간 구간 \([0, T]\)를 \(n\)개의 동일한 작은 구간으로 나누어 \(0 = t_0 < t_1 < \cdots < t_n = T\), \(\Delta t = T/n\)이라 하자. 각 구간에서의 증분을 제곱하여 모두 더한 값, 즉 이차변동은 다음과 같이 수렴한다.
일반적인 매끄러운 함수 \(f(t)\)에 대해서는 같은 합이 \(\sum(f(t_i) - f(t_{i-1}))^2 \to 0\)으로 수렴하는데, 브라운 운동에서는 0이 아닌 양수 \(T\)로 수렴한다는 것이 핵심이다. 이것이 바로 브라운 운동 경로의 "거칠음"을 수학적으로 표현한 것이며, 이토 미적분이 존재하는 근본적인 이유이기도 하다.
이차변동이 \(T\)로 수렴하는 증명
증명의 전략은 다음과 같다. 먼저 이차변동의 기대값이 정확히 \(T\)임을 보이고, 그 다음 분산이 \(n \to \infty\)에서 0으로 수렴함을 보인다. 기대값이 \(T\)이면서 분산이 0이라면, 체비셰프 부등식에 의해 이차변동은 확률적으로 \(T\)에 수렴한다.
기대값 계산. 각 증분 \(\Delta W_i = W(t_i) - W(t_{i-1})\)는 정규분포 \(N(0, \Delta t)\)를 따른다. 정규분포의 성질에 의해 \(E[(\Delta W_i)^2] = \text{Var}(\Delta W_i) = \Delta t\)이다. \(n\)개의 구간에 대해 합하면, 기대값의 선형성에 의해 다음을 얻는다.
$$E\!\left[\sum_{i=1}^{n}(\Delta W_i)^2\right] = \sum_{i=1}^{n} E[(\Delta W_i)^2] = n \cdot \Delta t = n \cdot \frac{T}{n} = T$$분산 계산. 정규분포의 4차 모멘트 공식을 사용한다. \(Z \sim N(0, \sigma^2)\)이면 \(E[Z^4] = 3\sigma^4\)이다. 이 공식을 적용하면 \(E[(\Delta W_i)^4] = 3(\Delta t)^2\)이고, 따라서 각 항의 분산은 다음과 같이 계산된다.
$$\text{Var}[(\Delta W_i)^2] = E[(\Delta W_i)^4] - \bigl(E[(\Delta W_i)^2]\bigr)^2 = 3(\Delta t)^2 - (\Delta t)^2 = 2(\Delta t)^2$$독립 증분 성질에 의해 각 \((\Delta W_i)^2\)는 서로 독립이므로, 합의 분산은 개별 분산의 합이 된다.
$$\text{Var}\!\left[\sum_{i=1}^{n}(\Delta W_i)^2\right] = n \cdot 2(\Delta t)^2 = 2n \cdot \frac{T^2}{n^2} = \frac{2T^2}{n} \;\to\; 0 \quad (n \to \infty)$$기대값은 정확히 \(T\)이고 분산은 0으로 수렴하므로, 체비셰프 부등식 \(P(|X - EX| > \epsilon) \le \text{Var}(X)/\epsilon^2\)에 의해 이차변동은 확률적으로 \(T\)에 수렴한다. \(\blacksquare\)
이 결과를 미분 형태로 쓰면 다음과 같은 중요한 계산 규칙을 얻는다.
핵심: \((dW)^2\)은 비록 형식적으로는 확률변수이지만, 위의 증명에서 보았듯이 기대값이 \(dt\)이고 분산이 0에 가까우므로, 실질적으로 결정론적 상수 \(dt\)처럼 취급할 수 있다. 이것이 확률미적분에서 가장 중요한 단 하나의 규칙이며, 이토 공식의 "보정항"이 등장하는 근본적 원인이다.
1.2.2 이토 곱셈 규칙
위의 이차변동 결과와 크기 분석을 종합하면, 확률미적분에서 사용하는 곱셈 규칙을 체계적으로 정리할 수 있다. 먼저 \((dt)^2\)은 \(dt\)보다 훨씬 작은 고차항이므로 0으로 취급한다. 다음으로 \(dt \cdot dW\)는 크기가 \(dt \cdot \sqrt{dt} = (dt)^{3/2}\)이므로 역시 무시할 수 있다. 마지막으로 \((dW)^2\)은 이차변동에 의해 상수 \(dt\)로 수렴하므로, 0이 아닌 유일한 2차 항이다.
| 곱 | 결과 | 이유 |
|---|---|---|
| \((dt)^2\) | \(0\) | \(dt\)보다 훨씬 작은 고차항 |
| \(dt \cdot dW\) | \(0\) | \((dt)^{3/2}\) 크기이므로 무시 가능 |
| \((dW)^2\) | \(dt\) | 이차변동에 의해 상수 \(dt\)로 수렴 |
핵심 통찰: 일반 미적분에서는 \((dx)^2\)을 항상 무시할 수 있지만, 확률미적분에서는 \((dW)^2 = dt\)를 무시할 수 없다. 이 단 하나의 차이가 이토 미적분 전체를 지배한다. 다시 말해, 이토 미적분의 존재 이유는 결국 \((dW)^2 = dt \neq 0\)이라는 사실로 귀결되며, 이 단순한 규칙으로부터 이토 공식, 이토 적분의 성질, 나아가 금융에서의 볼록성 보정 등 모든 결과가 파생된다.
1.3 확률미분방정식의 일반적 형태
확률미분방정식(SDE)은 결정론적 변화와 확률론적 변화를 동시에 기술하는 방정식으로, 다음과 같은 일반적 형태를 가진다.
이 방정식의 우변은 두 개의 항으로 구성되어 있으며, 각각은 매우 다른 성격의 변화를 기술한다. 첫째 항 \(\mu(t, X(t))\,dt\)는 드리프트 항(drift term)이라 부른다. 이 항은 확률과정의 결정론적 추세, 즉 예측 가능한 체계적 변화를 나타낸다. 예를 들어 이자율이 장기적으로 5%를 향해 되돌아가는 경향이 있다면, 이 드리프트 항이 그 경향을 기술한다. \(dt\)에 비례하므로 이 항은 "예측 가능한" 부분이며, 시간이 흐름에 따라 선형적으로 누적된다.
둘째 항 \(\sigma(t, X(t))\,dW(t)\)는 확산 항(diffusion term)이라 부른다. 이 항은 확률적 변동의 크기와 성격을 결정한다. 계수 \(\sigma\)는 변동성(volatility)에 해당하며, 이 값이 클수록 확률과정의 무작위적 변동 폭이 커진다. \(dW(t)\)가 무작위성의 원천이다. \(dW\)의 크기가 \(\sqrt{dt}\)이므로, 확산 항은 매우 짧은 시간 간격에서 드리프트 항보다 지배적이 된다. 이것이 고빈도 데이터에서 추세보다 잡음이 더 크게 보이는 이유의 수학적 설명이다.
이 SDE는 적분형으로도 동치하게 표현할 수 있다. 즉, \(X(t) = X(0) + \int_0^t \mu(s, X(s))\,ds + \int_0^t \sigma(s, X(s))\,dW(s)\)이다. 여기서 첫 번째 적분은 일반적인 리만 적분(Riemann integral)이고, 두 번째 적분은 이토 적분(Itô integral)이라는 특별한 확률적분이다. Vasicek 모형은 이 일반적 SDE의 구체적인 한 가지 사례로서, 드리프트 함수 \(\mu\)에 평균회귀 구조를 부여한 것이다.
Part 2. 이토 공식(Itô's Lemma)
2.1 왜 이토 공식이 필요한가?
일반적인 미적분학에서 \(y = f(x)\)이고 \(x\)가 \(t\)의 매끄러운 함수일 때, 체인룰(chain rule)은 \(dy = f'(x)\,dx\)로 매우 간단하다. 이 공식은 함수의 변화량을 변수의 변화량으로 표현해 주므로, 물리학과 공학에서 수없이 많은 문제를 해결하는 핵심 도구이다.
그런데 \(x\)가 브라운 운동을 포함하는 확률과정일 때, 이 체인룰은 더 이상 정확하지 않다. 그 이유는 본질적으로 매우 단순하면서도 심오하다.
체인룰이 실패하는 근본적 이유: 일반 미적분에서는 \(dx\)가 \(dt\)와 같은 크기를 가지므로, 테일러 전개의 2차항 \((dx)^2\)은 \((dt)^2\)에 비례하여 \(dt\)보다 훨씬 작아진다. 따라서 2차항을 무시하고 1차항만 남겨도 정확한 결과를 얻는다. 그러나 확률미적분에서는 \(dX\)가 \(dW\)를 포함하면 그 크기가 \(\sqrt{dt}\)가 되므로, \((dX)^2\)의 크기가 \(dt\)에 비례한다. \(dt\)는 무시할 수 없는 크기이므로, 테일러 전개의 2차항을 반드시 포함시켜야 한다. 이것이 체인룰이 실패하는 이유이며, 동시에 이토 공식이 존재하는 이유이다.
2.2 이토 공식의 유도
확률과정 \(X(t)\)가 SDE \(dX = \mu\,dt + \sigma\,dW\)를 만족하고, \(f(t,x)\)가 \(t\)에 대해 1번, \(x\)에 대해 2번 연속 미분 가능한 클래스 \(C^{1,2}\) 함수라고 하자. 우리의 목표는 합성함수 \(Y(t) = f(t, X(t))\)의 SDE를 구하는 것이다.
Step 1: 테일러 전개
\(f(t, X(t))\)의 테일러 전개를 2차항까지 수행하면 다음과 같다.
$$df = f_t\,dt + f_x\,dX + \tfrac{1}{2}f_{tt}(dt)^2 + \tfrac{1}{2}f_{xx}(dX)^2 + f_{tx}\,dt\,dX + \cdots$$Step 2: 각 항의 크기 분석
\(dW \sim \sqrt{dt}\)이므로 \(dX = \mu\,dt + \sigma\,dW\)의 크기는 \(\sqrt{dt}\)이다. 이로부터 테일러 전개의 각 항이 \(dt\)의 크기까지 기여하는지를 판별할 수 있다. \(f_t\,dt\)는 크기가 \(dt\)이므로 기여하고, \(f_x\,dX\)는 \(\sqrt{dt}\) 크기이므로 역시 기여한다. 한편 \(\frac{1}{2}f_{tt}(dt)^2\)은 \((dt)^2\) 크기이므로 무시할 수 있고, \(f_{tx}\,dt\,dX\)는 \((dt)^{3/2}\) 크기이므로 역시 무시할 수 있다. 결정적으로, \(\frac{1}{2}f_{xx}(dX)^2\)은 \((dX)^2 \sim dt\) 크기이므로 무시할 수 없으며 반드시 포함해야 한다. 이것이 일반 체인룰과의 유일한 차이이다.
Step 3: \((dX)^2\)의 명시적 계산
\(dX = \mu\,dt + \sigma\,dW\)를 제곱하면 \((dX)^2 = \mu^2(dt)^2 + 2\mu\sigma\,dt\,dW + \sigma^2(dW)^2\)이다. 여기에 이토 곱셈 규칙을 적용하면, 첫째 항 \(\mu^2(dt)^2\)은 고차항이므로 사라지고, 둘째 항 \(2\mu\sigma\,dt\,dW\)는 \((dt)^{3/2}\) 크기이므로 사라지며, 셋째 항 \(\sigma^2(dW)^2\)만 이차변동에 의해 \(\sigma^2\,dt\)로 남는다.
이 결과는 직관적으로도 의미가 있다. \((dX)^2\)에서 드리프트 \(\mu\)는 완전히 사라지고 오직 확산 계수 \(\sigma\)만 남는다는 것은, 매우 짧은 시간 간격에서는 "평균적 추세"보다 "무작위 변동"이 지배적이라는 물리적 사실의 수학적 표현이다.
2.3 이토 공식의 최종형
Step 1–3의 분석을 종합하면, 기여하는 항만 남겨서 다음의 이토 공식(Itô's Lemma)을 얻는다.
고전적 체인룰 \(df = f_t\,dt + f_x\,dX\)와 비교하면, 이토 공식에는 \(\frac{1}{2}\sigma^2 f_{xx}\,dt\)라는 추가항이 등장한다. 이것을 이토 보정항(Itô correction term)이라 부른다. 이 보정항은 변동성 \(\sigma\)와 함수의 2차 도함수 \(f_{xx}\)(즉 볼록성)의 곱으로 구성되어 있다.
이토 보정항의 직관적 의미: 이 항은 함수 \(f\)의 볼록성(convexity) 효과를 반영한다. \(f_{xx} > 0\)인 볼록함수에 대해서는 보정항이 양수로, 확률적 변동이 함수값의 기대값을 끌어올리는 효과를 낳는다. 반대로 \(f_{xx} < 0\)인 오목함수에서는 보정항이 음수로, 확률적 변동이 함수값의 기대값을 끌어내린다. 이것이 금융에서 유명한 "볼록성 편향(convexity bias)"의 수학적 근거이며, Vasicek 모형에서 할인채 가격의 볼록성 보정이 등장하는 이유이기도 하다.
Vasicek 모형에서의 핵심적 활용: Part 8에서 Vasicek SDE를 풀 때, 적분인자 \(e^{bu}\)를 곱한 함수 \(f(u, R) = e^{bu}R\)에 이토 공식을 적용한다. 이 경우 \(f_{RR} = 0\)이므로 이토 보정항이 사라지지만, Part 12에서 채권가격 \(B(t,T) = \exp(-A(\tau) - C(\tau)R(t))\)에 이토 공식을 적용할 때에는 \(f_{RR} \neq 0\)이므로 보정항이 결정적인 역할을 한다.
Part 3. 이토 적분과 이토 등거리성(Itô Isometry)
3.1 이토 적분의 정의
이토 적분(Itô integral)은 확률과정을 브라운 운동에 대해 "적분"하는 것으로, \(\int_a^b f(u)\,dW(u)\)와 같이 표기한다. 이 적분의 결과는 일반 적분처럼 하나의 "숫자"가 아니라 확률변수라는 점에서 근본적으로 다르다. 리만 적분 \(\int_a^b g(x)\,dx\)는 주어진 함수와 구간에 대해 정해진 하나의 값을 가지지만, 이토 적분은 브라운 운동의 경로가 어떻게 실현되느냐에 따라 서로 다른 값을 가질 수 있다. 같은 확률 실험을 여러 번 반복하면, 매번 다른 브라운 운동 경로가 생성되고, 따라서 이토 적분의 값도 매번 달라진다.
이토 적분은 리만합(Riemann sum)의 극한으로 정의된다. 구간 \([a,b]\)를 \(a = t_0 < t_1 < \cdots < t_n = b\)로 분할하면 다음과 같다.
여기서 결정적으로 중요한 것은 좌측값(left-endpoint) \(f(t_{i-1})\)을 사용한다는 점이다. 리만 적분에서는 구간의 어느 점을 선택하든(좌측, 우측, 중간점) 극한이 동일하지만, 확률적분에서는 선택에 따라 결과가 달라진다. 좌측값을 사용하는 것이 이토 적분이고, 중간점을 사용하는 것이 스트라토노비치(Stratonovich) 적분이다.
이토 적분에서 좌측값을 사용하는 데에는 깊은 금융적 의미가 있다. 투자자가 시점 \(t_{i-1}\)에서 보유량 \(f(t_{i-1})\)을 결정한 후, 시점 \(t_i\)까지 주가가 \(W(t_i) - W(t_{i-1})\)만큼 변동하는 것을 상상하면 된다. 투자 결정은 반드시 미래의 가격 변동을 관찰하기 전에 내려야 한다는 인과관계의 원칙이 좌측값 사용에 자연스럽게 반영되어 있는 것이다. 이 "미래를 보지 않는(non-anticipative)" 성질은 금융 모형의 물리적 합리성을 보장하는 핵심 조건이다.
3.2 이토 적분의 핵심 성질
성질 1: 기대값이 0 (마팅게일 성질)
이 성질은 이토 적분의 가장 기본적이면서도 중요한 성질이다. 리만합의 각 항 \(f(t_{i-1}) \cdot \Delta W_i\)를 생각하면, \(f(t_{i-1})\)은 시점 \(t_{i-1}\)에서 이미 결정된 값(또는 \(\mathcal{F}_{t_{i-1}}\)-가측인 확률변수)이고, \(\Delta W_i = W(t_i) - W(t_{i-1})\)는 미래의 증분으로 기대값이 0이다. 더구나 좌측값 선택에 의해 \(f(t_{i-1})\)과 \(\Delta W_i\)는 독립이므로, \(E[f(t_{i-1}) \cdot \Delta W_i] = f(t_{i-1}) \cdot E[\Delta W_i] = 0\)이다. 모든 항의 기대값이 0이므로 합의 기대값도 0이고, 극한에서도 이 성질이 보존된다. 금융적으로 이것은 이토 적분으로 구성된 투자전략이 "공정한 게임(fair game)"이라는 것, 즉 기대 손익이 0인 마팅게일이라는 것을 의미한다.
성질 2: 이토 등거리성(Itô Isometry)
좌변은 이토 적분의 "크기의 제곱"에 대한 기대값, 즉 \(L^2\) 노름의 제곱이다. 우변은 피적분함수를 제곱하여 시간에 대해 일반적으로 적분한 것이다. 이 등식이 의미하는 바는 매우 강력하다. 확률적 적분의 "크기"를 계산하기 위해 복잡한 확률론적 분석을 할 필요 없이, 피적분함수의 제곱을 결정론적으로 적분하기만 하면 된다는 것이다. 이름에서 "등거리성(isometry)"이란, 확률공간에서의 \(L^2\) 노름과 시간공간에서의 \(L^2\) 노름 사이에 "거리"가 보존된다는 의미이다. 이토 등거리성은 Vasicek 모형에서 \(I(t,T) = \int_t^T R(u)\,du\)의 분산을 계산할 때 핵심적으로 사용된다.
3.3 이토 등거리성 증명
증명
Step 1. 구간 \([a,b]\)를 \(n\)개로 균등 분할한다. \(\Delta t = (b-a)/n\)으로 두고, 이토 적분을 리만합으로 근사하면 \(\int_a^b f(u)\,dW(u) \approx \sum_{i=1}^{n} f(t_{i-1})\,\Delta W_i\)이다. 여기서 \(\Delta W_i := W(t_i) - W(t_{i-1})\)이다.
Step 2. 이 합을 제곱하면, \((A_1 + A_2 + \cdots + A_n)^2\)을 전개하는 것과 같으므로, 대각항(\(A_i^2\))과 교차항(\(A_i A_j,\; i \neq j\))이 나타난다. 구체적으로 다음과 같이 분리된다.
$$\left(\sum_i f(t_{i-1})\,\Delta W_i\right)^{\!2} = \sum_i f(t_{i-1})^2\,(\Delta W_i)^2 + 2\!\sum_{i < j} f(t_{i-1})\,f(t_{j-1})\,\Delta W_i\,\Delta W_j$$Step 3. 이제 양변의 기대값을 취한다. 대각항의 기대값은 다음과 같다. \(f(t_{i-1})\)이 결정론적 함수(또는 \(\mathcal{F}_{t_{i-1}}\)-가측)이고 \(\Delta W_i \sim N(0, \Delta t)\)이므로 \(E[f(t_{i-1})^2 \cdot (\Delta W_i)^2] = f(t_{i-1})^2 \cdot \Delta t\)이다.
교차항(\(i < j\))의 기대값이 핵심이다. \(\Delta W_i\)와 \(\Delta W_j\)는 서로 다른 시간 구간의 증분이므로, 브라운 운동의 독립 증분 성질에 의해 서로 독립이다. 또한 각각의 기대값이 \(E[\Delta W_i] = 0\)이므로 \(E[\Delta W_i \cdot \Delta W_j] = E[\Delta W_i] \cdot E[\Delta W_j] = 0\)이다. 따라서 모든 교차항의 기대값이 소멸한다. 이것이 증명의 핵심 단계이다.
Step 4. 교차항이 사라지므로 대각항만 남아서, \(E\bigl[\bigl(\sum_i f(t_{i-1})\,\Delta W_i\bigr)^2\bigr] = \sum_i f(t_{i-1})^2\,\Delta t\)를 얻는다. 우변은 함수 \(f(u)^2\)의 리만합이다. \(n \to \infty\)에서 이 리만합은 적분으로 수렴하므로, 최종적으로 다음을 얻는다.
$$E\!\left[\left(\int_a^b f(u)\,dW(u)\right)^{\!2}\right] = \int_a^b f(u)^2\,du \qquad \blacksquare$$3.4 결정론적 \(f\)일 때의 정규분포 성질
만약 \(f(u)\)가 결정론적(비확률적) 함수라면, 이토 적분은 한층 더 강력한 성질을 가진다.
이 결과의 직관적 이해는 다음과 같다. 리만합 \(\sum f(t_{i-1})\,\Delta W_i\)에서 각 \(\Delta W_i\)는 정규분포 \(N(0, \Delta t)\)를 따르고 서로 독립이며, \(f(t_{i-1})\)은 결정론적 상수이다. 따라서 이 합은 독립인 정규확률변수들의 선형결합이다. 확률론의 기본 정리에 의해 "독립인 정규분포의 선형결합은 다시 정규분포"이므로, 이 합은 정규분포를 따른다. 기대값은 성질 1에 의해 0이고, 분산은 이토 등거리성에 의해 \(\int_a^b f(u)^2\,du\)이다. 극한에서도 이 정규분포 성질이 보존된다.
Vasicek과의 연결: 이 결과는 Vasicek 모형에서 단기이자율 \(R(u)\)가 정규분포를 따르는 핵심 이유이다. Part 8에서 보게 되겠지만, Vasicek의 해는 결정론적 커널 함수 \(\beta e^{-b(u-s)}\)에 대한 이토 적분을 포함하고 있다. 바로 이 성질 덕분에 \(\int_t^T R(u)\,du\)의 조건부분포가 정규분포가 되고, 나아가 할인채 가격이 닫힌형으로 표현 가능해지는 것이다.
Part 4. 정규분포 지수의 기대값
4.1 핵심 보조정리
이 보조정리는 Vasicek 모형에서 할인채 가격을 닫힌형으로 표현하는 데 결정적인 역할을 한다. 할인채의 가격은 \(B(t,T) = E_t^Q[\exp(-\int_t^T R(u)\,du)]\)인데, 만약 적분 \(\int_t^T R(u)\,du\)가 정규분포를 따른다면(Part 10에서 이를 증명한다), 할인채 가격 계산은 정확히 다음 보조정리의 형태가 된다.
4.2 증명 (완전제곱 방법)
\(X \sim N(\mu, \sigma^2)\)의 확률밀도함수는 \(f_X(x) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\)이다.
Step 1. 기대값의 정의에 따라, \(E[e^X] = \int_{-\infty}^{\infty} e^x \cdot \frac{1}{\sqrt{2\pi\sigma^2}}\exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)dx\)이다.
Step 2. 피적분함수의 지수 부분을 하나로 합친다. \(e^x\)와 밀도함수의 지수 부분을 결합하면 \(x - \frac{(x-\mu)^2}{2\sigma^2}\)이 된다. 이것을 공통분모로 정리하면 \(\frac{2\sigma^2 x - (x-\mu)^2}{2\sigma^2}\)이다.
Step 3. 분자를 전개한다. \(2\sigma^2 x - (x^2 - 2\mu x + \mu^2) = -x^2 + 2(\mu + \sigma^2)x - \mu^2\)이다.
Step 4. 핵심 기법인 완전제곱식 만들기를 적용한다. \(x^2 - 2(\mu+\sigma^2)x\)에서 "\(\mu+\sigma^2\)"를 중심으로 완전제곱을 만들면, \(x^2 - 2(\mu+\sigma^2)x + \mu^2 = [x - (\mu+\sigma^2)]^2 - (\mu+\sigma^2)^2 + \mu^2\)이다. 따라서 원래 지수 부분은 다음과 같이 분리된다.
$$x - \frac{(x-\mu)^2}{2\sigma^2} = -\frac{[x-(\mu+\sigma^2)]^2}{2\sigma^2} + \frac{(\mu+\sigma^2)^2 - \mu^2}{2\sigma^2}$$Step 5. 나머지 상수항을 계산하면 \(\frac{(\mu+\sigma^2)^2 - \mu^2}{2\sigma^2} = \frac{2\mu\sigma^2 + \sigma^4}{2\sigma^2} = \mu + \frac{\sigma^2}{2}\)이다.
Step 6. 적분을 완성한다. 상수항을 밖으로 빼면, 남은 적분은 평균이 \(\mu+\sigma^2\)이고 분산이 \(\sigma^2\)인 정규분포의 밀도함수를 전 구간에서 적분하는 것이므로 값이 정확히 1이다.
$$E[e^X] = \exp\!\left(\mu + \frac{\sigma^2}{2}\right) \cdot \underbrace{\int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi\sigma^2}}\exp\!\left(-\frac{[x-(\mu+\sigma^2)]^2}{2\sigma^2}\right)dx}_{= 1} = \exp\!\left(\mu + \tfrac{1}{2}\sigma^2\right) \quad \blacksquare$$직관적 해석: 이 결과에서 가장 중요한 점은 \(E[e^X] \neq e^{E[X]} = e^\mu\)라는 것이다. 차이는 \(\frac{1}{2}\sigma^2\)만큼의 "볼록성 프리미엄"이다. 지수함수 \(e^x\)는 볼록(convex)하므로, 옌센 부등식(Jensen's inequality)에 의해 \(E[e^X] > e^{E[X]}\)이다. 분산이 클수록(즉 불확실성이 클수록) 이 프리미엄은 더 커지며, 이것이 금융에서 "변동성이 크면 볼록성의 이점이 커진다"는 직관의 수학적 근거이다.
Part 5. 위험중립측도와 채권 가격결정
5.1 현실측도 vs 위험중립측도
금융에서 자산 가격을 결정하려면 미래 현금흐름의 기대값을 구해야 하는데, 이때 "어떤 확률측도 하에서의 기대값인가"가 결정적으로 중요하다. 현실측도(Physical Measure) \(P\)는 우리가 실제 세계에서 관측하는 확률분포이다. 이 측도 하에서 투자자들은 위험을 싫어하므로, 위험이 큰 자산에 대해 추가적인 보상(위험프리미엄)을 요구한다. 따라서 \(P\) 하에서의 기대수익률에는 위험프리미엄이 포함되어 있다.
위험중립측도(Risk-Neutral Measure) \(Q\)는 가격결정을 위해 인위적으로 구성한 수학적 도구이다. 이 "가상의 세계"에서는 모든 투자자가 위험에 무관심(risk-neutral)하며, 따라서 모든 자산의 기대수익률이 무위험이자율과 동일하다. 현실에서 투자자들이 실제로 위험중립적이라는 뜻이 아니라, 무차익(No-Arbitrage) 원리를 만족하는 가격체계가 존재하면, 그에 대응하는 확률측도 \(Q\)가 존재한다는 것이다. 이 측도 하에서의 기대값으로 자산 가격을 계산하면, 위험프리미엄을 명시적으로 다룰 필요 없이 올바른 무차익 가격을 얻을 수 있다.
5.2 기라노프 정리(Girsanov Theorem)
\(P\) 하에서 브라운 운동 \(\{W^{P}(t)\}\)가 있을 때, 예측가능한 과정 \(\lambda(t)\)에 대하여 다음과 같이 정의하면 $$dW^{Q}(t) = dW^{P}(t) + \lambda(t)\,dt \quad\Longleftrightarrow\quad W^{Q}(t)=W^{P}(t)+\int_{0}^{t}\lambda(s)\,ds$$ \(\{W^{Q}(t)\}\)가 \(Q\) 하에서 브라운 운동이 되도록 하는 측도 \(Q\)를 구성할 수 있다. 여기서 \(\lambda(t)\)는 위험의 시장가격(Market Price of Risk)이다. 직관적으로 설명하면, 현실세계에서 위험자산의 드리프트에 포함되어 있던 위험프리미엄을 "흡수"하여 브라운 운동의 드리프트를 조정함으로써, 위험중립세계에서의 새로운 브라운 운동을 만드는 것이다.
Vasicek 모형의 맥락에서 이 정리는 특히 중요하다. \(P\) 측도 하에서의 장기 평균 \(\theta = a/b\)가 \(Q\) 측도 하에서는 \(\tilde{R} = (a - \beta\lambda)/b\)로 변환된다. 즉, 측도변환은 Vasicek SDE의 구조(평균회귀 형태)는 유지하면서 장기 평균 수준만 조정하는 효과를 가진다. 회귀속도 \(b\)와 변동성 \(\beta\)는 측도변환에 의해 변하지 않는다.
5.3 할인채의 위험중립 가격결정
단기이자율(short rate) \(R(u)\)가 주어질 때, 만기 \(T\)에 1원을 지급하는 할인채(zero-coupon bond)의 시점 \(t\)에서의 가격은 위험중립 가격결정 공식에 의해 다음과 같이 표현된다.
여기서 \(E_t^Q\)는 시점 \(t\)까지의 정보 \(\mathcal{F}_t\)가 주어진 조건부 기대값을 위험중립측도 \(Q\) 하에서 계산한 것이다. 적분 \(\int_t^T R(u)\,du\)는 시점 \(t\)에서 만기 \(T\)까지의 누적 할인율을 나타내며, 이것의 지수함수를 취한 것이 할인인자(discount factor)이다. Vasicek 모형의 최종 목표는 이 기대값을 닫힌형(closed-form)으로 계산하는 것이다.
Part 6. 기존 모형 흐름과 Vasicek의 위치
Vasicek 모형이 왜 등장했는지, 그리고 이자율 모형의 역사 속에서 어떤 위치를 차지하는지를 이해하기 위해, 주요 모형들의 발전 흐름을 살펴보자.
가장 먼저 등장한 연속시간 이자율 모형은 Merton 모형(1973)이다. 이 모형의 SDE는 \(dR = \alpha\,du + \beta\,dW\)로, 드리프트와 확산이 모두 상수인 가장 단순한 형태이다. 그러나 이 모형에는 평균회귀(mean reversion)가 없으며, 이자율이 임의로 높아지거나 낮아질 수 있어 장기적 행태가 비현실적이다. 이자율은 브라운 운동처럼 어느 방향으로든 끝없이 표류(drift)할 수 있으며, 이는 실제 경제에서 중앙은행이 이자율을 조절하는 현실과 동떨어져 있다.
Vasicek 모형(1977)은 이 문제를 해결하기 위해 평균회귀를 도입한 결정적인 진보였다. 물리학에서 용액 속 입자의 속도를 모델링하기 위해 Uhlenbeck과 Ornstein(1930)이 도입한 OU 과정을 금리에 적용한 것이다. 이자율이 장기 평균보다 높으면 드리프트가 음수가 되어 이자율을 끌어내리고, 낮으면 끌어올리는 "스프링" 같은 복원력이 작용한다. 이로써 이자율이 장기 균형 수준 주변에서 변동하는 현실적인 동학이 구현되었다. 다만 파라미터가 모두 상수이므로, 시장에서 관측되는 초기 일드곡선을 정확히 적합하는 것은 불가능하다.
CIR 모형(Cox-Ingersoll-Ross, 1985)은 확산 계수를 \(\sigma\sqrt{R}\)로 설정하여, 이자율이 0에 가까워지면 변동성도 함께 줄어들게 만들었다. 이 구조 덕분에 Feller 조건 하에서 이자율이 음수가 되는 것이 수학적으로 불가능하다. 평균회귀도 갖추고 있으나, Vasicek만큼 해석적으로 다루기 쉽지는 않다.
Hull–White 모형(1990)은 Vasicek의 확장으로, 드리프트 함수에 시간의존성을 추가하여 초기 일드곡선을 정확히 적합할 수 있도록 했다. 수학적으로는 Vasicek에서 상수 \(a\)를 시간함수 \(a(t)\)로 바꾸되, 평균회귀 구조와 상수 변동성은 유지한 형태이다.
| 모형 | SDE | 평균회귀 | 초기곡선 적합 | 음수 금리 |
|---|---|---|---|---|
| Merton (1973) | \(dR = \alpha\,du + \beta\,dW\) | 없음 | 불가 | 가능 |
| Vasicek (1977) | \(dR = b(\theta - R)\,dt + \beta\,dW\) | 있음 | 불가 | 가능 |
| CIR (1985) | \(dR = b(\theta - R)\,dt + \sigma\sqrt{R}\,dW\) | 있음 | 불가 | 불가능 |
| Ho–Lee (1986) | \(dR = \alpha(u)\,du + \beta\,dW^Q\) | 없음 | 가능 | 가능 |
| Hull–White (1990) | \(dR = (a(u) - bR)\,du + \beta\,dW^Q\) | 있음 | 가능 | 가능 |
Vasicek의 역사적 의의: Vasicek 모형은 이자율의 평균회귀를 최초로 수학적으로 구현한 모형이다. 비록 초기 일드곡선 적합이나 음수 금리 문제 등의 한계가 있지만, 평균회귀라는 핵심 개념을 도입하고 할인채 가격의 완전한 닫힌형 해를 제공했다는 점에서, 이후 모든 아핀 이자율 모형의 원형(prototype)이 되었다. Vasicek을 완전히 이해하면, CIR, Hull–White, 다요인 아핀 모형 등으로의 확장이 자연스러워진다.
Part 7. Vasicek 모형의 정의
7.1 Ornstein–Uhlenbeck 과정의 기원
1930년, 물리학자 Uhlenbeck과 Ornstein은 용액 안의 입자 속도를 모델링하기 위해 특별한 확률과정을 도입했다. 용액 속의 입자는 주위 분자들과의 무작위적 충돌에 의해 이리저리 밀려나지만, 동시에 용액의 점성저항(viscous drag)이 입자의 속도를 제어한다. 속도가 빨라지면 저항이 커져 속도를 줄이고, 속도가 느려지면 저항이 줄어들어 속도가 다시 증가하는 "복원력"이 작용하는 것이다. 이러한 "무작위 충격 + 저항(회귀력)"의 조합이 Ornstein–Uhlenbeck(OU) 과정이다.
1977년, Oldřich Vašíček은 이 물리학적 과정이 이자율 모델링에 이상적이라고 인식했다. 이자율은 경제 전반의 다양한 요인에 의해 무작위로 변동하지만(무작위 충격), 동시에 중앙은행의 통화정책이라는 "복원력"에 의해 특정 수준으로 유도되는 경향이 있다. 이자율이 너무 높으면 경기가 위축되어 중앙은행이 금리를 인하하고, 이자율이 너무 낮으면 인플레이션 압력이 발생하여 금리를 인상한다. 이러한 경제적 메커니즘이 수학적으로 OU 과정의 평균회귀 구조와 정확히 일치하는 것이다.
7.2 현실측도 P에서의 SDE
Vasicek(1977)은 현물이자율과정 \(\{R(u)\}\)가 현실측도 \(P\) 하에서 다음의 확률미분방정식을 만족한다고 가정하였다.
여기서 \(a > 0\), \(b > 0\), \(\beta > 0\)은 상수이고, \(\{W(u)\}\)는 현실측도 \(P\) 하에서의 브라운 운동이다. 장기 평균 \(\theta = a/b\)를 정의하면, SDE를 더 직관적인 형태로 다시 쓸 수 있다.
이 SDE의 각 구성요소가 갖는 의미를 상세히 분석하면 다음과 같다. 드리프트 항 \(b[\theta - R(u)]\,du\)에서, \(\theta\)는 이자율이 장기적으로 수렴하는 평균 수준이다. \(b\)는 평균회귀 속도(speed of mean reversion)로서, 이자율이 \(\theta\)로부터 벗어났을 때 얼마나 빠르게 되돌아오는지를 결정한다. 이 두 파라미터의 조합이 바로 Vasicek의 핵심인 평균회귀 메커니즘을 구현한다.
7.3 평균회귀의 직관적 이해
평균회귀 메커니즘의 작동을 세 가지 경우로 나누어 살펴보자.
| 현재 이자율 | 드리프트 \(b(\theta - R)\) | 힘의 방향 | 경제적 해석 |
|---|---|---|---|
| \(R(u) < \theta\) | 양수 (\(\theta - R > 0\)) | 이자율 상승 | 경기 과열 → 금리 인상 압력 |
| \(R(u) = \theta\) | 0 (평형) | 변동 없음 | 균형 상태, 무작위 변동만 존재 |
| \(R(u) > \theta\) | 음수 (\(\theta - R < 0\)) | 이자율 하락 | 경기 위축 → 금리 인하 압력 |
이 메커니즘을 물리적 비유로 이해하면 더욱 명확해진다. 고무줄에 매달린 공을 상상하자. 공의 위치가 이자율 \(R(u)\)에 해당하고, 고무줄의 자연 길이에 해당하는 위치가 장기 평균 \(\theta\)이다. 고무줄의 탄성계수가 회귀 속도 \(b\)에 해당한다. 공이 자연 위치에서 벗어나면 고무줄이 공을 되돌리려는 복원력을 발휘하며, 벗어난 거리가 클수록 복원력도 커진다. 동시에 공은 바람(브라운 운동)에 의해 무작위적으로 흔들린다. \(b\)가 크면 강한 고무줄처럼 공이 \(\theta\)에서 크게 벗어나지 못하고, \(b\)가 작으면 느슨한 고무줄처럼 공이 \(\theta\)에서 오래 벗어나 있을 수 있다.
평균회귀 속도 \(b\)의 크기를 직관적으로 파악하는 데 유용한 척도가 반감기(half-life)이다. 반감기란 이자율이 장기 평균과의 편차를 절반으로 좁히는 데 걸리는 기대 시간으로, \(\text{반감기} = \ln(2)/b \approx 0.693/b\)이다. 예를 들어 \(b = 0.21\)이면 반감기는 약 3.3년이다. 이는 현재 이자율이 장기 평균에서 4% 벗어나 있다면, 약 3.3년 후에는 그 편차가 2%로 줄어들 것으로 기대된다는 뜻이다.
7.4 위험중립측도 Q에서의 SDE
채권 가격결정을 위해서는 위험중립측도 \(Q\) 하에서의 SDE가 필요하다. 이자율 위험의 시장가격 \(\lambda\)가 상수라고 가정하고, 기라노프 정리에 의한 측도변환을 적용한다. \(dW(u) = dW^Q(u) - \lambda\,du\)를 원래 SDE에 대입하면 다음과 같다.
$$dR(u) = [a - bR(u)]\,du + \beta[dW^Q(u) - \lambda\,du] = [(a - \beta\lambda) - bR(u)]\,du + \beta\,dW^Q(u)$$위험중립 장기평균을 \(\tilde{R} := (a - \beta\lambda)/b\)로 정의하면, \(Q\) 측도 하에서의 SDE는 다음과 같은 깔끔한 형태가 된다.
이 결과에서 매우 중요한 관찰이 있다. 측도변환은 SDE의 평균회귀 구조를 보존한다. 즉, \(Q\) 측도 하에서도 이자율은 여전히 OU 과정을 따르며, 변하는 것은 오직 장기 평균 수준뿐이다. 회귀속도 \(b\)와 변동성 \(\beta\)는 측도변환에 의해 변하지 않는다. 이는 기라노프 정리가 브라운 운동의 드리프트만 조정하기 때문이다.
| 항목 | \(P\) 측도 | \(Q\) 측도 |
|---|---|---|
| 브라운 운동 | \(W(u)\) | \(W^Q(u)\) |
| 장기 평균 | \(\theta = a/b\) | \(\tilde{R} = (a - \beta\lambda)/b\) |
| 회귀속도 | \(b\) | \(b\) (동일) |
| 변동성 | \(\beta\) | \(\beta\) (동일) |
음의 이자율 가능성: Vasicek 모형에서 확산 계수 \(\beta\)는 이자율 수준 \(R\)에 무관한 상수이다. 이를 절대적 변동성(absolute volatility)이라 한다(기하 브라운 운동의 \(\sigma R\)과 같은 상대적 변동성과 대비된다). 이 구조 때문에 이자율이 0에 가까워져도 변동성이 줄어들지 않으며, 결과적으로 이자율이 음수가 될 확률이 항상 양수이다. 이것은 전통적으로 Vasicek 모형의 대표적 단점으로 지적되어 왔다. 다만 2008년 글로벌 금융위기 이후 유럽과 일본에서 실제로 음의 금리가 관측되면서, 이 "단점"에 대한 재평가가 이루어지고 있다.
Part 8. Vasicek SDE의 해
8.1 풀이 전략: 적분인자 방법
Vasicek SDE \(dR + bR\,du = b\tilde{R}\,du + \beta\,dW^Q\)는 \(R(u)\)에 대한 1차 선형 SDE이다. 결정론적 1차 선형 ODE \(y' + p(t)y = q(t)\)를 풀 때 적분인자 \(\exp(\int p\,dt)\)를 사용하듯이, 여기서도 적분인자 \(e^{bu}\)를 사용한다. 핵심 아이디어는 함수 \(e^{bu}R(u)\)의 미분을 이토 공식으로 구하여, \(R(u)\)에 대한 "곱 미분(product rule)"을 적용하는 것이다.
8.2 이토 공식 적용
풀이 과정
Step 1: 적분인자 곱의 미분. \(f(u, R) = e^{bu}R\)에 이토 공식을 적용한다. 편미분을 구하면, \(f_u = be^{bu}R\), \(f_R = e^{bu}\), \(f_{RR} = 0\)이다. Vasicek SDE의 확산 계수가 상수 \(\beta\)이므로, 이토 보정항은 \(\frac{1}{2}f_{RR}\beta^2 = 0\)이 되어 사라진다. 따라서 이토 공식은 다음과 같이 단순화된다.
$$d(e^{bu}R) = be^{bu}R\,du + e^{bu}\,dR$$Step 2: SDE 대입. \(dR = b[\tilde{R} - R]\,du + \beta\,dW^Q\)를 대입하면 다음과 같다.
$$d(e^{bu}R) = be^{bu}R\,du + e^{bu}[b\tilde{R}\,du - bR\,du + \beta\,dW^Q]$$\(be^{bu}R\,du\)와 \(-be^{bu}R\,du\)가 소거되어, 놀랍도록 간결한 결과를 얻는다.
$$d(e^{bu}R) = b\tilde{R}\,e^{bu}\,du + \beta\,e^{bu}\,dW^Q(u)$$Step 3: 적분. 양변을 시점 \(t\)에서 \(u\)까지 적분한다.
$$e^{bu}R(u) - e^{bt}R(t) = b\tilde{R}\int_t^u e^{bs}\,ds + \beta\int_t^u e^{bs}\,dW^Q(s)$$좌변의 리만 적분을 계산하면 \(b\tilde{R} \cdot \frac{1}{b}(e^{bu} - e^{bt}) = \tilde{R}(e^{bu} - e^{bt})\)이다. 정리하면 \(e^{bu}R(u) = e^{bt}R(t) + \tilde{R}(e^{bu} - e^{bt}) + \beta\int_t^u e^{bs}\,dW^Q(s)\)이다.
Step 4: \(e^{bu}\)로 나누기. 양변을 \(e^{bu}\)로 나누면 최종 해를 얻는다.
8.3 해의 구조 분석
이 해의 구조를 분석하면 세 부분으로 명확히 분리됨을 알 수 있다. 각 부분은 서로 다른 물리적 의미를 가진다.
첫째 항 \(\tilde{R}\)는 위험중립 장기 평균 수준으로, 시간이 아무리 흘러도 변하지 않는 "앵커(anchor)" 역할을 한다. 이 상수가 존재한다는 것 자체가 Merton/Ho–Lee 모형과의 근본적인 차이이다. 평균회귀가 없는 모형에서는 이러한 "중심"이 없으므로 이자율이 한 방향으로 끝없이 표류할 수 있다.
둘째 항 \(e^{-b(u-t)}[R(t) - \tilde{R}]\)는 초기조건의 효과가 시간에 따라 지수적으로 감쇠하는 항이다. 시점 \(t\)에서의 이자율 \(R(t)\)가 장기 평균 \(\tilde{R}\)에서 벗어나 있다면, 그 편차 \([R(t) - \tilde{R}]\)는 \(e^{-b(u-t)}\)의 속도로 지수적으로 줄어든다. \(b > 0\)이므로 \(e^{-b(u-t)} \to 0\) as \((u-t) \to \infty\)이다. 다시 말해, 시간이 충분히 흐르면 초기 이자율의 영향은 완전히 사라진다. 이것이 평균회귀의 수학적 표현이다.
셋째 항 \(\beta\int_t^u e^{-b(u-s)}\,dW^Q(s)\)는 시점 \(t\) 이후에 축적되는 새로운 무작위 충격의 효과이다. 커널 함수 \(e^{-b(u-s)}\)에 의해, 시점 \(s\)에서의 충격이 현재 시점 \(u\)에 미치는 영향은 \(e^{-b(u-s)}\)만큼 감쇠된다. 즉, 최근의 충격일수록 현재 이자율에 더 큰 영향을 미치고, 오래된 충격일수록 영향이 줄어든다. 이것은 경제적으로도 자연스럽다. 어제의 금융 뉴스가 오늘의 이자율에 미치는 영향은 1년 전의 뉴스보다 훨씬 크다.
Ho–Lee와의 핵심 차이: Ho–Lee 모형의 해 \(R(u) = R(t) + \int_t^u \alpha(s)\,ds + \beta(W^Q(u) - W^Q(t))\)에서는 과거 충격의 감쇠가 없다. 모든 과거 충격이 동일한 가중치(= 1)로 누적된다. 반면 Vasicek에서는 지수적 감쇠 커널 \(e^{-b(u-s)}\)에 의해 과거 충격의 영향이 줄어든다. 이 차이가 장기적 행태에서 극적인 차이를 만들어낸다. Ho–Lee에서는 분산이 무한히 증가하지만, Vasicek에서는 유한한 정상분포(stationary distribution)로 수렴한다.
Part 9. \(R(u)\)의 조건부분포
9.1 정규분포의 확인
해의 구조에서, 처음 두 항 \(\tilde{R} + e^{-b(u-t)}[R(t) - \tilde{R}]\)는 시점 \(t\)에서 완전히 알려진 결정론적 값이다. 셋째 항 \(\beta\int_t^u e^{-b(u-s)}\,dW^Q(s)\)는 결정론적 커널 함수 \(\beta e^{-b(u-s)}\)에 대한 이토 적분이다. Part 3.4에서 증명했듯이, 결정론적 함수에 대한 이토 적분은 정규분포를 따른다. "결정론적 상수 + 정규확률변수 = 정규확률변수"이므로, \(R(u)\,|\,\mathcal{F}_t\)는 조건부 정규분포를 따른다.
9.2 조건부 기대값
이토 적분의 기대값이 0이라는 성질(Part 3.2의 성질 1)에 의해, 확률적 항은 기대값 계산에서 사라진다.
이 공식은 매우 직관적인 해석을 허용한다. 미래 이자율의 기대값은 현재 이자율 \(R(t)\)와 장기 평균 \(\tilde{R}\)의 가중평균이다. 가중치는 \(e^{-b(u-t)}\)와 \(1 - e^{-b(u-t)}\)로서, 시간이 흐름에 따라 \(R(t)\)의 가중치는 지수적으로 감소하고 \(\tilde{R}\)의 가중치는 증가한다. 극한적으로 \((u-t) \to \infty\)이면 \(E_t^Q[R(u)] \to \tilde{R}\)이다. 즉, 아무리 먼 미래의 이자율이라도 장기 평균으로 수렴할 것으로 기대된다.
9.3 조건부 분산
분산은 확률적 항에서만 기여하며, 이토 등거리성(Part 3.2의 성질 2)을 적용하여 계산한다.
조건부 분산의 유도
이토 등거리성에 의해 다음이 성립한다.
$$\text{Var}_t^Q[R(u)] = \beta^2\int_t^u e^{-2b(u-s)}\,ds$$\(x = u - s\)로 치환하면 \(ds = -dx\)이고, 적분 한계가 \((u-t)\)에서 \(0\)으로 바뀌므로 다음과 같다.
$$= \beta^2\int_0^{u-t} e^{-2bx}\,dx = \beta^2\left[-\frac{1}{2b}e^{-2bx}\right]_0^{u-t} = \frac{\beta^2}{2b}(1 - e^{-2b(u-t)})$$이 분산 공식은 Vasicek 모형의 핵심적 특성을 담고 있다. 단기적으로(\(u-t\)가 작을 때) \(1 - e^{-2b(u-t)} \approx 2b(u-t)\)이므로, 분산은 \(\beta^2(u-t)\)에 근사한다. 이는 Ho–Lee 모형(또는 단순 브라운 운동)에서의 분산 \(\beta^2(u-t)\)와 동일하다. 즉, 짧은 시간 간격에서는 평균회귀의 효과가 미미하다. 그러나 장기적으로(\((u-t) \to \infty\)) 분산은 \(\frac{\beta^2}{2b}\)라는 유한한 상한에 수렴한다. 이것이 평균회귀의 핵심적 결과이다. 이자율의 불확실성이 시간에 따라 무한히 증가하지 않고, 유한한 범위 안에 "갇히게" 된다.
9.4 조건부분포 종합
9.5 정상분포(Stationary Distribution)
시간이 충분히 흐르면(\((u-t) \to \infty\)), 조건부분포는 초기조건 \(R(t)\)에 무관한 정상분포(stationary distribution)로 수렴한다.
정상분포의 존재는 평균회귀 모형의 가장 중요한 특성이다. 충분히 오랜 시간이 지나면 이자율의 분포가 초기조건에 무관하게 동일해진다는 것은, 모형이 장기적으로 "안정적"이라는 의미이다. 평균회귀가 없는 모형(Merton, Ho–Lee)에서는 분산이 시간에 비례하여 무한히 증가하므로 정상분포가 존재하지 않는다.
정상분포의 파라미터 해석: 정상 평균 \(\tilde{R}\)은 장기 균형 이자율이다. 정상 분산 \(\frac{\beta^2}{2b}\)는 변동성 \(\beta\)의 제곱에 비례하고, 회귀속도 \(b\)에 반비례한다. 직관적으로, \(\beta\)가 크면 무작위 충격이 강해져 분산이 커지고, \(b\)가 크면 빠른 회귀가 불확실성을 억제하여 분산이 작아진다. 예를 들어 \(\tilde{R} = 0.07\), \(\beta = 0.06\), \(b = 0.21\)이면, 정상 표준편차는 \(\sqrt{0.06^2/(2 \times 0.21)} \approx 9.26\%\)이다.
Part 10. 할인채 가격의 닫힌형
이 Part에서는 Vasicek 모형의 가장 핵심적인 결과, 즉 할인채 가격의 닫힌형(closed-form) 표현을 유도한다. 이를 위해 먼저 누적이자율 적분 \(I(t,T)\)의 분포를 구하고, Part 4의 보조정리를 적용하여 채권가격을 구한 뒤, 이를 아핀(affine) 형태로 정리한다.
10.1 \(I(t,T)\)의 정의와 계산
할인채 가격 공식 \(B(t,T) = E_t^Q[\exp(-\int_t^T R(u)\,du)]\)에서 핵심은 누적이자율 적분의 분포를 아는 것이다. 이 적분을 \(I(t,T) := \int_t^T R(u)\,du\)로 정의한다.
명제: \(I(t,T)\)의 명시적 표현
Step 1. Part 8의 해를 대입하여 적분한다.
$$I(t,T) = \int_t^T \!\left[\tilde{R} + e^{-b(u-t)}[R(t) - \tilde{R}] + \beta\int_t^u e^{-b(u-s)}\,dW^Q(s)\right]du$$이 적분을 세 부분 \(I_1 + I_2 + I_3\)으로 나누어 각각 계산한다.
Step 2: \(I_1\) (장기 평균 기여분). \(I_1 = \int_t^T \tilde{R}\,du = (T-t)\tilde{R} = \tau\,\tilde{R}\).
Step 3: \(I_2\) (초기조건 감쇠 기여분). \(R(t) - \tilde{R}\)는 상수이므로 적분 밖으로 빼면,
$$I_2 = [R(t) - \tilde{R}]\int_t^T e^{-b(u-t)}\,du = [R(t) - \tilde{R}] \cdot \frac{1}{b}(1 - e^{-b\tau})$$여기서 보조 함수 \(C(\tau) := \frac{1}{b}(1 - e^{-b\tau})\)를 정의하면, \(I_2 = C(\tau)[R(t) - \tilde{R}]\)이다.
Step 4: \(I_3\) (확률적 기여분 — 확률적 Fubini 정리 적용). 이 항은 안쪽 적분이 이토 적분이므로, 적분 순서를 교환하려면 확률적 Fubini 정리가 필요하다. 원래 적분 영역은 \(t \le s \le u \le T\)이며, \(s\)를 먼저 고정하고 \(u\)를 \(s\)에서 \(T\)까지 적분하는 것으로 바꾸면 다음을 얻는다.
$$I_3 = \beta\int_t^T \int_t^u e^{-b(u-s)}\,dW^Q(s)\,du = \beta\int_t^T \left[\int_s^T e^{-b(u-s)}\,du\right]dW^Q(s)$$내부의 리만 적분을 계산하면 \(\int_s^T e^{-b(u-s)}\,du = \frac{1}{b}(1 - e^{-b(T-s)})\)이다. 따라서 다음을 얻는다.
$$I_3 = \frac{\beta}{b}\int_t^T (1 - e^{-b(T-s)})\,dW^Q(s)$$10.2 종합 결과
여기서 \(C(\tau) = \frac{1}{b}(1 - e^{-b\tau})\), \(\tau = T - t\)이다. 처음 두 항은 결정론적이고, 마지막 항은 결정론적 커널 \(\frac{\beta}{b}(1 - e^{-b(T-s)})\)에 대한 이토 적분이므로 정규분포를 따른다. 따라서 \(I(t,T)\,|\,\mathcal{F}_t\)는 조건부 정규분포이다.
10.3 조건부 평균
10.4 조건부 분산
이토 등거리성을 적용하여 분산을 계산한다.
분산 계산의 상세 유도
이토 등거리성에 의해 확률적 항의 분산은 다음과 같다.
$$v(t,T) := \text{Var}_t^Q[I(t,T)] = \frac{\beta^2}{b^2}\int_t^T (1 - e^{-b(T-s)})^2\,ds$$피적분함수를 전개하면 \((1 - e^{-b(T-s)})^2 = 1 - 2e^{-b(T-s)} + e^{-2b(T-s)}\)이다. \(x = T - s\)로 치환하면 각 항의 적분은 다음과 같다.
$$\int_0^\tau 1\,dx = \tau, \quad \int_0^\tau 2e^{-bx}\,dx = \frac{2}{b}(1 - e^{-b\tau}), \quad \int_0^\tau e^{-2bx}\,dx = \frac{1}{2b}(1 - e^{-2b\tau})$$이들을 결합하면 최종적으로 다음을 얻는다.
$$v(\tau) = \frac{\beta^2}{2b^3}\left(2b\tau + 4e^{-b\tau} - e^{-2b\tau} - 3\right)$$중요한 관찰: 분산 \(v(\tau)\)는 \(t\)와 \(T\) 각각이 아닌 잔존기간 \(\tau = T - t\)에만 의존한다.
10.5 할인채 가격 닫힌형
이제 모든 조각이 갖추어졌다. \(I(t,T)\,|\,\mathcal{F}_t \sim N(m(t,T),\; v(\tau))\)이고, 할인채 가격은 \(B(t,T) = E_t^Q[e^{-I(t,T)}]\)이다. \(-I(t,T)\,|\,\mathcal{F}_t \sim N(-m, v)\)이므로, Part 4의 보조정리를 적용하면 다음을 얻는다.
10.6 아핀(Affine) 표현
채권가격을 보다 깔끔하게 표현하기 위해 다음 함수를 정의하자.
이 정의를 사용하면 \(-m(t,T) + \frac{1}{2}v(\tau) = -A(\tau) - C(\tau)R(t)\)가 성립하여, 할인채 가격은 놀라울 정도로 간결한 아핀 형태를 가진다.
여기서 \(C(\tau) = \frac{1}{b}(1 - e^{-b\tau})\)이다.
아핀 구조의 의미: \(\ln B(t,T) = -A(\tau) - C(\tau)R(t)\)이므로, 채권가격의 로그가 현물이자율 \(R(t)\)의 1차함수(아핀함수)이다. Ho–Lee에서는 \(R(t)\)의 계수가 잔존만기 \(\tau\) 그 자체였지만, Vasicek에서는 \(C(\tau) = \frac{1}{b}(1 - e^{-b\tau})\)이다. \(C(\tau) < \tau\)이므로, 평균회귀는 이자율 변동에 대한 채권가격의 민감도를 줄이는 효과를 가진다. \(b \to 0\)(평균회귀 소멸)이면 \(C(\tau) \to \tau\)로 Ho–Lee의 결과를 복원한다.
극한 성질: \(\tau \to 0\)이면 \(C(\tau) \to 0\), \(A(\tau) \to 0\)이므로 \(B(t,T) \to 1\)이다. 이는 만기가 임박한 채권의 가격이 액면가에 수렴한다는 자연스러운 결과이다. 또한 \(\tau \to \infty\)이면 \(C(\tau) \to 1/b\)로 유한한 값에 수렴한다.
Part 11. 선도이자율과 일드곡선
11.1 선도이자율(Forward Rate)
순간 선도이자율(instantaneous forward rate)은 채권가격으로부터 역으로 추출되는 이자율로, \(F(t,T) := -\frac{\partial \ln B(t,T)}{\partial T}\)로 정의된다. Part 10의 아핀 표현 \(\ln B = -A(\tau) - C(\tau)R(t)\)에서 \(T\)에 대해 미분하면(\(\frac{d\tau}{dT} = 1\)에 주의), \(F(t,T) = A'(\tau) + C'(\tau)R(t)\)이다.
\(C(\tau)\)와 \(A(\tau)\)의 도함수를 각각 구해야 한다. 먼저 \(C'(\tau) = e^{-b\tau}\)이다. \(v(\tau)\)의 도함수를 구하면, \(v'(\tau) = \frac{\beta^2}{b^2}(1 - e^{-b\tau})^2 = \beta^2 C(\tau)^2\)이다. 이로부터 \(A'(\tau) = (1 - e^{-b\tau})\tilde{R} - \frac{1}{2}\beta^2 C(\tau)^2\)을 얻는다. 따라서 선도이자율은 다음과 같다.
선도이자율의 극한값
\(\tau \to 0\)이면, \(e^{-b\tau} \to 1\)이므로 \(F(t,T) \to R(t)\)이다. 즉, 즉시 시작하는 선도이자율은 현재의 현물이자율과 같다.
\(\tau \to \infty\)이면, \(e^{-b\tau} \to 0\)이므로 \(F(t,T) \to \tilde{R} - \frac{\beta^2}{2b^2}\)이다. 이 값은 유한하다! Ho–Lee 모형에서는 \(F(t,T) \to -\infty\)로 발산했던 것과 극명하게 대비된다. 평균회귀가 장기 선도이자율의 발산을 방지하고, 유한한 값으로 수렴하게 만드는 것이다. 다만 이 장기 극한값은 위험중립 장기 평균 \(\tilde{R}\)보다 \(\frac{\beta^2}{2b^2}\)만큼 낮다. 이 차이가 바로 볼록성 조정(convexity adjustment)이다.
민감도 분석
현물이자율에 대한 선도이자율의 민감도는 \(\frac{\partial F(t,T)}{\partial R(t)} = e^{-b\tau}\)이다. 이 민감도는 잔존만기가 길어질수록 지수적으로 감소한다. 이것이 Ho–Lee의 "병행이동(parallel shift)" 특성과의 결정적인 차이이다. Ho–Lee에서는 \(\frac{\partial F}{\partial R(t)} = 1\)로 모든 만기에서 동일했지만, Vasicek에서는 평균회귀가 현물이자율 충격의 장기 전파를 감쇠시킨다.
장기 평균에 대한 민감도는 \(\frac{\partial F(t,T)}{\partial \tilde{R}} = 1 - e^{-b\tau}\)이다. 이 두 민감도 사이에는 아름다운 관계 \(\frac{\partial F}{\partial \tilde{R}} = 1 - \frac{\partial F}{\partial R(t)}\)가 성립한다. 즉, 현물이자율의 영향력이 줄어드는 만큼 장기 평균의 영향력이 커진다.
선도이자율의 위험프리미엄
미래 현물이자율의 위험중립 기대값 \(E_t^Q[R(T)]\)와 선도이자율 \(F(t,T)\)를 비교하면 다음의 관계가 성립한다.
차이 \(\frac{1}{2}v'(\tau) = \frac{\beta^2}{2}C(\tau)^2\)가 선도이자율에 내재된 위험프리미엄(볼록성 편향)이다. 이 프리미엄은 잔존만기가 길어질수록 증가하되, \(\frac{\beta^2}{2b^2}\)라는 유한한 상한으로 수렴한다. Ho–Lee에서는 \(\frac{\beta^2\tau^2}{2}\)로 만기의 제곱에 비례하여 무한히 증가했던 것과 대비된다.
11.2 일드(만기수익률)
연속복리 일드(continuously compounded yield)는 \(R(t,T) = -\frac{1}{\tau}\ln B(t,T)\)로 정의된다. Part 10의 아핀 표현을 대입하면 다음과 같다.
일드가 현물이자율 \(R(t)\)의 1차함수(아핀함수)이므로, Vasicek 모형은 아핀일드모형(affine-yield model)에 속한다. \(R(t)\)가 정규분포를 따르므로 일드 역시 정규분포를 따른다.
일드의 극한값도 분석할 수 있다. \(\tau \to 0\)이면, 로피탈 정리에 의해 \(C(\tau)/\tau \to 1\)이므로 \(R(t,T) \to R(t)\)이다. \(\tau \to \infty\)이면, \(C(\tau)/\tau \to 0\)이고 \(A(\tau)/\tau \to \tilde{R} - \frac{\beta^2}{2b^2}\)이므로, 장기 일드도 선도이자율과 동일한 극한값 \(\tilde{R} - \frac{\beta^2}{2b^2}\)에 수렴한다.
Part 12. 할인채의 SDE와 무차익 점검
이 Part에서는 채권가격 \(B(t,T) = \exp(-A(\tau) - C(\tau)R(t))\)가 만족하는 SDE를 유도하고, 그 드리프트가 무차익 조건과 일치함을 확인한다.
유도 과정
\(B(t,T) = \exp(-A(\tau) - C(\tau)R(t))\)에 이토 공식을 적용한다. \(g(t,R) = \exp(-A(T-t) - C(T-t)\,R)\)로 놓으면, \(\tau = T - t\)에서 \(\frac{d\tau}{dt} = -1\)이므로 시간 편미분은 \(g_t = g \cdot [A'(\tau) + C'(\tau)R]\)이다. 또한 \(g_R = -C(\tau)\,g\), \(g_{RR} = C(\tau)^2\,g\)이다.
이토 공식에 의해 다음이 성립한다.
$$dB = B\cdot[A'(\tau) + C'(\tau)R]\,dt - B\cdot C(\tau)\,dR + \tfrac{1}{2}B\cdot C(\tau)^2\beta^2\,dt$$\(dR = b[\tilde{R} - R]\,dt + \beta\,dW^Q\)를 대입하고 \(dt\) 계수를 정리하면, \(A'(\tau) + C'(\tau)R - C(\tau)b[\tilde{R} - R] + \frac{1}{2}\beta^2 C(\tau)^2\)이다. \(A'(\tau) = (1 - e^{-b\tau})\tilde{R} - \frac{1}{2}\beta^2 C^2\), \(C'(\tau) = e^{-b\tau}\), \(C(\tau)b = 1 - e^{-b\tau}\)를 대입하면, 모든 항이 소거되어 드리프트는 \(R(t)\)만 남는다.
최종 결과는 다음과 같다.
이 SDE의 드리프트 항이 정확히 \(R(t)\,dt\)라는 것은, 위험중립측도 \(Q\) 하에서 할인채의 기대수익률이 무위험이자율과 동일하다는 뜻이다. 이것이 바로 무차익 조건이 만족됨을 확인하는 것이다.
확산 항의 계수 \(-\beta C(\tau)\)는 할인채의 변동성이다. Ho–Lee에서는 이 계수가 \(-\beta\tau\)로 만기에 비례하여 무한히 증가했지만, Vasicek에서는 \(-\beta C(\tau)\)로 \(-\beta/b\)라는 유한한 상한에 수렴한다. 이것은 평균회귀가 장기 채권의 이자율 민감도를 제한하는 효과의 또 다른 표현이다.
Part 13. 수치 예제
13.1 모형 설정
다음과 같은 구체적인 Vasicek 모형을 고려한다.
$$dR(u) = 0.21\,[0.07 - R(u)]\,du + 0.06\,dW^Q(u)$$파라미터는 \(\tilde{R} = 0.07\) (7%), \(b = 0.21\), \(\beta = 0.06\) (6%p)이다.
이 파라미터들의 의미를 해석하면 다음과 같다. 위험중립 장기 평균 이자율은 7%이다. 반감기는 \(\ln(2)/0.21 \approx 3.3\)년으로, 이자율이 장기 평균과의 편차를 절반으로 좁히는 데 약 3.3년이 걸린다. 연간 변동성 6%p는 이자율의 연간 무조건부 표준편차가 약 6%p임을 의미한다.
13.2 핵심 함수 계산 (\(\tau = 5\))
\(C(5) = \frac{1}{0.21}(1 - e^{-0.21 \times 5}) = \frac{1}{0.21}(1 - e^{-1.05}) = \frac{0.6501}{0.21} \approx 3.096\)이다. 참고로 Ho–Lee에서는 \(C(\tau) = \tau = 5\)였다. \(C(5) \approx 3.1 < 5\)라는 것은 평균회귀가 이자율 민감도를 약 38% 줄인다는 의미이다.
13.3 장기 수렴값 계산
선도이자율과 일드의 장기 극한값은 다음과 같다.
즉 약 2.92%이다. 위험중립 장기 평균이 7%임에도 불구하고, 장기 선도이자율/일드는 2.92%로 수렴한다. 4.08%의 차이가 볼록성 조정이다. 변동성이 클수록(\(\beta \uparrow\)), 그리고 평균회귀가 약할수록(\(b \downarrow\)) 이 조정이 커진다.
13.4 일드곡선의 형태
현물이자율 \(R(t)\)의 수준에 따라 일드곡선의 형태가 어떻게 달라지는지를 살펴보면, Vasicek 모형의 평균회귀 특성을 직관적으로 이해할 수 있다.
| \(R(t)\) 수준 | 일드곡선 형태 | 직관적 설명 |
|---|---|---|
| \(0.003\) (매우 낮음) | 단조증가 (우상향) | 이자율이 \(\tilde{R}\)보다 훨씬 낮아, 상승 기대 |
| \(0.03\) (장기극한 근처) | 낙타등(hump) 형태 | 단기 상승 후 볼록성 보정에 의해 하락 |
| \(0.12\) (매우 높음) | 단조감소 (우하향) | 이자율이 \(\tilde{R}\)보다 훨씬 높아, 하락 기대 |
Ho–Lee와의 중요한 차이점은, Vasicek에서는 어떤 초기 이자율에서 출발하더라도 장기 일드가 동일한 값 \(\tilde{R} - \frac{\beta^2}{2b^2}\)로 수렴한다는 것이다. 이것이 평균회귀의 "앵커" 효과이다.
13.5 정상분포 계산
장기적으로 \(R(\infty)\)의 분포를 계산한다.
$$R(\infty) \sim N\!\left(0.07,\;\frac{0.06^2}{2 \times 0.21}\right) = N(0.07,\; 0.00857)$$정상 표준편차는 \(\sqrt{0.00857} \approx 9.26\%\)이다. 95% 신뢰구간은 \(7\% \pm 1.96 \times 9.26\% \approx [-11.2\%, 25.2\%]\)이다. 음의 이자율이 발생할 확률은 \(P(R < 0) = \Phi(-0.07/0.0926) = \Phi(-0.756) \approx 22.5\%\)이다. 이것은 상당히 높은 수치로, Vasicek 모형의 알려진 한계를 보여준다.
13.6 오일러-마루야마 시뮬레이션
Vasicek 모형을 수치적으로 시뮬레이션하려면, 연속시간 SDE를 이산시간으로 근사해야 한다.
Vasicek 모형은 확산 계수가 상수 \(\beta\)이므로, 오일러 근사가 매우 정확하다. 또한 Vasicek SDE는 선형 SDE이므로 정확한 이산화(exact discretization)도 가능하다. 정확한 이산화 스킴은 다음과 같다.
이 스킴은 \(\Delta t\)의 크기에 관계없이 정확한 조건부분포를 재현하므로, 시뮬레이션 효율이 높다. 이것은 Vasicek 모형의 실무적 장점 중 하나이다.
Part 14. 장단점 정리
14.1 장점
Vasicek 모형의 가장 큰 장점은 평균회귀를 내장하고 있다는 것이다. 이자율이 장기 균형 수준으로 되돌아가는 현실적인 동학을 포착할 수 있으며, 이로 인해 정상분포가 존재하고, 장기 선도이자율이 유한한 값으로 수렴한다. 이것은 Merton이나 Ho–Lee 모형에서는 불가능한 것이다.
둘째, 할인채 가격, 선도이자율, 일드가 모두 닫힌형(아핀)으로 표현되므로, 캡, 스왑션 등 금리파생상품의 가격을 효율적으로 계산할 수 있다. 특히 유럽형 채권옵션에 대한 Jamshidian(1989)의 분해법을 적용하면, 아주 깔끔한 닫힌형 옵션 가격을 얻을 수 있다.
셋째, SDE가 선형이므로 적분인자 방법에 의해 해를 직접 구할 수 있다. 해의 구조가 명시적이어서 조건부분포, 정상분포, 모멘트 등을 모두 해석적으로 계산할 수 있다. 이러한 해석적 취급 가능성(tractability)은 교육적 목적으로도 이상적이다.
넷째, 정확한 이산화 스킴이 존재하므로 몬테카를로 시뮬레이션이 효율적이다. 또한 3개의 파라미터(\(\tilde{R}, b, \beta\))만으로 이자율 기간구조의 주요 특성을 설명할 수 있어 모형이 검약적(parsimonious)이다.
14.2 한계
Vasicek 모형의 첫 번째 한계는 음의 이자율 가능성이다. 절대적 변동성 \(\beta\)가 이자율 수준에 무관하므로, 이자율이 0 근처에서도 변동성이 줄어들지 않아 음수 영역으로 진입할 수 있다. 비록 2008년 이후 실제로 음의 금리가 관측되었지만, 극단적으로 큰 음수값도 양의 확률로 발생할 수 있다는 점은 여전히 비현실적이다.
둘째, 초기 일드곡선 적합의 불가능성이다. 파라미터가 모두 상수이므로, 시장에서 관측되는 복잡한 일드곡선을 정확히 재현할 수 없다. 이것은 실무에서 매우 중요한 요구사항인데, 옵션 가격결정의 시작점이 되는 할인곡선이 시장과 일치하지 않으면, 모형의 신뢰성이 크게 떨어지기 때문이다.
셋째, 1요인 모형이므로 시점 \(t\)에서 모든 만기의 할인채 가치들이 완전상관한다. \(C(\tau)\)와 \(A(\tau)\)가 결정론적 함수이므로, \(R(t)\)가 정해지면 모든 만기의 채권가격이 결정되기 때문이다. 현실에서는 단기채와 장기채의 가격이 완전상관하지 않으며, 일드곡선의 twist(비틀림)이나 butterfly(나비형) 움직임이 관측된다. Vasicek은 이를 포착할 수 없다.
넷째, 변동성이 상수이므로 금리 수준에 따른 변동성 변화를 반영하지 못한다. 실증적으로 금리가 높을 때 변동성이 크고 금리가 낮을 때 변동성이 작아지는 경향이 관측되는데, 이를 포착하려면 CIR 모형 등이 필요하다.
14.3 확장 방향
Hull–White 모형은 Vasicek의 가장 직접적인 확장이다. 상수 \(a\)를 시간함수 \(a(t)\)로 바꾸어 초기 일드곡선 적합을 가능하게 하면서, 평균회귀와 아핀 구조는 유지한다.
CIR 모형은 확산 계수를 \(\sigma\sqrt{R}\)로 설정하여 음의 이자율을 원천적으로 차단한다. 변동성이 금리 수준에 비례하므로 실증적 패턴과도 부합한다. 다만 해석적 취급이 Vasicek만큼 간단하지는 않다.
다요인 모형은 여러 개의 확률 요인을 도입하여 일드곡선의 다양한 움직임(수준, 기울기, 곡률)을 독립적으로 포착할 수 있게 한다. 확률적 변동성 모형은 변동성 자체도 확률과정으로 모델링하여 금리 옵션의 변동성 스마일/스큐를 설명한다.
Part 15. 연습문제
(초급) 문제 1 — 이토 공식 연습: 적분인자
\(R(u)\)가 Vasicek SDE \(dR = b[\tilde{R} - R]\,du + \beta\,dW^Q\)를 만족할 때, \(f(u, R) = e^{bu}R\)에 이토 공식을 적용하여 \(d(e^{bu}R)\)을 구하라.
(초급) 문제 2 — 조건부 분포
Vasicek 모형에서 \(R(T)\,|\,\mathcal{F}_t\)의 조건부 평균과 분산을 구하고, \(\tilde{R} = 0.05\), \(b = 0.3\), \(\beta = 0.02\), \(R(t) = 0.08\), \(\tau = 5\)일 때 수치적으로 계산하라.
(중급) 문제 3 — 할인채 가격 PDE
Vasicek 모형에서 할인채 가격 \(B(t,T)\)가 만족하는 PDE와 종단조건을 쓰고, 아핀 가정 \(B = \exp(-A(\tau) - C(\tau)R)\)를 대입하여 \(C(\tau)\)와 \(A(\tau)\)에 대한 ODE를 유도하라.
(중급) 문제 4 — Ho–Lee 극한
Vasicek의 \(C(\tau) = \frac{1}{b}(1 - e^{-b\tau})\)에서 \(b \to 0\)일 때 \(C(\tau) \to \tau\)임을 보이고, 이것이 Ho–Lee의 결과를 복원함을 설명하라.
(상급) 문제 5 — 장기 선도이자율의 유한성
Vasicek에서 \(\lim_{\tau \to \infty} F(t,T) = \tilde{R} - \frac{\beta^2}{2b^2}\)임을 보이고, Ho–Lee에서의 발산과 대비하여 평균회귀의 역할을 설명하라.
Part 16. 모범답안 / 해설
해설 1
\(f(u, R) = e^{bu}R\)의 편미분: \(f_u = be^{bu}R\), \(f_R = e^{bu}\), \(f_{RR} = 0\). Vasicek SDE의 드리프트 \(\mu = b(\tilde{R} - R)\), 확산 \(\sigma = \beta\)이다. 이토 공식에 의해 다음을 얻는다.
$$d(e^{bu}R) = [be^{bu}R + e^{bu} \cdot b(\tilde{R} - R) + \tfrac{1}{2} \cdot 0 \cdot \beta^2]\,du + e^{bu}\beta\,dW^Q$$ $$= [be^{bu}R + be^{bu}\tilde{R} - be^{bu}R]\,du + \beta e^{bu}\,dW^Q = b\tilde{R}\,e^{bu}\,du + \beta\,e^{bu}\,dW^Q$$\(R\)에 관한 항이 완전히 소거된다. 이것이 적분인자 방법의 핵심이다. \(f_{RR} = 0\)이므로 이토 보정항이 사라지며, 이는 적분인자 곱의 미분이 결정론적 ODE와 동일한 구조를 가지게 해준다.
해설 2
Part 9의 결과에 의해, 조건부 평균은 \(E_t^Q[R(T)] = e^{-b\tau}R(t) + (1 - e^{-b\tau})\tilde{R}\)이고, 조건부 분산은 \(\text{Var}_t^Q[R(T)] = \frac{\beta^2}{2b}(1 - e^{-2b\tau})\)이다.
수치 계산: \(e^{-0.3 \times 5} = e^{-1.5} \approx 0.2231\). 조건부 평균: \(0.2231 \times 0.08 + 0.7769 \times 0.05 = 0.01785 + 0.03884 = 0.0567\) (약 5.67%). 조건부 분산: \(\frac{0.02^2}{2 \times 0.3}(1 - e^{-3.0}) = \frac{0.0004}{0.6}(1 - 0.0498) = 0.000633\). 표준편차: \(\sqrt{0.000633} \approx 2.52\%\).
해설 3
Feynman-Kac 공식에 의해 할인채 가격이 만족하는 PDE는 다음과 같다.
$$B_t + b(\tilde{R} - R)B_R + \frac{1}{2}\beta^2 B_{RR} - R\,B = 0, \qquad B(T,T) = 1$$아핀 가정 \(B = \exp(-A(\tau) - C(\tau)R)\)를 대입한다. \(\tau = T - t\)이므로 \(B_t = B(A'(\tau) + C'(\tau)R)\), \(B_R = -C(\tau)B\), \(B_{RR} = C(\tau)^2 B\)이다. PDE에 대입하여 \(R\)의 계수를 분리하면, \(R\)의 계수: \(C'(\tau) + bC(\tau) - 1 = 0\), 초기조건 \(C(0) = 0\). 이 ODE의 해는 \(C(\tau) = \frac{1}{b}(1 - e^{-b\tau})\)이다. 상수항의 ODE에 \(C(\tau)\)를 대입하고 적분하면 \(A(\tau)\)를 복원한다.
해설 4
\(C(\tau) = \frac{1}{b}(1 - e^{-b\tau})\)에서 테일러 전개 \(e^{-b\tau} = 1 - b\tau + \frac{(b\tau)^2}{2} - \cdots\)를 적용하면, \(C(\tau) = \frac{1}{b}(b\tau - \frac{(b\tau)^2}{2} + \cdots) = \tau - \frac{b\tau^2}{2} + \cdots\)이다. \(b \to 0\)이면 \(C(\tau) \to \tau\)이다. 마찬가지로 분산에서도 \(b \to 0\)의 극한을 취하면, Vasicek의 \(v(\tau) \to \frac{\beta^2\tau^3}{3}\)으로 Ho–Lee의 분산을 복원한다. 이것은 Vasicek이 평균회귀를 갖춘 Ho–Lee의 일반화임을 확인시켜 준다.
해설 5
Vasicek 선도이자율 \(F(t,T) = (1 - e^{-b\tau})\tilde{R} - \frac{\beta^2}{2b^2}(1 - e^{-b\tau})^2 + e^{-b\tau}R(t)\)에서 \(\tau \to \infty\)이면 \(e^{-b\tau} \to 0\)이므로, \(F(t,T) \to \tilde{R} - \frac{\beta^2}{2b^2}\)이다. 이 값은 유한하다.
반면 Ho–Lee에서는 \(F(t,T) = \int_t^T \alpha(s)\,ds - \frac{\beta^2\tau^2}{2} + R(t)\)이고, \(-\frac{\beta^2\tau^2}{2}\) 항이 \(\tau^2\)에 비례하여 \(-\infty\)로 발산한다. 그 근본적 이유는 Ho–Lee에서 이자율의 누적 분산이 \(\beta^2\tau\)로 무한히 증가하기 때문이다. Vasicek에서는 평균회귀에 의해 이자율의 분산이 \(\frac{\beta^2}{2b}\)라는 유한한 값으로 수렴하므로, 볼록성 보정도 유한하게 묶인다. 이것이 평균회귀가 모형의 장기 행태를 안정화시키는 핵심 메커니즘이다.
핵심 공식 요약
| 항목 | 공식 |
|---|---|
| Vasicek SDE (\(Q\)) | \(dR(u) = b[\tilde{R} - R(u)]\,du + \beta\,dW^Q(u)\) |
| 해 | \(R(u) = \tilde{R} + e^{-b(u-t)}[R(t)-\tilde{R}] + \beta\int_t^u e^{-b(u-s)}\,dW^Q(s)\) |
| 조건부 평균 | \(E_t^Q[R(u)] = e^{-b(u-t)}R(t) + [1-e^{-b(u-t)}]\tilde{R}\) |
| 조건부 분산 | \(\text{Var}_t^Q[R(u)] = \frac{\beta^2}{2b}(1-e^{-2b(u-t)})\) |
| 정상분포 | \(R(\infty) \sim N(\tilde{R},\; \beta^2/(2b))\) |
| \(C(\tau)\) | \(\frac{1}{b}(1 - e^{-b\tau})\) |
| \(A(\tau)\) | \((\tau - C(\tau))\tilde{R} - \frac{1}{2}v(\tau)\) |
| 할인채 가격 | \(B(t,T) = \exp(-A(\tau) - C(\tau)R(t))\) |
| \(I(t,T)\) 분산 | \(v(\tau) = \frac{\beta^2}{2b^3}(2b\tau + 4e^{-b\tau} - e^{-2b\tau} - 3)\) |
| 선도이자율 | \(F(t,T) = (1-e^{-b\tau})\tilde{R} - \frac{\beta^2}{2b^2}(1-e^{-b\tau})^2 + e^{-b\tau}R(t)\) |
| 일드 | \(R(t,T) = \frac{A(\tau)}{\tau} + \frac{C(\tau)}{\tau}R(t)\) |
| 장기 극한 | \(\lim_{\tau \to \infty} F(t,T) = \lim_{\tau \to \infty} R(t,T) = \tilde{R} - \frac{\beta^2}{2b^2}\) |
| 할인채 SDE | \(dB = R(t)B\,dt - \beta C(\tau)B\,dW^Q\) |
| 선도이자율 민감도 | \(\frac{\partial F}{\partial R(t)} = e^{-b\tau},\quad \frac{\partial F}{\partial \tilde{R}} = 1 - e^{-b\tau}\) |
| 반감기 | \(\ln(2)/b \approx 0.693/b\) |
'Financial Engineering > 이자율 모형' 카테고리의 다른 글
| CIR 이자율 모형 (0) | 2026.02.11 |
|---|---|
| Hull–White 1요인 이자율 모형 (0) | 2026.02.11 |
| Merton 이자율 모형 (0) | 2026.02.11 |
| 채권가격의 PDE와 위험중립측도 (0) | 2026.02.11 |
| 블랙–숄즈 PDE와 금리모형 PDE (0) | 2026.02.11 |