본문 바로가기

Financial Engineering/이자율 모형

Merton 이자율 모형

Merton 이자율 모형

Merton 모형은 연속시간 이자율 모형 가운데 가장 단순한 구조를 가지는 모형으로, 단기이자율(short rate)이 상수 드리프트와 상수 변동성을 가지는 산술 브라운 운동(Arithmetic Brownian Motion)을 따른다고 가정한다. 비록 평균회귀가 없고 장기 선도이자율이 음의 무한대로 발산하는 등 현실적 한계가 명확하지만, 금리 모형의 기본 구조를 학습하기에 최적의 출발점이며, 이후 등장하는 Vasicek, CIR, Hull–White 등 모든 모형의 이론적 토대를 제공한다.

이 글에서는 확률미분방정식(SDE)의 기초가 되는 브라운 운동과 이토 미적분학(Itô calculus)부터 출발하여, Merton 모형의 정의와 해, 할인채 가격의 닫힌형(closed-form) 유도, 선도이자율 및 일드곡선 분석, 할인채의 SDE와 무차익 점검, 그리고 수치적 응용과 한계에 이르기까지 전 과정을 점진적으로 전개한다. 모든 핵심 결과에 대해서는 증명을 포함하였으며, 각 단계에서 왜 그러한 수학적 도구가 필요한지를 직관적으로 설명하는 데 중점을 두었다.


Part 1. 확률미분방정식(SDE) 기초

Merton 모형은 확률미분방정식(Stochastic Differential Equation, SDE)으로 기술된다. SDE를 이해하려면 먼저 그 "엔진"에 해당하는 브라운 운동이 무엇인지, 그리고 브라운 운동을 다룰 때 일반적인 미적분학과 무엇이 달라지는지를 명확히 파악해야 한다. 이 파트에서는 브라운 운동의 정의와 성질을 설명한 뒤, 확률미적분에서 핵심적인 역할을 하는 이차변동과 이토 곱셈 규칙을 유도하고, 최종적으로 SDE의 일반적 형태를 소개한다.

1.1 브라운 운동(Brownian Motion)

1.1.1 역사적 배경

브라운 운동(Brownian motion)은 금융공학에서 가장 근본적인 확률과정(stochastic process)이다. 이 이름은 1827년 스코틀랜드의 식물학자 로버트 브라운(Robert Brown)에서 유래하였다. 브라운은 현미경을 통해 물 위에 떠 있는 꽃가루 입자들이 끊임없이, 그리고 예측 불가능하게 움직이는 현상을 관찰하였다. 당시에는 이 현상의 원인을 설명할 수 없었으나, 1905년 알베르트 아인슈타인이 물 분자들의 무작위 충돌이 이 현상을 일으킨다는 이론적 설명을 제시하면서 수학적 기초가 확립되었고, 이후 노르베르트 위너(Norbert Wiener)에 의해 엄밀한 수학적 구성이 완성되었다. 위너의 공헌을 기려 브라운 운동을 위너 과정(Wiener process)이라고도 부른다.

금융공학에서 브라운 운동은 연속시간 확률과정의 표준적인 "잡음(noise)" 역할을 한다. 주가, 이자율, 환율 등 금융변수들의 예측 불가능한 무작위적 변동을 모델링할 때, 그 변동의 원천으로 브라운 운동을 사용하는 것이다. 만약 브라운 운동이라는 도구가 없었다면, 금융 모형은 모두 결정론적(deterministic)이 되어 현실의 불확실성을 전혀 반영하지 못하게 된다. 따라서 브라운 운동을 이해하는 것은 확률적 이자율 모형의 첫 번째 단계이다.

1.1.2 수학적 정의

브라운 운동은 확률공간 \((\Omega, \mathcal{F}, P)\)와 정보의 흐름을 나타내는 필트레이션(filtration) \(\{\mathcal{F}_t\}\) 위에서 정의된다. 구체적으로, 다음의 네 가지 성질을 동시에 만족하는 확률과정 \(\{W(t)\}_{t \ge 0}\)을 표준 브라운 운동이라 부른다.

브라운 운동의 네 가지 성질

성질 1 — 시작점 조건: \(W(0) = 0\)이다. 브라운 운동은 항상 원점에서 출발한다. 이것은 일종의 정규화(normalization) 조건으로, "시간 0에서 아직 아무런 무작위적 변동도 일어나지 않았다"는 것을 의미한다. 만약 다른 출발점 \(x_0\)에서 시작하는 과정이 필요하다면, 단순히 \(x_0 + W(t)\)로 이동시키면 된다.

성질 2 — 독립 증분(Independent Increments): 서로 겹치지 않는(non-overlapping) 시간 구간에서의 증분(increment)들은 통계적으로 서로 독립이다. 구체적으로, \(0 \le t_1 < t_2 \le t_3 < t_4\)일 때 \(W(t_2) - W(t_1)\)와 \(W(t_4) - W(t_3)\)는 통계적으로 독립이다. 이 성질의 의미는 심오하다. 과거의 움직임을 아무리 자세히 분석하더라도 미래의 움직임에 대한 어떠한 정보도 얻을 수 없다는 것이며, 이는 금융에서 효율적 시장 가설(Efficient Market Hypothesis)의 수학적 표현이기도 하다.

성질 3 — 정규분포 증분(Gaussian Increments): 시점 \(s\)에서 시점 \(t\)까지의 증분은 평균이 0이고 분산이 \((t-s)\)인 정규분포를 따른다. 즉, \(W(t) - W(s) \sim N(0, t-s)\)이다. 평균이 0이라는 것은 브라운 운동 자체에 어떤 방향으로의 편향(drift)도 없다는 뜻이다. 분산이 \((t-s)\)에 비례하므로 표준편차는 \(\sqrt{t-s}\)에 비례하며, 이는 불확실성이 시간의 제곱근에 비례하여 증가함을 의미한다. 이 "제곱근 스케일링"은 금융에서 매우 중요한 개념으로, 예를 들어 연간 변동성 20%를 일간 변동성으로 환산할 때 \(20\%/\sqrt{252} \approx 1.26\%\)가 되는 근거이기도 하다.

성질 4 — 연속 경로(Continuous Paths): 확률 1로(almost surely) 경로 \(t \mapsto W(t)\)가 연속이다. 즉, 점프(jump)나 불연속점이 존재하지 않는다. 그러나 흥미롭게도 이 경로는 어디에서도 미분 가능하지 않다(nowhere differentiable). 경로는 끊어지지 않지만 너무나 "거칠어서" 어떤 점에서도 접선을 그을 수 없다는 것이다. 바로 이 성질 때문에 일반적인 미적분학(뉴턴-라이프니츠 체계)을 브라운 운동에 그대로 적용할 수 없으며, 이토 미적분(Itô calculus)이라는 완전히 새로운 체계가 필요하게 된다.

1.1.3 미분 형태 \(dW\)의 직관적 이해

확률미분방정식에서는 브라운 운동의 "미분"을 형식적으로 \(dW(t) := W(t + dt) - W(t)\)로 정의한다. 성질 3(정규분포 증분)에 의해 \(dW(t) \sim N(0, dt)\)이므로, \(dW(t)\)의 표준편차는 \(\sqrt{dt}\)이다.

이 점이 확률미적분과 일반 미적분의 근본적인 차이를 만든다. 일반적인 미적분학에서 변수 \(x\)의 변화량 \(dx\)는 \(dt\)와 같은 크기(order)를 가진다. 그런데 확률미적분에서 \(dW\)의 "크기(스케일)"는 \(\sqrt{dt}\)이며, \(dt\)가 매우 작을 때 \(\sqrt{dt}\)는 \(dt\)보다 훨씬 크다. 구체적인 예를 들면, \(dt = 0.0001\)일 때 \(\sqrt{dt} = 0.01\)로, \(dW\)는 \(dt\)의 100배나 "큰" 크기를 가진다. 이 스케일 차이가 이토 미적분의 핵심이며, 테일러 전개에서 2차항을 무시할 수 없게 만드는 근본적인 이유이다. 이 점은 Part 2에서 이토 공식을 유도할 때 결정적인 역할을 하게 된다.


1.2 이차변동과 이토 곱셈 규칙

1.2.1 이차변동(Quadratic Variation)

이차변동은 "브라운 운동의 경로가 얼마나 거칠게 움직이는가"를 정량적으로 측정하는 도구이다. 직관적으로, 매끄러운 함수의 경로는 잘게 쪼갤수록 각 조각의 변화량이 매우 작아져서, 변화량의 제곱합은 0으로 수렴한다. 그러나 브라운 운동의 경로는 너무 거칠기 때문에, 아무리 잘게 쪼개더라도 변화량의 제곱합이 0으로 수렴하지 않고 양수의 값으로 수렴한다.

구체적으로, 시간 구간 \([0, T]\)를 \(n\)개의 동일한 작은 구간으로 나누어 \(0 = t_0 < t_1 < \cdots < t_n = T\), \(\Delta t = T/n\)이라 하자. 각 구간에서의 증분을 제곱하여 모두 더한 값, 즉 이차변동은 다음과 같이 수렴한다.

$$\sum_{i=1}^{n} \big(W(t_i) - W(t_{i-1})\big)^2 \;\xrightarrow{n \to \infty}\; T \quad (\text{확률적 수렴})$$

일반적인 매끄러운 함수 \(f(t)\)에 대해서는 같은 합이 \(\sum(f(t_i) - f(t_{i-1}))^2 \to 0\)으로 수렴하는데, 브라운 운동에서는 0이 아닌 양수 \(T\)로 수렴한다는 것이 핵심이다. 이것이 바로 브라운 운동 경로의 "거칠음"을 수학적으로 표현한 것이며, 이토 미적분이 존재하는 근본적인 이유이기도 하다.

이차변동이 \(T\)로 수렴하는 증명

증명의 전략은 다음과 같다. 먼저 이차변동의 기대값이 정확히 \(T\)임을 보이고, 그 다음 분산이 \(n \to \infty\)에서 0으로 수렴함을 보인다. 기대값이 \(T\)이면서 분산이 0이라면, 체비셰프 부등식에 의해 이차변동은 확률적으로 \(T\)에 수렴한다.

기대값 계산. 각 증분 \(\Delta W_i = W(t_i) - W(t_{i-1})\)는 정규분포 \(N(0, \Delta t)\)를 따른다. 정규분포의 성질에 의해 \(E[(\Delta W_i)^2] = \text{Var}(\Delta W_i) = \Delta t\)이다. \(n\)개의 구간에 대해 합하면, 기대값의 선형성에 의해 다음을 얻는다.

$$E\!\left[\sum_{i=1}^{n}(\Delta W_i)^2\right] = \sum_{i=1}^{n} E[(\Delta W_i)^2] = n \cdot \Delta t = n \cdot \frac{T}{n} = T$$

분산 계산. 정규분포의 4차 모멘트 공식을 사용한다. \(Z \sim N(0, \sigma^2)\)이면 \(E[Z^4] = 3\sigma^4\)이다. 이 공식을 적용하면 \(E[(\Delta W_i)^4] = 3(\Delta t)^2\)이고, 따라서 각 항의 분산은 다음과 같이 계산된다.

$$\text{Var}[(\Delta W_i)^2] = E[(\Delta W_i)^4] - \bigl(E[(\Delta W_i)^2]\bigr)^2 = 3(\Delta t)^2 - (\Delta t)^2 = 2(\Delta t)^2$$

독립 증분 성질에 의해 각 \((\Delta W_i)^2\)는 서로 독립이므로, 합의 분산은 개별 분산의 합이 된다.

$$\text{Var}\!\left[\sum_{i=1}^{n}(\Delta W_i)^2\right] = n \cdot 2(\Delta t)^2 = 2n \cdot \frac{T^2}{n^2} = \frac{2T^2}{n} \;\to\; 0 \quad (n \to \infty)$$

기대값은 정확히 \(T\)이고 분산은 0으로 수렴하므로, 체비셰프 부등식 \(P(|X - EX| > \epsilon) \le \text{Var}(X)/\epsilon^2\)에 의해 이차변동은 확률적으로 \(T\)에 수렴한다. \(\blacksquare\)

이 결과를 미분 형태로 쓰면 다음과 같은 중요한 계산 규칙을 얻는다.

$$(dW)^2 = dt$$

핵심: \((dW)^2\)은 비록 형식적으로는 확률변수이지만, 위의 증명에서 보았듯이 기대값이 \(dt\)이고 분산이 0에 가까우므로, 실질적으로 결정론적 상수 \(dt\)처럼 취급할 수 있다. 이것이 확률미적분에서 가장 중요한 단 하나의 규칙이며, 이토 공식의 "보정항"이 등장하는 근본적 원인이다.

1.2.2 이토 곱셈 규칙

위의 이차변동 결과와 크기 분석을 종합하면, 확률미적분에서 사용하는 곱셈 규칙을 체계적으로 정리할 수 있다. 먼저 \((dt)^2\)은 \(dt\)보다 훨씬 작은 고차항이므로 0으로 취급한다. 다음으로 \(dt \cdot dW\)는 크기가 \(dt \cdot \sqrt{dt} = (dt)^{3/2}\)이므로 역시 무시할 수 있다. 마지막으로 \((dW)^2\)은 이차변동에 의해 상수 \(dt\)로 수렴하므로, 0이 아닌 유일한 2차 항이다.

결과 이유
\((dt)^2\) \(0\) \(dt\)보다 훨씬 작은 고차항
\(dt \cdot dW\) \(0\) \((dt)^{3/2}\) 크기이므로 무시 가능
\((dW)^2\) \(dt\) 이차변동에 의해 상수 \(dt\)로 수렴

핵심 통찰: 일반 미적분에서는 \((dx)^2\)을 항상 무시할 수 있지만, 확률미적분에서는 \((dW)^2 = dt\)를 무시할 수 없다. 이 단 하나의 차이가 이토 미적분 전체를 지배한다. 다시 말해, 이토 미적분의 존재 이유는 결국 \((dW)^2 = dt \neq 0\)이라는 사실로 귀결되며, 이 단순한 규칙으로부터 이토 공식, 이토 적분의 성질, 나아가 금융에서의 볼록성 보정 등 모든 결과가 파생된다.


1.3 확률미분방정식의 일반적 형태

확률미분방정식(SDE)은 결정론적 변화와 확률론적 변화를 동시에 기술하는 방정식으로, 다음과 같은 일반적 형태를 가진다.

$$dX(t) = \mu(t, X(t))\,dt + \sigma(t, X(t))\,dW(t)$$

이 방정식의 우변은 두 개의 항으로 구성되어 있으며, 각각은 매우 다른 성격의 변화를 기술한다. 첫째 항 \(\mu(t, X(t))\,dt\)는 드리프트 항(drift term)이라 부른다. 이 항은 확률과정의 결정론적 추세, 즉 예측 가능한 체계적 변화를 나타낸다. 예를 들어 이자율이 매년 평균적으로 일정량만큼 상승하는 경향이 있다면, 이 드리프트 항이 그 경향을 기술한다. \(dt\)에 비례하므로 이 항은 "예측 가능한" 부분이며, 시간이 흐름에 따라 선형적으로 누적된다.

둘째 항 \(\sigma(t, X(t))\,dW(t)\)는 확산 항(diffusion term)이라 부른다. 이 항은 확률적 변동의 크기와 성격을 결정한다. 계수 \(\sigma\)는 변동성(volatility)에 해당하며, 이 값이 클수록 확률과정의 무작위적 변동 폭이 커진다. \(dW(t)\)가 무작위성의 원천이다. \(dW\)의 크기가 \(\sqrt{dt}\)이므로, 확산 항은 매우 짧은 시간 간격에서 드리프트 항보다 지배적이 된다. 이것이 고빈도 데이터에서 추세보다 잡음이 더 크게 보이는 이유의 수학적 설명이다.

이 SDE는 적분형으로도 동치하게 표현할 수 있다. 즉, \(X(t) = X(0) + \int_0^t \mu(s, X(s))\,ds + \int_0^t \sigma(s, X(s))\,dW(s)\)이다. 여기서 첫 번째 적분은 일반적인 리만 적분(Riemann integral)이고, 두 번째 적분은 이토 적분(Itô integral)이라는 특별한 확률적분이다. 이토 적분의 정확한 정의와 성질은 Part 3에서 다룬다.

Merton 모형과의 연결: Merton 모형은 이 일반적 SDE에서 \(\mu(t, X(t)) = a\)(상수), \(\sigma(t, X(t)) = \beta\)(상수)로 설정한 가장 단순한 경우이다. 드리프트와 확산이 모두 상수이므로 \(R(t)\)에 대해 선형 독립이며, 이 덕분에 SDE를 직접 적분하여 해를 구할 수 있다. 이러한 과정을 산술 브라운 운동(Arithmetic Brownian Motion) 또는 일반화 브라운 운동(Generalized Brownian Motion)이라 부른다.


Part 2. 이토 공식(Itô's Lemma)

2.1 왜 이토 공식이 필요한가?

일반적인 미적분학에서 \(y = f(x)\)이고 \(x\)가 \(t\)의 매끄러운 함수일 때, 체인룰(chain rule)은 \(dy = f'(x)\,dx\)로 매우 간단하다. 이 공식은 함수의 변화량을 변수의 변화량으로 표현해 주므로, 물리학과 공학에서 수없이 많은 문제를 해결하는 핵심 도구이다.

그런데 \(x\)가 브라운 운동을 포함하는 확률과정일 때, 이 체인룰은 더 이상 정확하지 않다. 그 이유는 본질적으로 매우 단순하면서도 심오하다.

체인룰이 실패하는 근본적 이유: 일반 미적분에서는 \(dx\)가 \(dt\)와 같은 크기를 가지므로, 테일러 전개의 2차항 \((dx)^2\)은 \((dt)^2\)에 비례하여 \(dt\)보다 훨씬 작아진다. 따라서 2차항을 무시하고 1차항만 남겨도 정확한 결과를 얻는다. 그러나 확률미적분에서는 \(dX\)가 \(dW\)를 포함하면 그 크기가 \(\sqrt{dt}\)가 되므로, \((dX)^2\)의 크기가 \(dt\)에 비례한다. \(dt\)는 무시할 수 없는 크기이므로, 테일러 전개의 2차항을 반드시 포함시켜야 한다. 이것이 체인룰이 실패하는 이유이며, 동시에 이토 공식이 존재하는 이유이다.

Merton 모형에서 이토 공식은 특히 Part 9(할인채의 SDE 유도)에서 결정적 역할을 한다. 할인채 가격 \(B(t,T) = \exp(\cdots)\)는 현물이자율 \(R(t)\)의 비선형 함수(지수함수)이므로, \(B(t,T)\)의 SDE를 구하려면 반드시 이토 공식을 적용해야 한다.

2.2 이토 공식의 유도

확률과정 \(X(t)\)가 SDE \(dX = \mu\,dt + \sigma\,dW\)를 만족하고, \(f(t,x)\)가 \(t\)에 대해 1번, \(x\)에 대해 2번 연속 미분 가능한 클래스 \(C^{1,2}\) 함수라고 하자. 우리의 목표는 합성함수 \(Y(t) = f(t, X(t))\)의 SDE를 구하는 것이다.

Step 1: 테일러 전개

\(f(t, X(t))\)의 테일러 전개를 2차항까지 수행하면 다음과 같다.

$$df = f_t\,dt + f_x\,dX + \tfrac{1}{2}f_{tt}(dt)^2 + \tfrac{1}{2}f_{xx}(dX)^2 + f_{tx}\,dt\,dX + \cdots$$

Step 2: 각 항의 크기 분석

\(dW \sim \sqrt{dt}\)이므로 \(dX = \mu\,dt + \sigma\,dW\)의 크기는 \(\sqrt{dt}\)이다. 이로부터 테일러 전개의 각 항이 \(dt\)의 크기까지 기여하는지를 판별할 수 있다. \(f_t\,dt\)는 크기가 \(dt\)이므로 기여하고, \(f_x\,dX\)는 \(\sqrt{dt}\) 크기이므로 역시 기여한다. 한편 \(\frac{1}{2}f_{tt}(dt)^2\)은 \((dt)^2\) 크기이므로 무시할 수 있고, \(f_{tx}\,dt\,dX\)는 \((dt)^{3/2}\) 크기이므로 역시 무시할 수 있다. 결정적으로, \(\frac{1}{2}f_{xx}(dX)^2\)은 \((dX)^2 \sim dt\) 크기이므로 무시할 수 없으며 반드시 포함해야 한다. 이것이 일반 체인룰과의 유일한 차이이다.

Step 3: \((dX)^2\)의 명시적 계산

\(dX = \mu\,dt + \sigma\,dW\)를 제곱하면 \((dX)^2 = \mu^2(dt)^2 + 2\mu\sigma\,dt\,dW + \sigma^2(dW)^2\)이다. 여기에 이토 곱셈 규칙을 적용하면, 첫째 항 \(\mu^2(dt)^2\)은 고차항이므로 사라지고, 둘째 항 \(2\mu\sigma\,dt\,dW\)는 \((dt)^{3/2}\) 크기이므로 사라지며, 셋째 항 \(\sigma^2(dW)^2\)만 이차변동에 의해 \(\sigma^2\,dt\)로 남는다.

$$(dX)^2 = \sigma^2\,dt$$

이 결과는 직관적으로도 의미가 있다. \((dX)^2\)에서 드리프트 \(\mu\)는 완전히 사라지고 오직 확산 계수 \(\sigma\)만 남는다는 것은, 매우 짧은 시간 간격에서는 "평균적 추세"보다 "무작위 변동"이 지배적이라는 물리적 사실의 수학적 표현이다. Merton 모형에서는 \(\mu = a\), \(\sigma = \beta\)이므로 \((dR)^2 = \beta^2\,dt\)가 된다.

2.3 이토 공식의 최종형

Step 1–3의 분석을 종합하면, 기여하는 항만 남겨서 다음의 이토 공식(Itô's Lemma)을 얻는다.

$$df = \left(f_t + \mu\,f_x + \tfrac{1}{2}\sigma^2 f_{xx}\right)dt + \sigma\,f_x\,dW$$

고전적 체인룰 \(df = f_t\,dt + f_x\,dX\)와 비교하면, 이토 공식에는 \(\frac{1}{2}\sigma^2 f_{xx}\,dt\)라는 추가항이 등장한다. 이것을 이토 보정항(Itô correction term)이라 부른다. 이 보정항은 변동성 \(\sigma\)와 함수의 2차 도함수 \(f_{xx}\)(즉 볼록성)의 곱으로 구성되어 있다.

이토 보정항의 직관적 의미: 이 항은 함수 \(f\)의 볼록성(convexity) 효과를 반영한다. \(f_{xx} > 0\)인 볼록함수에 대해서는 보정항이 양수로, 확률적 변동이 함수값의 기대값을 끌어올리는 효과를 낳는다. 반대로 \(f_{xx} < 0\)인 오목함수에서는 보정항이 음수로, 확률적 변동이 함수값의 기대값을 끌어내린다. 이것이 금융에서 유명한 "볼록성 편향(convexity bias)"의 수학적 근거이며, Merton 모형에서 할인채 가격에 \(\frac{\beta^2}{6}\tau^3\)이라는 볼록성 보정이 등장하는 이유이기도 하다.

2.4 이토 공식의 응용: \(\ln X(t)\)의 SDE

이토 공식의 가장 대표적이고 중요한 응용 예시를 하나 살펴보자. 확률과정 \(X(t)\)가 기하 브라운 운동(Geometric Brownian Motion) \(dX = \mu X\,dt + \sigma X\,dW\)를 따를 때, \(f(x) = \ln x\)에 이토 공식을 적용하면 다음과 같다.

\(\ln X(t)\)의 SDE 유도

\(f(x) = \ln x\)이므로 \(f_x = 1/x\), \(f_{xx} = -1/x^2\)이다. 시간에 대한 명시적 의존성은 없으므로 \(f_t = 0\)이다. SDE의 드리프트는 \(\mu X\)이고 확산은 \(\sigma X\)이므로, 이토 공식에 의해 다음을 얻는다.

$$d\ln X = \frac{1}{X}(\mu X\,dt + \sigma X\,dW) + \frac{1}{2}\left(-\frac{1}{X^2}\right)(\sigma X)^2\,dt$$ $$= \mu\,dt + \sigma\,dW - \frac{1}{2}\sigma^2\,dt = \left(\mu - \frac{1}{2}\sigma^2\right)dt + \sigma\,dW$$

이 결과에서 이토 보정항 \(-\frac{1}{2}\sigma^2\,dt\)가 등장한다. 로그함수는 오목(\(f_{xx} < 0\))하므로 보정항이 음수이다. 이것이 기하 브라운 운동(GBM)에서 로그수익률의 드리프트가 \(\mu\)가 아니라 \(\mu - \frac{1}{2}\sigma^2\)인 이유이며, Black-Scholes 모형에서 주가의 로그가 정규분포를 따를 때 기대수익률과 로그수익률의 평균 사이에 \(\frac{1}{2}\sigma^2\)만큼의 차이가 나는 근본적 원인이다.


Part 3. 이토 적분과 이토 등거리성(Itô Isometry)

3.1 이토 적분의 정의

이토 적분(Itô integral)은 확률과정을 브라운 운동에 대해 "적분"하는 것으로, \(\int_a^b f(u)\,dW(u)\)와 같이 표기한다. 이 적분의 결과는 일반 적분처럼 하나의 "숫자"가 아니라 확률변수라는 점에서 근본적으로 다르다. 리만 적분 \(\int_a^b g(x)\,dx\)는 주어진 함수와 구간에 대해 정해진 하나의 값을 가지지만, 이토 적분은 브라운 운동의 경로가 어떻게 실현되느냐에 따라 서로 다른 값을 가질 수 있다. 같은 확률 실험을 여러 번 반복하면, 매번 다른 브라운 운동 경로가 생성되고, 따라서 이토 적분의 값도 매번 달라진다.

이토 적분은 리만합(Riemann sum)의 극한으로 정의된다. 구간 \([a,b]\)를 \(a = t_0 < t_1 < \cdots < t_n = b\)로 분할하면 다음과 같다.

$$\int_a^b f(u)\,dW(u) = \lim_{n \to \infty} \sum_{i=1}^{n} f(t_{i-1})\bigl(W(t_i) - W(t_{i-1})\bigr)$$

여기서 결정적으로 중요한 것은 좌측값(left-endpoint) \(f(t_{i-1})\)을 사용한다는 점이다. 리만 적분에서는 구간의 어느 점을 선택하든(좌측, 우측, 중간점) 극한이 동일하지만, 확률적분에서는 선택에 따라 결과가 달라진다. 좌측값을 사용하는 것이 이토 적분이고, 중간점을 사용하는 것이 스트라토노비치(Stratonovich) 적분이다.

이토 적분에서 좌측값을 사용하는 데에는 깊은 금융적 의미가 있다. 투자자가 시점 \(t_{i-1}\)에서 보유량 \(f(t_{i-1})\)을 결정한 후, 시점 \(t_i\)까지 주가가 \(W(t_i) - W(t_{i-1})\)만큼 변동하는 것을 상상하면 된다. 투자 결정은 반드시 미래의 가격 변동을 관찰하기 전에 내려야 한다는 인과관계의 원칙이 좌측값 사용에 자연스럽게 반영되어 있는 것이다. 이 "미래를 보지 않는(non-anticipative)" 성질은 금융 모형의 물리적 합리성을 보장하는 핵심 조건이다.

3.2 이토 적분의 핵심 성질

성질 1: 기대값이 0 (마팅게일 성질)

$$E\!\left[\int_a^b f(u)\,dW(u)\right] = 0$$

이 성질은 이토 적분의 가장 기본적이면서도 중요한 성질이다. 리만합의 각 항 \(f(t_{i-1}) \cdot \Delta W_i\)를 생각하면, \(f(t_{i-1})\)은 시점 \(t_{i-1}\)에서 이미 결정된 값(또는 \(\mathcal{F}_{t_{i-1}}\)-가측인 확률변수)이고, \(\Delta W_i = W(t_i) - W(t_{i-1})\)는 미래의 증분으로 기대값이 0이다. 더구나 좌측값 선택에 의해 \(f(t_{i-1})\)과 \(\Delta W_i\)는 독립이므로, \(E[f(t_{i-1}) \cdot \Delta W_i] = f(t_{i-1}) \cdot E[\Delta W_i] = 0\)이다. 모든 항의 기대값이 0이므로 합의 기대값도 0이고, 극한에서도 이 성질이 보존된다.

금융적으로 이것은 이토 적분으로 구성된 투자전략이 "공정한 게임(fair game)"이라는 것, 즉 기대 손익이 0인 마팅게일이라는 것을 의미한다. Merton 모형에서 이 성질은 누적이자율 \(I(t,T)\)의 조건부 기대값을 계산할 때 확률적 항이 사라지는 이유를 직접적으로 제공한다.

성질 2: 이토 등거리성(Itô Isometry)

$$E\!\left[\left(\int_a^b f(u)\,dW(u)\right)^{\!2}\right] = \int_a^b f(u)^2\,du$$

좌변은 이토 적분의 "크기의 제곱"에 대한 기대값, 즉 \(L^2\) 노름의 제곱이다. 우변은 피적분함수를 제곱하여 시간에 대해 일반적으로 적분한 것이다. 이 등식이 의미하는 바는 매우 강력하다. 확률적 적분의 "크기"를 계산하기 위해 복잡한 확률론적 분석을 할 필요 없이, 피적분함수의 제곱을 결정론적으로 적분하기만 하면 된다는 것이다. 이토 등거리성은 Merton 모형에서 \(I(t,T) = \int_t^T R(u)\,du\)의 분산을 계산할 때 핵심적으로 사용된다.

3.3 이토 등거리성 증명

증명

Step 1. 구간 \([a,b]\)를 \(n\)개로 균등 분할한다. \(\Delta t = (b-a)/n\)으로 두고, 이토 적분을 리만합으로 근사하면 \(\int_a^b f(u)\,dW(u) \approx \sum_{i=1}^{n} f(t_{i-1})\,\Delta W_i\)이다. 여기서 \(\Delta W_i := W(t_i) - W(t_{i-1})\)이다.

Step 2. 이 합을 제곱하면, \((A_1 + A_2 + \cdots + A_n)^2\)을 전개하는 것과 같으므로, 대각항(\(A_i^2\))과 교차항(\(A_i A_j,\; i \neq j\))이 나타난다. 구체적으로 다음과 같이 분리된다.

$$\left(\sum_i f(t_{i-1})\,\Delta W_i\right)^{\!2} = \sum_i f(t_{i-1})^2\,(\Delta W_i)^2 + 2\!\sum_{i < j} f(t_{i-1})\,f(t_{j-1})\,\Delta W_i\,\Delta W_j$$

Step 3. 이제 양변의 기대값을 취한다. 대각항의 기대값은 다음과 같다. \(f(t_{i-1})\)이 결정론적 함수(또는 \(\mathcal{F}_{t_{i-1}}\)-가측)이고 \(\Delta W_i \sim N(0, \Delta t)\)이므로 \(E[f(t_{i-1})^2 \cdot (\Delta W_i)^2] = f(t_{i-1})^2 \cdot \Delta t\)이다.

교차항(\(i < j\))의 기대값이 핵심이다. \(\Delta W_i\)와 \(\Delta W_j\)는 서로 다른 시간 구간의 증분이므로, 브라운 운동의 독립 증분 성질에 의해 서로 독립이다. 또한 각각의 기대값이 \(E[\Delta W_i] = 0\)이므로 \(E[\Delta W_i \cdot \Delta W_j] = E[\Delta W_i] \cdot E[\Delta W_j] = 0\)이다. 따라서 모든 교차항의 기대값이 소멸한다. 이것이 증명의 핵심 단계이다.

Step 4. 교차항이 사라지므로 대각항만 남아서, \(E\bigl[\bigl(\sum_i f(t_{i-1})\,\Delta W_i\bigr)^2\bigr] = \sum_i f(t_{i-1})^2\,\Delta t\)를 얻는다. 우변은 함수 \(f(u)^2\)의 리만합이다. \(n \to \infty\)에서 이 리만합은 적분으로 수렴하므로, 최종적으로 다음을 얻는다.

$$E\!\left[\left(\int_a^b f(u)\,dW(u)\right)^{\!2}\right] = \int_a^b f(u)^2\,du \qquad \blacksquare$$

3.4 결정론적 \(f\)일 때의 정규분포 성질

만약 \(f(u)\)가 결정론적(비확률적) 함수라면, 이토 적분은 한층 더 강력한 성질을 가진다.

$$\int_a^b f(u)\,dW(u) \sim N\!\left(0,\;\int_a^b f(u)^2\,du\right)$$

이 결과의 직관적 이해는 다음과 같다. 리만합 \(\sum f(t_{i-1})\,\Delta W_i\)에서 각 \(\Delta W_i\)는 정규분포 \(N(0, \Delta t)\)를 따르고 서로 독립이며, \(f(t_{i-1})\)은 결정론적 상수이다. 따라서 이 합은 독립인 정규확률변수들의 선형결합이다. 확률론의 기본 정리에 의해 "독립인 정규분포의 선형결합은 다시 정규분포"이므로, 이 합은 정규분포를 따른다. 기대값은 성질 1에 의해 0이고, 분산은 이토 등거리성에 의해 \(\int_a^b f(u)^2\,du\)이다. 극한에서도 이 정규분포 성질이 보존된다.

Merton 모형과의 연결: 이 결과는 Merton 모형에서 단기이자율 \(R(u)\)가 정규분포를 따르는 핵심 이유이다. Part 6에서 보게 되겠지만, Merton 모형의 해에서 확률적 부분은 상수 \(\beta\)에 대한 이토 적분 \(\beta(W^Q(t) - W^Q(s))\)이다. 나아가 누적이자율 \(I(t,T) = \int_t^T R(u)\,du\)의 확률적 부분은 결정론적 커널 \(\beta(T-u)\)에 대한 이토 적분 형태가 된다. 바로 이 성질 덕분에 \(I(t,T)\)의 조건부분포가 정규분포가 되고, 할인채 가격이 닫힌형으로 표현 가능해지는 것이다.


Part 4. 정규분포 지수의 기대값

4.1 핵심 보조정리

이 보조정리는 Merton 모형에서 할인채 가격을 닫힌형으로 표현하는 데 결정적인 역할을 한다. 할인채의 가격은 \(B(t,T) = E_t^Q[\exp(-\int_t^T R(u)\,du)]\)인데, 만약 적분 \(\int_t^T R(u)\,du\)가 정규분포를 따른다면(Part 7에서 이를 증명한다), 할인채 가격 계산은 정확히 다음 보조정리의 형태가 된다.

$$X \sim N(\mu, \sigma^2) \implies E[e^X] = \exp\!\left(\mu + \tfrac{1}{2}\sigma^2\right)$$

4.2 증명 (완전제곱 방법)

\(X \sim N(\mu, \sigma^2)\)의 확률밀도함수는 \(f_X(x) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\)이다.

Step 1. 기대값의 정의에 따라, \(E[e^X] = \int_{-\infty}^{\infty} e^x \cdot \frac{1}{\sqrt{2\pi\sigma^2}}\exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)dx\)이다.

Step 2. 피적분함수의 지수 부분을 하나로 합친다. \(e^x\)와 밀도함수의 지수 부분을 결합하면 \(x - \frac{(x-\mu)^2}{2\sigma^2}\)이 된다. 이것을 공통분모로 정리하면 \(\frac{2\sigma^2 x - (x-\mu)^2}{2\sigma^2}\)이다.

Step 3. 분자를 전개한다. \(2\sigma^2 x - (x^2 - 2\mu x + \mu^2) = -x^2 + 2(\mu + \sigma^2)x - \mu^2\)이다.

Step 4. 핵심 기법인 완전제곱식 만들기를 적용한다. \(x^2 - 2(\mu+\sigma^2)x\)에서 "\(\mu+\sigma^2\)"를 중심으로 완전제곱을 만들면, \(x^2 - 2(\mu+\sigma^2)x + \mu^2 = [x - (\mu+\sigma^2)]^2 - (\mu+\sigma^2)^2 + \mu^2\)이다. 따라서 원래 지수 부분은 다음과 같이 분리된다.

$$x - \frac{(x-\mu)^2}{2\sigma^2} = -\frac{[x-(\mu+\sigma^2)]^2}{2\sigma^2} + \frac{(\mu+\sigma^2)^2 - \mu^2}{2\sigma^2}$$

Step 5. 나머지 상수항을 계산하면 \(\frac{(\mu+\sigma^2)^2 - \mu^2}{2\sigma^2} = \frac{2\mu\sigma^2 + \sigma^4}{2\sigma^2} = \mu + \frac{\sigma^2}{2}\)이다.

Step 6. 적분을 완성한다. 상수항을 밖으로 빼면, 남은 적분은 평균이 \(\mu+\sigma^2\)이고 분산이 \(\sigma^2\)인 정규분포의 밀도함수를 전 구간에서 적분하는 것이므로 값이 정확히 1이다.

$$E[e^X] = \exp\!\left(\mu + \frac{\sigma^2}{2}\right) \cdot \underbrace{\int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi\sigma^2}}\exp\!\left(-\frac{[x-(\mu+\sigma^2)]^2}{2\sigma^2}\right)dx}_{= 1} = \exp\!\left(\mu + \tfrac{1}{2}\sigma^2\right) \quad \blacksquare$$

직관적 해석: 이 결과에서 가장 중요한 점은 \(E[e^X] \neq e^{E[X]} = e^\mu\)라는 것이다. 차이는 \(\frac{1}{2}\sigma^2\)만큼의 "볼록성 프리미엄"이다. 지수함수 \(e^x\)는 볼록(convex)하므로, 옌센 부등식(Jensen's inequality)에 의해 \(E[e^X] > e^{E[X]}\)이다. 분산이 클수록(즉 불확실성이 클수록) 이 프리미엄은 더 커지며, 이것이 금융에서 "변동성이 크면 볼록성의 이점이 커진다"는 직관의 수학적 근거이다. Merton 모형에서 할인채 가격의 \(\frac{\beta^2}{6}\tau^3\) 항이 바로 이 볼록성 프리미엄에 해당한다.


Part 5. 위험중립측도와 채권 가격결정

5.1 현실측도 vs 위험중립측도

금융에서 자산 가격을 결정하려면 미래 현금흐름의 기대값을 구해야 하는데, 이때 "어떤 확률측도 하에서의 기대값인가"가 결정적으로 중요하다. 현실측도(Physical Measure) \(P\)는 우리가 실제 세계에서 관측하는 확률분포이다. 이 측도 하에서 투자자들은 위험을 싫어하므로, 위험이 큰 자산에 대해 추가적인 보상(위험프리미엄)을 요구한다. 따라서 \(P\) 하에서의 기대수익률에는 위험프리미엄이 포함되어 있다.

위험중립측도(Risk-Neutral Measure) \(Q\)는 가격결정을 위해 인위적으로 구성한 수학적 도구이다. 이 "가상의 세계"에서는 모든 투자자가 위험에 무관심(risk-neutral)하며, 따라서 모든 자산의 기대수익률이 무위험이자율과 동일하다. 현실에서 투자자들이 실제로 위험중립적이라는 뜻이 아니라, 무차익(No-Arbitrage) 원리를 만족하는 가격체계가 존재하면, 그에 대응하는 확률측도 \(Q\)가 존재한다는 것이다. 이 측도 하에서의 기대값으로 자산 가격을 계산하면, 위험프리미엄을 명시적으로 다룰 필요 없이 올바른 무차익 가격을 얻을 수 있다.

$$\text{자산의 가격} = E^Q[\text{할인된 미래 현금흐름}]$$

5.2 기라노프 정리(Girsanov Theorem)

\(P\) 하에서 브라운 운동 \(\{W^{P}(t)\}\)가 있을 때, 예측가능한 과정 \(\lambda(t)\)에 대하여 다음과 같이 정의하면

$$dW^{Q}(t) = dW^{P}(t) + \lambda(t)\,dt \quad\Longleftrightarrow\quad W^{Q}(t) = W^{P}(t) + \int_{0}^{t}\lambda(s)\,ds$$

\(\{W^{Q}(t)\}\)가 \(Q\) 하에서 브라운 운동이 되도록 하는 측도 \(Q\)를 구성할 수 있다. 여기서 \(\lambda(t)\)는 위험의 시장가격(Market Price of Risk)이다. 직관적으로 설명하면, 현실세계에서 위험자산의 드리프트에 포함되어 있던 위험프리미엄을 "흡수"하여 브라운 운동의 드리프트를 조정함으로써, 위험중립세계에서의 새로운 브라운 운동을 만드는 것이다.

기라노프 정리의 수학적 의미는 "측도 전환은 브라운 운동의 드리프트 조정으로 실현된다"는 것이며, 이것이 현실측도와 위험중립측도를 연결하는 다리 역할을 한다. Merton 모형에서는 위험중립측도 \(Q\) 하에서의 SDE를 직접 명시하므로, 기라노프 정리를 명시적으로 적용할 필요 없이 바로 가격결정에 들어갈 수 있다. 다만 모형의 파라미터 \(a\)가 현실측도에서의 드리프트와 위험프리미엄의 결합이라는 점을 이해하는 것이 중요하다.

5.3 할인채의 위험중립 가격결정

단기이자율(short rate) \(R(u)\)가 주어질 때, 만기 \(T\)에 1원을 지급하는 할인채(zero-coupon bond)의 시점 \(t\)에서의 가격은 위험중립 가격결정 공식에 의해 다음과 같이 표현된다.

$$B(t,T) = E_t^Q\!\left[\exp\!\left(-\int_t^T R(u)\,du\right)\right]$$

여기서 \(E_t^Q\)는 시점 \(t\)까지의 정보 \(\mathcal{F}_t\)가 주어진 조건부 기대값을 위험중립측도 \(Q\) 하에서 계산한 것이다. 적분 \(\int_t^T R(u)\,du\)는 시점 \(t\)에서 만기 \(T\)까지의 누적 할인율을 나타내며, 이것의 지수함수를 취한 것이 할인인자(discount factor)이다. Merton 모형의 최종 목표는 이 기대값을 닫힌형(closed-form)으로 계산하는 것이며, 이를 위해서는 \(\int_t^T R(u)\,du\)의 확률분포를 알아야 한다. Part 7에서 이 분포가 정규분포임을 증명하고, Part 4의 보조정리를 적용하여 닫힌형을 유도한다.


Part 6. Merton 이자율 모형의 정의

6.1 역사적 배경과 모형의 위치

Robert C. Merton(1973)이 제안한 이 모형은 연속시간에서 단기이자율의 확률적 행태를 기술한 최초의 모형 중 하나이다. Merton 모형은 이자율 모형의 역사에서 가장 첫 번째 단계에 해당하며, 이후 등장하는 모든 모형의 출발점이 된다. 학문적으로는 종종 "장난감 모형(toy model)"이라 불리지만, 이것은 폄하가 아니라 "핵심 구조를 가장 투명하게 보여주는 모형"이라는 의미이다.

Merton 모형이 왜 등장했으며, 이후 어떤 모형들로 발전했는지를 살펴보면 금리 모형 전체의 흐름을 이해할 수 있다.

모형 SDE 평균회귀 초기곡선 적합 음수 금리
Merton (1973) \(dR = a\,du + \beta\,dW\) 없음 불가 가능
Vasicek (1977) \(dR = b(\theta - R)\,dt + \beta\,dW\) 있음 불가 가능
CIR (1985) \(dR = b(\theta - R)\,dt + \sigma\sqrt{R}\,dW\) 있음 불가 불가능
Ho–Lee (1986) \(dR = \alpha(u)\,du + \beta\,dW^Q\) 없음 가능 가능
Hull–White (1990) \(dR = (a(u) - b(u)R)\,du + \beta(u)\,dW^Q\) 있음 가능 가능

Merton 모형은 드리프트와 확산이 모두 상수인 가장 단순한 구조이다. Vasicek 모형은 Merton의 상수 드리프트 \(a\)를 \(b(\theta - R)\)로 교체하여 평균회귀를 도입한 중요한 진보였다. 이자율이 장기 평균 \(\theta\)보다 높으면 드리프트가 음수가 되어 이자율을 끌어내리고, 반대의 경우에는 끌어올린다. 이는 중앙은행의 통화정책이 이자율을 특정 수준으로 유도하려는 현실을 반영한 것이다. 그러나 Vasicek 모형도 정규분포 모형이므로 음의 금리 가능성은 여전히 남아 있었다.

CIR(Cox-Ingersoll-Ross) 모형은 확산 계수를 \(\sigma\sqrt{R}\)로 설정하여, 이자율이 0에 가까워지면 변동성도 함께 줄어들게 만들었다. 이 구조 덕분에 이자율이 음수가 되는 것이 수학적으로 불가능하다(Feller 조건 하에서). 그러나 CIR은 해가 비중심 카이제곱 분포를 따르므로 수학적 취급이 더 복잡해진다.

Ho–Lee 모형은 Merton의 상수 드리프트를 시간의존 함수 \(\alpha(u)\)로 일반화하여, 시장에서 관측되는 초기 일드곡선을 정확히 적합할 수 있게 한 최초의 모형이다. 수학적으로 Merton 모형에서 \(a\)를 \(\alpha(u)\)로 바꾼 것에 불과하므로, Merton 모형을 완전히 이해하면 Ho–Lee로의 확장은 매우 자연스럽다.

6.2 확률미분방정식

Merton 모형에서 순간이자율(short rate) \(\{R(u)\}\)는 다음의 확률미분방정식을 만족한다.

$$dR(u) = a\,du + \beta\,dW^Q(u)$$

여기서 \(a\;(> 0)\)는 상수 드리프트 계수이고, \(\beta\;(> 0)\)는 상수 확산 계수(변동성)이며, \(\{W^Q(t)\}\)는 위험중립확률측도 \(Q\) 하에서의 브라운 운동이다.

이 SDE의 구조를 자세히 살펴보면 몇 가지 중요한 특징이 드러난다.

첫째, 드리프트가 상수이다. \(a\,du\) 항은 이자율이 불확실성이 없다면 매 순간 \(a\)의 속도로 증가한다는 것을 의미한다. 이 항은 시간 \(u\)에도 의존하지 않고 이자율 \(R\) 자체에도 의존하지 않는다. 예를 들어 \(a = 0.02\)이면, 이자율은 매년 평균적으로 2%p씩 상승하는 추세를 가진다. 만약 \(\beta = 0\)이라면 \(dR = a\,dt\)가 되어, 이자율은 단순히 \(R(t) = R(0) + at\)라는 직선을 따라 움직이게 된다.

둘째, 확산 계수가 상수이다. \(\beta\,dW^Q(u)\) 항에서 \(\beta\)가 상수라는 것은 이자율의 변동 폭이 이자율 수준에 관계없이 일정하다는 가정이다. 이자율이 1%일 때나 10%일 때나 같은 크기의 무작위 변동을 겪는다는 것이다. 이는 CIR 모형의 \(\sigma\sqrt{R}\,dW\)와 대조되는데, CIR에서는 이자율이 높을수록 변동 폭이 커진다.

셋째, SDE가 \(R(u)\)에 대해 선형 독립이다. 드리프트 \(a\)도 확산 \(\beta\)도 \(R\)에 의존하지 않으므로, 이 SDE는 변수 \(R\)에 대해 가장 단순한 형태를 가진다. 이 덕분에 특별한 기법(예: 변수변환, 적분인자) 없이 양변을 직접 적분하여 해를 구할 수 있다.

평균회귀의 부재: Merton 모형의 가장 근본적인 한계는 평균회귀(mean reversion)가 없다는 것이다. 현실에서 이자율은 중앙은행의 통화정책에 의해 특정 수준으로 유도되는 경향이 있다. 이자율이 지나치게 높아지면 중앙은행이 금리를 인하하고, 너무 낮아지면 인상한다. 이러한 "되돌림" 메커니즘이 평균회귀인데, Merton 모형의 드리프트는 상수 \(a\)이므로 현재 이자율 수준과 무관하게 항상 같은 방향으로 일정한 속도로 움직인다. 이것은 이자율이 한 방향으로 계속 표류(drift)해 나갈 수 있다는 비현실적 함의를 가진다.

6.3 SDE의 해

Merton 모형의 SDE는 드리프트와 확산이 모두 \(R\)에 무관한 "상수 계수 SDE"이므로, 특별한 기법 없이 직접 적분으로 해를 구할 수 있다. 양변을 시점 \(s\)에서 \(t\;(> s)\)까지 적분하면 다음과 같다.

$$\int_s^t dR(u) = \int_s^t a\,du + \int_s^t \beta\,dW^Q(u)$$

좌변은 \(R(t) - R(s)\)이고, 첫째 우변 항은 상수 \(a\)의 적분이므로 \(a(t-s)\)이며, 둘째 우변 항은 상수 \(\beta\)를 이토 적분 밖으로 빼면 \(\beta(W^Q(t) - W^Q(s))\)가 된다. 따라서 최종 해는 다음과 같다.

$$R(t) = R(s) + a(t - s) + \beta\bigl(W^Q(t) - W^Q(s)\bigr)$$

이 해의 구조를 분석하면 세 부분으로 명확히 분리됨을 알 수 있다.

첫째 항 \(R(s)\)는 시점 \(s\)에서의 이자율로, 초기조건으로부터 결정되는 고정된 상수이다. 시점 \(s\)에서 관찰자가 이미 알고 있는 정보이다.

둘째 항 \(a(t-s)\)는 드리프트에 의해 결정되는 예측 가능한(결정론적) 부분이다. 경과 시간 \((t-s)\)에 비례하여 선형적으로 증가한다. 이 항이 양수이면 이자율은 평균적으로 상승하는 추세를 가지고, 음수이면 하락 추세를 가진다.

셋째 항 \(\beta(W^Q(t) - W^Q(s))\)는 브라운 운동에 의한 무작위 변동이다. \(W^Q(t) - W^Q(s) \sim N(0, t-s)\)이므로 \(\beta(W^Q(t) - W^Q(s)) \sim N(0, \beta^2(t-s))\)이다. 이 항이 이자율에 불확실성을 부여하며, 시간이 지남에 따라 불확실성의 크기(\(\beta\sqrt{t-s}\))가 시간의 제곱근에 비례하여 증가한다.

6.4 \(R(t)\)의 조건부 분포

처음 두 항은 결정론적이고 세 번째 항만 확률적이므로, \(R(t)\)는 조건부로 정규분포를 따른다.

$$R(t)\,|\,\mathcal{F}_s \;\sim\; N\!\left(R(s) + a(t-s),\;\; \beta^2(t-s)\right)$$

이 분포의 성질을 명시적으로 정리하면 다음과 같다.

조건부 평균: \(E_s^Q[R(t)] = R(s) + a(t-s)\). 이것은 현재 이자율에서 출발하여 드리프트만큼 선형적으로 이동한 값이다.

조건부 분산: \(\text{Var}_s^Q[R(t)] = \beta^2(t-s)\). 분산이 경과 시간에 비례한다는 것은, 더 먼 미래의 이자율일수록 예측의 불확실성이 커짐을 의미한다. 표준편차로 환산하면 \(\beta\sqrt{t-s}\)이다.

음의 이자율 가능성: \(R(t)\)가 정규분포를 따르므로 이론적으로 \(-\infty\)부터 \(+\infty\)까지 모든 값을 가질 수 있다. 따라서 \(R(t) < 0\)이 될 확률이 항상 양수이다. 구체적으로, 표준정규분포 \(\Phi\)를 사용하면 음의 이자율 확률은 다음과 같이 계산된다.

$$P(R(t) < 0\,|\,\mathcal{F}_s) = \Phi\!\left(-\frac{R(s) + a(t-s)}{\beta\sqrt{t-s}}\right)$$

이 확률은 \(R(s)\)가 크거나 \(a\)가 클수록(즉 이자율이 높은 영역에 있을수록) 작아지지만, 결코 0이 되지는 않는다. 이것은 Merton 모형의 대표적 단점으로 지적되어 왔다. 다만 2008년 글로벌 금융위기 이후 유럽과 일본에서 실제로 음의 금리가 관측되면서, 이 "단점"에 대한 재평가가 이루어지고 있다.


Part 7. 할인채 가격의 닫힌형

이 Part에서는 Merton 모형의 가장 핵심적인 결과, 즉 할인채 가격의 닫힌형(closed-form) 표현을 유도한다. 이를 위해 먼저 누적이자율 적분 \(I(t,T)\)의 분포를 구하고, Part 4의 보조정리를 적용하여 채권가격을 구한 뒤, 이를 해석한다.

7.1 \(I(t,T)\)의 정의

할인채 가격 공식 \(B(t,T) = E_t^Q[\exp(-\int_t^T R(u)\,du)]\)에서 핵심은 누적이자율 적분의 분포를 아는 것이다. 이 적분을 \(I(t,T) := \int_t^T R(u)\,du\)로 정의한다.

7.2 \(I(t,T)\)의 전개

Part 6에서 구한 \(R(u)\)의 해(시점 \(t\) 기준)를 대입하여 적분한다. \(R(u) = R(t) + a(u-t) + \beta(W^Q(u) - W^Q(t))\)이므로 다음과 같다.

$$I(t,T) = \int_t^T \!\left[R(t) + a(u-t) + \beta\bigl(W^Q(u) - W^Q(t)\bigr)\right]du$$

이 적분을 세 부분으로 나누어 각각 계산한다.

첫째 항 (I): 초기값 기여분

\(R(t)\)는 시점 \(t\)에서 알려진 상수이므로 적분 밖으로 빼면 다음과 같다.

$$\text{(I)} = \int_t^T R(t)\,du = R(t) \cdot (T - t) = \tau\,R(t)$$

여기서 \(\tau = T - t\)는 잔존만기(time to maturity)이다.

둘째 항 (II): 드리프트 기여분

상수 드리프트 \(a\)에 의한 기여분을 계산한다. \(u - t\)를 \(t\)에서 \(T\)까지 적분하는 것이므로 다음과 같다.

$$\text{(II)} = \int_t^T a(u-t)\,du = a\!\left[\frac{(u-t)^2}{2}\right]_t^T = \frac{a}{2}(T-t)^2 = \frac{a\,\tau^2}{2}$$

Merton 모형에서는 드리프트가 상수 \(a\)이므로, Ho–Lee에서처럼 Fubini 정리를 적용하여 적분 순서를 교환할 필요가 없다. 직접 적분이 가능하며, 결과는 \(\tau^2\)에 비례한다.

셋째 항 (III): 확률적 기여분 — 확률적 Fubini 정리 적용

이 항은 브라운 운동의 시간 적분으로, Merton 모형에서 가장 기술적인 계산이 필요한 부분이다.

$$\text{(III)} = \beta\int_t^T \bigl(W^Q(u) - W^Q(t)\bigr)\,du$$

이 적분을 직접 계산하는 것은 까다로운데, 피적분함수가 확률과정이기 때문이다. 이를 처리하기 위해 확률적 Fubini 정리를 적용하면, 이 시간 적분을 이토 적분으로 변환할 수 있다. 브라운 운동의 증분 표현 \(W^Q(u) - W^Q(t) = \int_t^u dW^Q(v)\)를 대입하면 다음과 같다.

$$\text{(III)} = \beta\int_t^T\!\left(\int_t^u dW^Q(v)\right)du$$

원래 적분 영역은 \(t \le v \le u \le T\)이다. Fubini 정리에 의해 적분 순서를 교환하면, \(v\)를 먼저 고정하고 \(u\)를 \(v\)에서 \(T\)까지 적분하는 형태가 된다.

$$\text{(III)} = \beta\int_t^T (T - v)\,dW^Q(v)$$

여기서 가중 인자 \((T-v)\)의 의미는 매우 직관적이다. 시점 \(v\)에서 발생한 브라운 운동의 충격 \(dW^Q(v)\)는 그 이후 \([v, T]\) 구간 동안 이자율에 계속 영향을 미치므로, 그 영향이 누적되는 시간이 \((T-v)\)인 것이다. 시점 \(t\) 직후에 발생한 충격은 거의 \(\tau\)만큼 오래 누적되고, 만기 직전에 발생한 충격은 거의 누적되지 않는다.

7.3 종합 결과

$$I(t,T) = \tau\,R(t) + \frac{a\,\tau^2}{2} + \beta\int_t^T (T-u)\,dW^Q(u)$$

이 결과의 구조를 해석하면 다음과 같다. 처음 두 항은 시점 \(t\)에서 완전히 알려진 결정론적 값이다. 마지막 항은 결정론적 커널 \(\beta(T-u)\)에 대한 이토 적분이다. Part 3.4에서 증명했듯이, 결정론적 함수에 대한 이토 적분은 정규분포를 따른다. 따라서 \(I(t,T)\)는 시점 \(t\)에서의 정보가 주어진 조건부로 정규분포를 따르며, 이것이 할인채 가격의 닫힌형 유도를 가능하게 만드는 핵심 사실이다.

7.4 조건부 평균

이토 적분의 기대값이 0이라는 성질(Part 3.2의 성질 1)에 의해, 확률적 항은 기대값 계산에서 사라진다.

$$m(t,T) := E_t^Q[I(t,T)] = \tau\,R(t) + \frac{a\,\tau^2}{2}$$

이 조건부 평균의 의미를 해석하면 다음과 같다. 첫째 항 \(\tau\,R(t)\)는 이자율이 현재 수준 \(R(t)\)에서 변하지 않는다고 가정할 때의 누적이자이다. 둘째 항 \(\frac{a\tau^2}{2}\)는 드리프트 \(a\)에 의해 이자율이 점진적으로 상승함에 따라 추가로 발생하는 누적이자이다. \(\tau^2\)에 비례하는 것은 드리프트가 시간에 따라 선형적으로 이자율을 증가시키고, 이 증가분을 다시 시간에 대해 적분하기 때문이다.

7.5 조건부 분산

분산은 확률적 항에서만 기여하며, 이토 등거리성(Part 3.2의 성질 2)을 적용하여 계산한다.

$$v(t,T) := \text{Var}_t^Q[I(t,T)] = \frac{\beta^2\,\tau^3}{3}$$

분산 계산의 상세 유도

이토 등거리성에 의해 확률적 항의 제곱의 기대값은 다음과 같다.

$$E_t^Q\!\left[\left(\int_t^T \beta(T-u)\,dW^Q(u)\right)^{\!2}\right] = \int_t^T \beta^2(T-u)^2\,du$$

우변의 적분을 \(x = T - u\)로 치환하면 \(du = -dx\)이고 적분 한계가 \(u=t\)에서 \(x=\tau\), \(u=T\)에서 \(x=0\)으로 바뀌므로 다음과 같다.

$$\beta^2\int_0^\tau x^2\,dx = \beta^2 \cdot \left[\frac{x^3}{3}\right]_0^\tau = \beta^2 \cdot \frac{\tau^3}{3} = \frac{\beta^2\,\tau^3}{3}$$

분산이 \(\tau^3\)에 비례한다는 것은 매우 중요한 성질이다. 만기가 2배로 길어지면 분산은 8배로 증가하고, 표준편차는 \(2\sqrt{2} \approx 2.83\)배로 증가한다. 이것은 누적이자율의 불확실성이 만기에 대해 매우 빠르게 증가함을 의미하며, 장기 채권의 가격 불확실성이 단기 채권에 비해 급격히 커지는 이유의 수학적 설명이다. \(\blacksquare\)

7.6 할인채 가격 닫힌형

이제 모든 조각이 갖추어졌다. \(I(t,T)\,|\,\mathcal{F}_t \sim N(m(t,T),\; v(t,T))\)이고, 할인채 가격은 \(B(t,T) = E_t^Q[e^{-I(t,T)}]\)이다. \(-I(t,T)\,|\,\mathcal{F}_t \sim N(-m, v)\)이므로, Part 4의 보조정리 \(E[e^X] = \exp(\mu + \frac{1}{2}\sigma^2)\)를 적용하면 다음을 얻는다.

$$B(t,T) = \exp\!\left(-m(t,T) + \tfrac{1}{2}\,v(t,T)\right)$$

\(m(t,T)\)과 \(v(t,T)\)를 대입하면 최종적으로 다음의 닫힌형 채권가격을 얻는다.

$$\boxed{B(t,T) = \exp\!\left(-R(t)\,\tau - \frac{a}{2}\,\tau^2 + \frac{\beta^2}{6}\,\tau^3\right)}$$

7.7 채권 가격의 해석

이 공식의 지수에 나타나는 세 개의 항은 각각 매우 다른 경제적 의미를 가진다.

수학적 표현 경제적 의미 채권가격에 대한 효과
현재이자율 할인 \(-R(t)\,\tau\) 현재 이자율 수준에서의 시간가치 할인 가격 하락 (\(\downarrow\))
드리프트 효과 \(-\frac{a}{2}\,\tau^2\) 이자율 상승 추세에 의한 추가 할인 가격 하락 (\(\downarrow\))
볼록성 보정 \(+\frac{\beta^2}{6}\,\tau^3\) 변동성에 의한 볼록성 프리미엄 가격 상승 (\(\uparrow\))

첫째 항 \(-R(t)\,\tau\)는 가장 직관적인 항으로, 현재 이자율이 만기까지 일정하게 유지된다고 가정할 때의 할인 효과이다. 이자율이 높을수록, 또한 만기가 길수록 채권 가격은 낮아진다.

둘째 항 \(-\frac{a}{2}\,\tau^2\)는 드리프트에 의한 추가적 할인이다. \(a > 0\)이면 이자율이 평균적으로 상승하므로, 미래의 이자율은 현재보다 높을 것으로 기대된다. 따라서 미래 현금흐름을 더 많이 할인해야 하고, 이것이 채권 가격을 추가로 낮추는 것이다. 이 항이 \(\tau^2\)에 비례하는 것은, 드리프트의 누적 효과가 시간에 대해 2차적으로 증가하기 때문이다.

셋째 항 \(+\frac{\beta^2}{6}\,\tau^3\)는 볼록성 보정(convexity correction)이다. 이 항의 존재는 옌센 부등식(Jensen's inequality)의 직접적인 결과이다. 할인인자 \(e^{-x}\)는 \(x\)에 대해 볼록한 함수이므로, \(E[e^{-I}] > e^{-E[I]}\)가 성립한다. 즉 이자율이 변동하면, 변동하지 않을 때보다 할인인자의 기대값이 더 커지고, 이는 채권 가격을 끌어올리는 효과를 낳는다. 변동성 \(\beta\)가 클수록, 그리고 만기가 길수록 이 효과는 커진다.

채권 가격의 비현실적 현상 — \(B(t,T) > 1\)의 가능성: 볼록성 보정 항 \(\frac{\beta^2}{6}\tau^3\)은 만기의 세제곱에 비례하여 증가하는 반면, 다른 두 항은 \(\tau\)과 \(\tau^2\)에만 비례한다. 따라서 \(\tau\)가 충분히 커지면 볼록성 보정이 다른 항들을 압도하여, 채권 가격이 1을 초과할 수 있다. 이것은 "만기에 1원을 받는 채권이 현재 1원보다 비싸다"는 뜻으로, 명백한 차익거래 기회를 의미한다. 이것이 Merton 모형의 심각한 한계 중 하나이며, 장기 만기에 대해 모형을 적용할 수 없게 만드는 근본적 문제이다.

7.8 아핀(Affine) 표현

채권가격의 로그를 살펴보면 다음과 같이 현물이자율 \(R(t)\)의 아핀(1차) 함수임을 알 수 있다.

$$\ln B(t,T) = -\underbrace{\left(\frac{a}{2}\,\tau^2 - \frac{\beta^2}{6}\,\tau^3\right)}_{=:\,A(\tau)} - \underbrace{\tau}_{=:\,C(\tau)} \cdot R(t)$$

여기서 \(A(\tau)\)와 \(C(\tau)\)는 잔존만기 \(\tau\)에만 의존하는 결정론적 함수이다. 특히 Merton 모형에서는 \(C(\tau) = \tau\)로 매우 단순하다. 이러한 아핀 구조는 채권 관련 파생상품(캡, 플로어, 스왑션 등)의 가격을 효율적으로 계산할 수 있게 해주는 강력한 성질이다.


Part 8. 선도이자율과 일드곡선

8.1 선도이자율(Forward Rate)

순간 선도이자율(instantaneous forward rate)은 채권가격으로부터 역으로 추출되는 이자율로, 다음과 같이 정의된다.

$$F(t,T) := -\frac{\partial \ln B(t,T)}{\partial T}$$

직관적으로, \(F(t,T)\)는 시점 \(t\)에서 현재 시장에서 관측 가능한 정보를 바탕으로, 미래 시점 \(T\)에서 \(T+\varepsilon\) 사이의 초단기 대출에 적용될 것으로 "잠글 수(lock in)" 있는 이자율이다.

선도이자율 공식 유도

Part 7의 채권가격 공식에서 \(\ln B(t,T) = -R(t)\tau - \frac{a}{2}\tau^2 + \frac{\beta^2}{6}\tau^3\)이다. \(t\)를 고정하고 \(T\)에 대해 미분하면(\(\tau = T-t\)이므로 \(\frac{\partial\tau}{\partial T} = 1\)) 다음과 같다.

$$\frac{\partial \ln B}{\partial T} = -R(t) - a\tau + \frac{\beta^2}{2}\tau^2$$

부호를 바꾸면 선도이자율을 얻는다.

$$F(t,T) = R(t) + a\,\tau - \frac{\beta^2}{2}\,\tau^2$$

이 공식의 세 항의 의미를 분석하면 다음과 같다.

첫째 항 \(R(t)\)는 현재 이자율이다. 만기 \(T\)가 \(t\)에 매우 가까우면(\(\tau \to 0\)), 선도이자율은 현재 이자율로 수렴한다.

둘째 항 \(a\tau\)는 드리프트에 의한 기대 상승분이다. 이자율이 평균적으로 \(a\)의 속도로 상승하므로, \(\tau\) 시간 후의 기대 이자율은 \(R(t) + a\tau\)이다.

셋째 항 \(-\frac{\beta^2}{2}\tau^2\)는 볼록성 조정(convexity adjustment)이다. 이 항은 음수이므로 선도이자율을 끌어내리는 역할을 하며, 만기의 제곱에 비례하여 장기로 갈수록 그 효과가 급격히 커진다.

선도이자율과 기대 이자율의 관계

미래 현물이자율의 위험중립 기대값은 \(E_t^Q[R(T)] = R(t) + a\tau\)이다. 이것을 선도이자율 공식과 비교하면 다음의 중요한 관계를 얻는다.

$$E_t^Q[R(T)] = F(t,T) + \frac{\beta^2}{2}\,\tau^2$$

따라서 선도이자율은 미래 현물이자율의 기대값보다 \(\frac{\beta^2}{2}\tau^2\)만큼 항상 낮다. 이 차이를 볼록성 편향(convexity bias) 또는 위험프리미엄이라 부르며, 만기의 제곱에 비례하여 장기로 갈수록 커진다. 이것은 순수기대가설(Pure Expectations Hypothesis)이 성립하지 않음을 의미하며, 변동성이 존재하는 한 선도이자율은 체계적으로 기대 이자율을 하회한다.

병행이동(Parallel Shift) 특성

Merton 모형에서 선도이자율 공식의 중요한 구조적 특성은, 현물이자율 \(R(t)\)가 \(\Delta\)만큼 변하면 모든 만기 \(T\)의 선도이자율도 동일한 \(\Delta\)만큼 변한다는 것이다. 이것은 \(F(t,T)\)에서 \(R(t)\)의 계수가 정확히 1이기 때문이며, 이자율 충격이 모든 만기에 동일하게 전파되는 "병행이동(parallel shift)" 현상이다. 현실에서는 단기 금리의 충격이 장기 금리에 미치는 영향이 감쇠하는 것이 일반적인데, Merton 모형(그리고 Ho–Lee 모형)은 이를 포착하지 못한다. Vasicek이나 Hull–White 모형에서는 평균회귀가 충격을 시간에 따라 감쇠시키므로, 이 문제가 해결된다.

선도이자율의 극한

\(\tau \to 0\)에서는 \(\lim_{\tau \to 0} F(t,T) = R(t)\)로, 선도이자율이 현재 이자율로 수렴한다. 이는 직관적으로 당연한 결과이다.

그러나 \(\tau \to \infty\)에서는 \(-\frac{\beta^2}{2}\tau^2\) 항이 지배적이 되어 \(\lim_{\tau \to \infty} F(t,T) = -\infty\)이다. 장기 선도이자율이 음의 무한대로 발산한다는 것은 명백히 비현실적이며, Merton 모형의 가장 심각한 한계 중 하나이다. 이 발산의 근본 원인은 평균회귀의 부재이다. 평균회귀가 없으면 이자율의 누적 분산이 무한히 커지고, 이 불확실성이 볼록성 보정 \(-\frac{\beta^2}{2}\tau^2\)을 통해 선도이자율을 끌어내린다.

선도이자율의 SDE

Merton 모형에서 선도이자율 \(F(t,T)\)의 확률적 역학을 구할 수 있다.

선도이자율 SDE 유도

\(F(t,T) = R(t) + a\tau - \frac{\beta^2}{2}\tau^2\)에서, \(t\)가 변할 때 각 항의 변화를 구한다. \(\tau = T-t\)이므로 \(d\tau = -dt\)이다.

첫째 항: \(dR(t) = a\,dt + \beta\,dW^Q(t)\) (Merton SDE).

둘째 항: \(d(a\tau) = a\,d\tau = -a\,dt\).

셋째 항: \(d(-\frac{\beta^2}{2}\tau^2) = -\beta^2\tau\,d\tau = \beta^2\tau\,dt\).

세 기여를 합하면 다음을 얻는다.

$$dF = [a + (-a) + \beta^2\tau]\,dt + \beta\,dW^Q = \tau\beta^2\,dt + \beta\,dW^Q$$

놀랍게도 상수 드리프트 \(a\)가 완전히 소거된다. \(\blacksquare\)

$$dF(t,T) = \tau\beta^2\,dt + \beta\,dW^Q(t)$$

이 결과에서 드리프트 \(a\)가 사라진다는 것은 매우 의미심장하다. 선도이자율의 동학은 드리프트의 구체적 값에 의존하지 않으며, 오직 변동성 \(\beta\)에 의해서만 결정된다. 이것은 HJM(Heath-Jarrow-Morton) 프레임워크의 무차익 드리프트 조건 \(\mu_F(t,T) = \sigma_F(t,T)\int_t^T \sigma_F(t,s)\,ds\)와 정확히 일치한다. Merton 모형에서 \(\sigma_F(t,T) = \beta\)(상수)이므로, 무차익 드리프트는 \(\beta \cdot \int_t^T \beta\,ds = \beta^2\tau\)가 되어 위의 결과와 일치한다.


8.2 일드(만기수익률)

연속복리 일드(continuously compounded yield)는 \(R(t,T) = -\frac{1}{\tau}\ln B(t,T)\)로 정의된다. Part 7의 채권가격을 대입하면 다음과 같다.

$$R(t,T) = R(t) + \frac{a}{2}\,\tau - \frac{\beta^2}{6}\,\tau^2$$

이 공식의 구조를 분석하면, 선도이자율 \(F(t,T) = R(t) + a\tau - \frac{\beta^2}{2}\tau^2\)과 비교하여 드리프트 계수가 \(\frac{1}{2}\)배이고, 볼록성 조정 계수가 \(\frac{1}{3}\)배임을 알 수 있다. 이는 일드가 선도이자율의 "평균(average)"에 해당하기 때문이다. 구체적으로, 순간 선도이자율과 일드 사이에는 \(R(t,T) = \frac{1}{\tau}\int_t^T F(t,u)\,du\)라는 관계가 있으며, 선도이자율을 시점 \(t\)에서 \(T\)까지 평균하면 계수가 자연스럽게 줄어든다.

구분 선도이자율 \(F(t,T)\) 일드 \(R(t,T)\)
추세 계수 \(a\,\tau\) \(\frac{a}{2}\,\tau\)
볼록성 조정 \(-\frac{\beta^2}{2}\,\tau^2\) \(-\frac{\beta^2}{6}\,\tau^2\)
볼록성 조정 비율 1 \(\frac{1}{3}\)

일드가 현물이자율 \(R(t)\)의 1차함수(아핀함수)이므로, Merton 모형은 아핀일드모형(affine-yield model)에 속한다. \(R(t)\)가 정규분포를 따르므로 일드 역시 정규분포를 따른다.

일드의 극한

\(\tau \to 0\)에서는 \(\lim_{\tau \to 0} R(t,T) = R(t)\)로, 일드가 현재 이자율로 수렴한다. 이는 직관적으로 당연한 결과이다. 그러나 \(\tau \to \infty\)에서는 \(-\frac{\beta^2}{6}\tau^2\) 항이 지배적이 되어 \(\lim_{\tau \to \infty} R(t,T) = -\infty\)이다. 선도이자율과 마찬가지로 일드도 장기에서 음의 무한대로 발산하며, 이것이 Merton 모형이 장기 만기에 적용될 수 없는 이유이다.

8.3 일드곡선의 형태

일드곡선 \(\tau \mapsto R(t,T)\)의 형태는 파라미터 \(a, \beta\)와 현재 이자율 \(R(t)\)에 의해 결정된다. 일드 공식 \(R(t,T) = R(t) + \frac{a}{2}\tau - \frac{\beta^2}{6}\tau^2\)에서, 단기(\(\tau\) 작음)에서는 양의 드리프트 항 \(\frac{a}{2}\tau\)가 지배적이어서 일드가 상승하지만, 장기(\(\tau\) 큼)에서는 음의 볼록성 항 \(-\frac{\beta^2}{6}\tau^2\)가 지배적이 되어 일드가 하락한다.

일드곡선의 최고점은 \(\frac{\partial R(t,T)}{\partial \tau} = \frac{a}{2} - \frac{\beta^2}{3}\tau = 0\)에서 나타나므로, 최고점의 위치는 \(\tau^* = \frac{3a}{2\beta^2}\)이다. 이 시점 이후에는 일드가 하락하기 시작한다.

일드곡선 형태 조건 직관적 설명
낙타등(hump) 형태 \(a > 0\), \(\beta > 0\) 단기 상승 후 장기 하락
단조감소 \(a \le 0\) 드리프트 효과 없이 볼록성만 작용
결정론적 직선 \(\beta = 0\) 볼록성 사라지고 단조증가

Part 9. 할인채의 SDE와 무차익 점검

이 Part에서는 채권가격 \(B(t,T) = \exp(-R(t)\tau - \frac{a}{2}\tau^2 + \frac{\beta^2}{6}\tau^3)\)가 만족하는 SDE를 유도하고, 그 드리프트가 무차익 조건과 일치함을 확인한다. 할인채 가격의 지수 부분에서 \(\tau = T-t\)와 \(R(t)\)가 모두 \(t\)에 의존하므로, 이토 공식의 적용이 필요하다.

9.1 이토 공식 적용

유도 과정

\(B(t,T) = \exp(g(t,R))\)로 놓자. 여기서 \(g(t,R) = -R \cdot (T-t) - \frac{a}{2}(T-t)^2 + \frac{\beta^2}{6}(T-t)^3\)이다.

\(g\)의 편미분을 계산한다. \(\tau = T-t\)이므로 \(\frac{\partial\tau}{\partial t} = -1\)이다.

$$g_t = -R \cdot (-1) - \frac{a}{2} \cdot 2\tau \cdot (-1) + \frac{\beta^2}{6} \cdot 3\tau^2 \cdot (-1) = R + a\tau - \frac{\beta^2}{2}\tau^2$$ $$g_R = -(T-t) = -\tau$$ $$g_{RR} = 0$$

\(h(g) = e^g\)에 이토 공식을 적용한다. \(B = e^g\)이므로 \(dB = B \cdot dg + \frac{1}{2}B \cdot (dg)^2\)이다. 그런데 \(g\)는 \(t\)와 \(R\)의 함수이므로, 먼저 \(dg\)를 구한다.

$$dg = g_t\,dt + g_R\,dR + \frac{1}{2}g_{RR}(dR)^2 = g_t\,dt + g_R\,dR$$

(\(g_{RR} = 0\)이므로 2차항은 사라진다.) Merton SDE \(dR = a\,dt + \beta\,dW^Q\)를 대입하면 다음과 같다.

$$dg = [R + a\tau - \tfrac{\beta^2}{2}\tau^2]\,dt + (-\tau)(a\,dt + \beta\,dW^Q)$$ $$= [R + a\tau - \tfrac{\beta^2}{2}\tau^2 - a\tau]\,dt - \beta\tau\,dW^Q$$ $$= [R - \tfrac{\beta^2}{2}\tau^2]\,dt - \beta\tau\,dW^Q$$

이제 \(dB = B \cdot dg + \frac{1}{2}B \cdot (dg)^2\)에서 \((dg)^2\)을 계산한다. \(dg\)의 \(dW^Q\) 계수는 \(-\beta\tau\)이므로 \((dg)^2 = \beta^2\tau^2\,dt\)이다.

$$dB = B\!\left[R - \tfrac{\beta^2}{2}\tau^2 + \tfrac{1}{2}\beta^2\tau^2\right]dt - B\beta\tau\,dW^Q = B \cdot R(t)\,dt - B\beta\tau\,dW^Q$$

최종 결과는 다음과 같다.

$$\frac{dB(t,T)}{B(t,T)} = R(t)\,dt - \beta\tau\,dW^Q(t)$$

이 SDE의 드리프트 항이 정확히 \(R(t)\,dt\)라는 것은, 위험중립측도 \(Q\) 하에서 할인채의 기대수익률이 무위험이자율과 동일하다는 뜻이다. 이것이 바로 무차익 조건(no-arbitrage condition)이 만족됨을 확인하는 것이다. 만약 드리프트가 \(R(t)\)가 아니었다면, 무위험 채권과 할인채 사이에 차익거래 기회가 존재하게 되어 모형이 자기모순에 빠지게 된다.

확산 항의 계수 \(-\beta\tau\)는 할인채의 변동성이다. 이 계수에서 두 가지 중요한 정보를 읽을 수 있다. 첫째, 부호가 음수인 것은 이자율이 상승하면(\(dW^Q > 0\)이면) 채권 가격이 하락한다는 이자율-채권가격의 역관계를 반영한다. 둘째, \(\tau\)에 비례하므로 만기가 긴 채권일수록 이자율 변동에 더 민감하다는 금융적 직관과 일치한다. 이 계수의 절대값 \(\beta\tau\)는 "채권의 듀레이션(duration) \(\times\) 이자율 변동성"에 해당한다.


Part 10. 수치 예제

10.1 모형 설정

다음과 같은 구체적인 Merton 모형을 고려한다.

$$dR(u) = 0.02\,du + 0.06\,dW^Q(u)$$

파라미터는 \(a = 0.02\) (연간 2%p 상승 추세), \(\beta = 0.06\) (연간 6%p 변동성)이다.

현재 이자율: \(R(t) = 0.03\) (3%)

10.2 채권 가격 계산

잔존만기 \(\tau = 5\)년인 할인채의 가격을 계산한다.

$$B(t,T) = \exp\!\left(-0.03 \times 5 - \frac{0.02}{2} \times 25 + \frac{0.06^2}{6} \times 125\right)$$ $$= \exp(-0.15 - 0.25 + 0.075) = \exp(-0.325) \approx 0.7225$$

각 항의 기여를 분석하면 다음과 같다.

해석
\(-R(t)\tau\) \(-0.150\) 현재 이자율(3%)로 5년간 할인
\(-\frac{a}{2}\tau^2\) \(-0.250\) 이자율 상승 추세에 의한 추가 할인
\(+\frac{\beta^2}{6}\tau^3\) \(+0.075\) 변동성에 의한 볼록성 프리미엄
합계 \(-0.325\) \(B = e^{-0.325} \approx 0.7225\)

10.3 선도이자율 계산

$$F(t,T) = 0.03 + 0.02 \times 5 - \frac{0.06^2}{2} \times 25 = 0.03 + 0.10 - 0.045 = 0.085 = 8.5\%$$

기대 이자율과 비교: \(E_t^Q[R(T)] = 0.03 + 0.02 \times 5 = 0.13 = 13\%\)이므로, 선도이자율(8.5%)은 기대 이자율(13%)보다 \(\frac{\beta^2}{2}\tau^2 = 0.045 = 4.5\%\text{p}\)만큼 낮다. 이것이 볼록성 편향이다.

10.4 일드 계산

$$R(t,T) = 0.03 + \frac{0.02}{2} \times 5 - \frac{0.06^2}{6} \times 25 = 0.03 + 0.05 - 0.015 = 0.065 = 6.5\%$$

검산: \(B(t,T) = e^{-R(t,T) \cdot \tau} = e^{-0.065 \times 5} = e^{-0.325} \approx 0.7225\). Part 10.2의 결과와 일치한다. \(\checkmark\)

10.5 다양한 만기에서의 비교

\(\tau\) (년) \(B(t,T)\) \(F(t,T)\) \(R(t,T)\) \(E_t^Q[R(T)]\)
1 0.961 4.82% 3.94% 5.0%
3 0.862 7.74% 5.64% 9.0%
5 0.723 8.50% 6.50% 13.0%
10 0.407 5.00% 9.00% 23.0%
20 0.135 \(-14.60\%\) 10.00% 43.0%

\(\tau = 20\)에서 선도이자율이 음수(-14.6%)가 되는 것은 볼록성 조정이 지배적이 된 결과이다. 이것이 Merton 모형의 장기 만기에서의 한계를 구체적 숫자로 보여준다.

10.6 오일러-마루야마 시뮬레이션

Merton 모형을 수치적으로 시뮬레이션하려면, 연속시간 SDE를 이산시간으로 근사해야 한다. 가장 널리 사용되는 방법은 오일러-마루야마(Euler-Maruyama) 근사이다.

$$R_{k+1} = R_k + a\,\Delta t + \beta\sqrt{\Delta t}\,Z_k, \quad Z_k \sim N(0,1) \;\text{(독립)}$$

Merton 모형은 드리프트와 확산이 모두 상수이므로, 오일러 근사가 정확히 성립한다. 즉, 이산화 오차가 전혀 없다. 이것은 해가 \(R(t_k) = R(0) + a\,t_k + \beta\,W^Q(t_k)\)의 형태이고, 브라운 운동의 증분 \(W^Q(t_{k+1}) - W^Q(t_k) = \sqrt{\Delta t}\,Z_k\)가 정확히 정규분포를 따르기 때문이다. 이 점에서 Merton 모형은 시뮬레이션에 가장 적합한 모형이다.


Part 11. 장단점 정리

11.1 장점

첫째, 수학적 완전 투명성. Merton 모형의 가장 큰 장점은 모든 결과가 닫힌형(closed-form)으로 표현되며, 유도 과정이 완전히 투명하다는 것이다. 채권가격, 선도이자율, 일드, 채권의 SDE 등 모든 핵심 결과를 명시적 공식으로 얻을 수 있으므로, 수치적 방법(몬테카를로 시뮬레이션이나 유한차분법)에 의존할 필요가 없다.

둘째, 교육적 가치. Merton 모형은 이자율 모형의 기본 구조—SDE의 해, 누적이자율의 분포, 위험중립 가격결정, 볼록성 보정, 선도이자율과 일드의 관계, 무차익 점검 등—을 가장 단순한 환경에서 모두 배울 수 있게 해준다. 더 복잡한 모형(Vasicek, CIR, Hull–White)의 기본 구조가 Merton에서 그대로 나타나므로, Merton을 완전히 이해하면 다른 모형으로의 확장이 매우 자연스럽다.

셋째, Ho–Lee와의 직접 연결. Ho–Lee 모형은 Merton의 상수 드리프트 \(a\)를 시간의존 함수 \(\alpha(u)\)로 일반화한 것에 불과하다. 따라서 Merton 모형의 모든 유도를 이해하고 있으면, 드리프트를 \(\alpha(u)\)로 교체하는 것만으로 Ho–Lee의 결과를 자연스럽게 복원할 수 있다.

넷째, 시뮬레이션의 정확성. 오일러-마루야마 근사가 정확히 성립하므로, 시뮬레이션에서 이산화 오차를 걱정할 필요가 없다.

11.2 한계

첫째, 평균회귀의 부재. Merton 모형의 가장 심각한 한계이다. 현실에서 이자율은 중앙은행의 통화정책에 의해 특정 수준으로 유도되는 경향이 있으며, 장기적으로 어떤 균형 수준 주변에서 변동하는 것이 자연스럽다. 그러나 Merton 모형에서는 이러한 회귀 메커니즘이 없으므로, 이자율이 한 방향으로 계속 표류할 수 있다. 그 결과 장기 선도이자율이 \(-\infty\)로 발산하고, 채권 가격이 1을 초과할 수 있다.

둘째, 음의 이자율 가능성. 정규분포 모형이므로 이자율이 음수가 될 확률이 항상 양수이다. 극단적으로 큰 음수값도 양의 확률로 발생할 수 있다.

셋째, 초기 일드곡선 적합 불가. 파라미터가 모두 상수(\(a, \beta\))이므로, 시장에서 관측되는 초기 일드곡선의 형태를 정확히 재현하는 것이 불가능하다. 모형의 일드곡선은 항상 \(R(t) + \frac{a}{2}\tau - \frac{\beta^2}{6}\tau^2\)의 포물선 형태이며, 시장의 복잡한 일드곡선 형태를 포착할 수 없다.

넷째, 병행이동 특성. 현물이자율의 변동이 모든 만기의 선도이자율과 일드에 동일하게 전파되는 "병행이동" 특성이 있다. 현실에서는 단기 금리의 충격이 장기 금리에 미치는 영향이 감쇠하는 것이 일반적인데, Merton은 이를 포착하지 못한다.

다섯째, 1요인·상수변동성. 1요인 모형이므로 일드곡선의 twist(비틀림)나 butterfly(나비형) 움직임을 설명할 수 없다. 또한 변동성이 상수이므로, 금리 수준에 따른 변동성 변화를 반영하지 못한다.

11.3 확장 방향

Merton의 한계 해결 모형 핵심 아이디어
평균회귀 없음 Vasicek 드리프트를 \(b(\theta - R)\)로 교체
음의 금리 CIR 확산을 \(\sigma\sqrt{R}\)로 교체
초기곡선 적합 불가 Ho–Lee 드리프트를 \(\alpha(u)\)로 시간의존화
평균회귀 없음 + 적합 불가 Hull–White 시간의존 드리프트 + 평균회귀
1요인 한계 다요인 모형 여러 브라운 운동 도입
상수 변동성 확률적 변동성 모형 변동성도 확률과정화

Part 12. 연습문제

(초급) 문제 1 — 이토 공식 연습

\(X(t)\)가 \(dX = \mu X\,dt + \sigma X\,dW\)를 만족할 때, \(Y(t) = X(t)^2\)의 SDE를 유도하라.

(초급) 문제 2 — Merton 해의 조건부 분포

Merton 모형 \(dR = 0.01\,dt + 0.04\,dW^Q\)에서, \(R(0) = 0.05\)일 때 \(R(3)\)의 기대값, 분산, \(R(3) < 0\)일 확률을 구하라.

(중급) 문제 3 — 채권가격 비교

Merton 모형에서 \(a = 0.015\), \(\beta = 0.05\), \(R(t) = 0.04\)일 때, \(\tau = 3\)과 \(\tau = 10\)인 할인채의 가격을 각각 구하라. 어느 만기의 채권에서 볼록성 보정의 비중이 더 큰가?

(중급) 문제 4 — 할인채 PDE

Merton 모형에서 할인채 가격 \(B(t,T)\)가 만족하는 PDE와 종단조건을 쓰고, 아핀 형태 \(B = \exp(-A(\tau) - C(\tau)R)\)를 대입하여 \(A(\tau)\)와 \(C(\tau)\)에 대한 ODE를 유도한 뒤 풀어라.

(상급) 문제 5 — \(B(t,T) > 1\)이 되는 조건

\(R(t) = 0.03\), \(a = 0.02\), \(\beta = 0.06\)일 때, \(B(t,T) > 1\)이 되는 최소 잔존만기 \(\tau^*\)를 구하라. 이 현상의 경제적 의미를 설명하라.


Part 13. 모범답안 / 해설

해설 1

\(f(x) = x^2\)에 이토 공식을 적용한다. \(f_x = 2x\), \(f_{xx} = 2\)이다. SDE의 드리프트는 \(\mu X\)이고 확산은 \(\sigma X\)이므로, 이토 공식에 의해 다음을 얻는다.

$$dY = 2X(\mu X\,dt + \sigma X\,dW) + \frac{1}{2} \cdot 2 \cdot (\sigma X)^2\,dt$$ $$= (2\mu X^2 + \sigma^2 X^2)\,dt + 2\sigma X^2\,dW$$ $$= (2\mu + \sigma^2)Y\,dt + 2\sigma Y\,dW$$

이 결과에서 이토 보정항 \(\sigma^2 Y\,dt\)가 등장한다. 제곱함수는 볼록(\(f_{xx} = 2 > 0\))하므로 보정항이 양수이며, 드리프트를 \(2\mu\)에서 \(2\mu + \sigma^2\)로 증가시킨다.

해설 2

\(a = 0.01\), \(\beta = 0.04\), \(R(0) = 0.05\), \(t = 3\)에서의 조건부 분포.

기대값: \(E[R(3)] = R(0) + a \cdot 3 = 0.05 + 0.01 \times 3 = 0.08 = 8\%\)

분산: \(\text{Var}[R(3)] = \beta^2 \cdot 3 = 0.04^2 \times 3 = 0.0048\). 표준편차: \(\sqrt{0.0048} \approx 0.0693 = 6.93\%\text{p}\)

음의 이자율 확률: \(P(R(3) < 0) = \Phi\!\left(\frac{0 - 0.08}{0.0693}\right) = \Phi(-1.155) \approx 0.124 = 12.4\%\)

이자율이 음수가 될 확률이 12.4%나 된다는 것은 Merton 모형의 비현실성을 단적으로 보여준다.

해설 3

\(a = 0.015\), \(\beta = 0.05\), \(R(t) = 0.04\).

\(\tau = 3\): \(B = \exp(-0.04 \times 3 - \frac{0.015}{2} \times 9 + \frac{0.0025}{6} \times 27) = \exp(-0.12 - 0.0675 + 0.01125) = \exp(-0.17625) \approx 0.8384\)

볼록성 보정 비중: \(\frac{0.01125}{0.17625} \approx 6.4\%\)

\(\tau = 10\): \(B = \exp(-0.04 \times 10 - \frac{0.015}{2} \times 100 + \frac{0.0025}{6} \times 1000) = \exp(-0.4 - 0.75 + 0.4167) = \exp(-0.7333) \approx 0.4806\)

볼록성 보정 비중: \(\frac{0.4167}{0.7333 + 0.4167} \approx 36.2\%\)

\(\tau = 10\)에서 볼록성 보정의 비중이 압도적으로 크다. 이는 볼록성 항이 \(\tau^3\)에 비례하기 때문이다.

해설 4

할인채 가격 \(F = B(t,T)\)가 만족하는 PDE는 Feynman-Kac 공식에 의해 다음과 같다.

$$F_t + a\,F_R + \frac{1}{2}\beta^2 F_{RR} - R \cdot F = 0, \qquad F(T,R) = 1$$

아핀 가정 \(F = \exp(-A(\tau) - C(\tau)R)\)를 대입한다. \(\tau = T - t\)이므로 \(\frac{\partial\tau}{\partial t} = -1\)이다.

\(F_t = F(A'(\tau) + C'(\tau)R)\), \(F_R = -C\,F\), \(F_{RR} = C^2\,F\)이다.

PDE에 대입하면 \(F\)를 약분한 후 다음을 얻는다.

$$A' + C'R - aC + \frac{1}{2}\beta^2 C^2 - R = 0$$

\(R\)의 계수와 상수항을 분리하면, \(R\) 계수: \(C'(\tau) = 1\), \(C(0) = 0\) → \(C(\tau) = \tau\). 상수항: \(A'(\tau) = a\tau - \frac{1}{2}\beta^2\tau^2\), \(A(0) = 0\) → \(A(\tau) = \frac{a}{2}\tau^2 - \frac{\beta^2}{6}\tau^3\). Part 7의 결과와 정확히 일치한다. \(\blacksquare\)

해설 5

\(B(t,T) > 1\)이면 지수 부분이 양수, 즉 \(-R(t)\tau - \frac{a}{2}\tau^2 + \frac{\beta^2}{6}\tau^3 > 0\)이어야 한다. \(\tau\)로 나누면 \(-R(t) - \frac{a}{2}\tau + \frac{\beta^2}{6}\tau^2 > 0\)이 되고, 이것은 \(\tau\)에 대한 이차부등식이다.

$$\frac{\beta^2}{6}\tau^2 - \frac{a}{2}\tau - R(t) > 0$$

수치를 대입하면 \(\frac{0.0036}{6}\tau^2 - \frac{0.02}{2}\tau - 0.03 > 0\), 즉 \(0.0006\tau^2 - 0.01\tau - 0.03 > 0\)이다.

근의 공식: \(\tau = \frac{0.01 \pm \sqrt{0.0001 + 4 \times 0.0006 \times 0.03}}{2 \times 0.0006} = \frac{0.01 \pm \sqrt{0.000172}}{0.0012} = \frac{0.01 \pm 0.01311}{0.0012}\)

양의 근: \(\tau^* = \frac{0.02311}{0.0012} \approx 19.3\)년.

약 19.3년 이상의 만기에서 채권 가격이 1을 초과하게 된다. 이것은 "미래에 확실히 1원을 받을 수 있는 채권에 1원 이상을 지불한다"는 뜻으로, 명백한 차익거래 기회이다. 이 비현실적 결과의 근본 원인은 볼록성 보정 항 \(\frac{\beta^2}{6}\tau^3\)이 만기의 세제곱에 비례하여 무한히 증가하는 반면, 이를 억제할 평균회귀 메커니즘이 없기 때문이다.


핵심 공식 요약

항목 공식
Merton SDE \(dR(u) = a\,du + \beta\,dW^Q(u)\)
\(R(t) = R(s) + a(t-s) + \beta(W^Q(t) - W^Q(s))\)
\(R(t)\)의 조건부 분포 \(N(R(s) + a(t-s),\;\beta^2(t-s))\)
\(I(t,T)\)의 평균 \(m(t,T) = \tau R(t) + \frac{a}{2}\tau^2\)
\(I(t,T)\)의 분산 \(v(t,T) = \frac{\beta^2\tau^3}{3}\)
할인채 가격 \(B(t,T) = \exp\!\left(-R(t)\tau - \frac{a}{2}\tau^2 + \frac{\beta^2}{6}\tau^3\right)\)
선도이자율 \(F(t,T) = R(t) + a\tau - \frac{\beta^2}{2}\tau^2\)
일드 \(R(t,T) = R(t) + \frac{a}{2}\tau - \frac{\beta^2}{6}\tau^2\)
할인채 SDE \(\frac{dB}{B} = R(t)\,dt - \beta\tau\,dW^Q\)
선도이자율 SDE \(dF(t,T) = \tau\beta^2\,dt + \beta\,dW^Q\)
볼록성 편향 \(E_t^Q[R(T)] - F(t,T) = \frac{\beta^2}{2}\tau^2\)
일드곡선 최고점 \(\tau^* = \frac{3a}{2\beta^2}\)