CIR(Cox–Ingersoll–Ross) 이자율 모형

CIR 모형은 1985년 Cox, Ingersoll, Ross가 일반균형(general equilibrium) 프레임워크로부터 유도한 이자율 모형으로, Vasicek 모형의 가장 심각한 한계였던 "음의 이자율 허용" 문제를 확산 계수에 $\sqrt{r}$을 도입함으로써 해결하였다. 이 글에서는 확률미분방정식(SDE)의 기초가 되는 브라운 운동과 이토 미적분학(Itô calculus)부터 출발하여, CIR 모형의 정의와 해, Feller 조건에 의한 비음수성(non-negativity) 보장, 비중심 카이제곱분포(noncentral chi-squared distribution)로 주어지는 전이분포, 리카티 ODE(Riccati ODE)를 통한 할인채 가격의 닫힌형(closed-form) 유도, 수익률곡선 및 선도이자율 분석, 그리고 수치적 응용과 한계에 이르기까지 전 과정을 점진적으로 전개한다. 모든 핵심 결과에 대해서는 증명을 포함하였으며, 각 단계에서 왜 그러한 수학적 도구가 필요한지를 직관적으로 설명하는 데 중점을 두었다.

Part 1. 확률미분방정식(SDE) 기초

CIR 모형은 확률미분방정식(Stochastic Differential Equation, SDE)으로 기술된다. SDE를 이해하려면 먼저 그 "엔진"에 해당하는 브라운 운동이 무엇인지, 그리고 브라운 운동을 다룰 때 일반적인 미적분학과 무엇이 달라지는지를 명확히 파악해야 한다. 이 파트에서는 브라운 운동의 정의와 성질을 설명한 뒤, 확률미적분에서 핵심적인 역할을 하는 이차변동과 이토 곱셈 규칙을 유도하고, 최종적으로 SDE의 일반적 형태를 소개한다.

1.1 브라운 운동(Brownian Motion)

1.1.1 역사적 배경

브라운 운동(Brownian motion)은 금융공학에서 가장 근본적인 확률과정(stochastic process)이다. 이 이름은 1827년 스코틀랜드의 식물학자 로버트 브라운(Robert Brown)에서 유래하였다. 브라운은 현미경을 통해 물 위에 떠 있는 꽃가루 입자들이 끊임없이, 그리고 예측 불가능하게 움직이는 현상을 관찰하였다. 당시에는 이 현상의 원인을 설명할 수 없었으나, 1905년 알베르트 아인슈타인이 물 분자들의 무작위 충돌이 이 현상을 일으킨다는 이론적 설명을 제시하면서 수학적 기초가 확립되었고, 이후 노르베르트 위너(Norbert Wiener)에 의해 엄밀한 수학적 구성이 완성되었다.

금융공학에서 브라운 운동은 연속시간 확률과정의 표준적인 "잡음(noise)" 역할을 한다. 주가, 이자율, 환율 등 금융변수들의 예측 불가능한 무작위적 변동을 모델링할 때, 그 변동의 원천으로 브라운 운동을 사용하는 것이다. 만약 브라운 운동이라는 도구가 없었다면, 금융 모형은 모두 결정론적(deterministic)이 되어 현실의 불확실성을 전혀 반영하지 못하게 된다. 따라서 브라운 운동을 이해하는 것은 확률적 이자율 모형의 첫 번째 단계이다.

1.1.2 수학적 정의

브라운 운동은 확률공간 $(\Omega, \mathcal{F}, P)$와 정보의 흐름을 나타내는 필트레이션(filtration) $\{\mathcal{F}_t\}$ 위에서 정의된다. 구체적으로, 다음의 네 가지 성질을 동시에 만족하는 확률과정 $\{W(t)\}_{t \ge 0}$을 표준 브라운 운동이라 부른다.

브라운 운동의 네 가지 성질

성질 1 — 시작점 조건: $W(0) = 0$이다. 브라운 운동은 항상 원점에서 출발한다. 이것은 일종의 정규화(normalization) 조건으로, "시간 0에서 아직 아무런 무작위적 변동도 일어나지 않았다"는 것을 의미한다. 만약 다른 출발점 $x_0$에서 시작하는 과정이 필요하다면, 단순히 $x_0 + W(t)$로 이동시키면 된다.

성질 2 — 독립 증분(Independent Increments): 서로 겹치지 않는(non-overlapping) 시간 구간에서의 증분(increment)들은 통계적으로 서로 독립이다. 구체적으로, $0 \le t_1 < t_2 \le t_3 < t_4$일 때 $W(t_2) - W(t_1)$와 $W(t_4) - W(t_3)$는 통계적으로 독립이다. 이 성질의 의미는 심오하다. 과거의 움직임을 아무리 자세히 분석하더라도 미래의 움직임에 대한 어떠한 정보도 얻을 수 없다는 것이며, 이는 금융에서 효율적 시장 가설(Efficient Market Hypothesis)의 수학적 표현이기도 하다.

성질 3 — 정규분포 증분(Gaussian Increments): 시점 $s$에서 시점 $t$까지의 증분은 평균이 0이고 분산이 $(t-s)$인 정규분포를 따른다. 즉, $W(t) - W(s) \sim N(0, t-s)$이다. 평균이 0이라는 것은 브라운 운동 자체에 어떤 방향으로의 편향(drift)도 없다는 뜻이다. 분산이 $(t-s)$에 비례하므로 표준편차는 $\sqrt{t-s}$에 비례하며, 이는 불확실성이 시간의 제곱근에 비례하여 증가함을 의미한다. 이 "제곱근 스케일링"은 금융에서 매우 중요한 개념으로, 예를 들어 연간 변동성 20%를 일간 변동성으로 환산할 때 $20\%/\sqrt{252} \approx 1.26\%$가 되는 근거이기도 하다.

성질 4 — 연속 경로(Continuous Paths): 확률 1로(almost surely) 경로 $t \mapsto W(t)$가 연속이다. 즉, 점프(jump)나 불연속점이 존재하지 않는다. 그러나 흥미롭게도 이 경로는 어디에서도 미분 가능하지 않다(nowhere differentiable). 경로는 끊어지지 않지만 너무나 "거칠어서" 어떤 점에서도 접선을 그을 수 없다는 것이다. 바로 이 성질 때문에 일반적인 미적분학(뉴턴-라이프니츠 체계)을 브라운 운동에 그대로 적용할 수 없으며, 이토 미적분(Itô calculus)이라는 완전히 새로운 체계가 필요하게 된다.

1.1.3 미분 형태 $dW$의 직관적 이해

확률미분방정식에서는 브라운 운동의 "미분"을 형식적으로 $dW(t) := W(t + dt) - W(t)$로 정의한다. 성질 3(정규분포 증분)에 의해 $dW(t) \sim N(0, dt)$이므로, $dW(t)$의 표준편차는 $\sqrt{dt}$이다.

이 점이 확률미적분과 일반 미적분의 근본적인 차이를 만든다. 일반적인 미적분학에서 변수 $x$의 변화량 $dx$는 $dt$와 같은 크기(order)를 가진다. 그런데 확률미적분에서 $dW$의 "크기(스케일)"는 $\sqrt{dt}$이며, $dt$가 매우 작을 때 $\sqrt{dt}$는 $dt$보다 훨씬 크다. 구체적인 예를 들면, $dt = 0.0001$일 때 $\sqrt{dt} = 0.01$로, $dW$는 $dt$의 100배나 "큰" 크기를 가진다. 이 스케일 차이가 이토 미적분의 핵심이며, 테일러 전개에서 2차항을 무시할 수 없게 만드는 근본적인 이유이다. 이 점은 Part 2에서 이토 공식을 유도할 때 결정적인 역할을 하게 되며, 특히 CIR 모형에서 $\sqrt{r}$ 확산 계수에 이토 공식을 적용하여 채권가격 PDE를 유도할 때 핵심적으로 사용된다.

1.2 이차변동과 이토 곱셈 규칙

1.2.1 이차변동(Quadratic Variation)

이차변동은 "브라운 운동의 경로가 얼마나 거칠게 움직이는가"를 정량적으로 측정하는 도구이다. 직관적으로, 매끄러운 함수의 경로는 잘게 쪼갤수록 각 조각의 변화량이 매우 작아져서, 변화량의 제곱합은 0으로 수렴한다. 그러나 브라운 운동의 경로는 너무 거칠기 때문에, 아무리 잘게 쪼개더라도 변화량의 제곱합이 0으로 수렴하지 않고 양수의 값으로 수렴한다.

구체적으로, 시간 구간 $[0, T]$를 $n$개의 동일한 작은 구간으로 나누어 $0 = t_0 < t_1 < \cdots < t_n = T$, $\Delta t = T/n$이라 하자. 각 구간에서의 증분을 제곱하여 모두 더한 값, 즉 이차변동은 다음과 같이 수렴한다.

$$\sum_{i=1}^{n} \big(W(t_i) - W(t_{i-1})\big)^2 \;\xrightarrow{n \to \infty}\; T \quad (\text{확률적 수렴})$$

일반적인 매끄러운 함수 $f(t)$에 대해서는 같은 합이 $\sum(f(t_i) - f(t_{i-1}))^2 \to 0$으로 수렴하는데, 브라운 운동에서는 0이 아닌 양수 $T$로 수렴한다는 것이 핵심이다. 이것이 바로 브라운 운동 경로의 "거칠음"을 수학적으로 표현한 것이며, 이토 미적분이 존재하는 근본적인 이유이기도 하다.

이차변동이 $T$로 수렴하는 증명

증명의 전략은 다음과 같다. 먼저 이차변동의 기대값이 정확히 $T$임을 보이고, 그 다음 분산이 $n \to \infty$에서 0으로 수렴함을 보인다. 기대값이 $T$이면서 분산이 0이라면, 체비셰프 부등식에 의해 이차변동은 확률적으로 $T$에 수렴한다.

기대값 계산. 각 증분 $\Delta W_i = W(t_i) - W(t_{i-1})$는 정규분포 $N(0, \Delta t)$를 따른다. 정규분포의 성질에 의해 $E[(\Delta W_i)^2] = \text{Var}(\Delta W_i) = \Delta t$이다. $n$개의 구간에 대해 합하면, 기대값의 선형성에 의해 다음을 얻는다.

$$E\!\left[\sum_{i=1}^{n}(\Delta W_i)^2\right] = \sum_{i=1}^{n} E[(\Delta W_i)^2] = n \cdot \Delta t = n \cdot \frac{T}{n} = T$$

분산 계산. 정규분포의 4차 모멘트 공식을 사용한다. $Z \sim N(0, \sigma^2)$이면 $E[Z^4] = 3\sigma^4$이다. 이 공식을 적용하면 $E[(\Delta W_i)^4] = 3(\Delta t)^2$이고, 따라서 각 항의 분산은 다음과 같이 계산된다.

$$\text{Var}[(\Delta W_i)^2] = E[(\Delta W_i)^4] - \bigl(E[(\Delta W_i)^2]\bigr)^2 = 3(\Delta t)^2 - (\Delta t)^2 = 2(\Delta t)^2$$

독립 증분 성질에 의해 각 $(\Delta W_i)^2$는 서로 독립이므로, 합의 분산은 개별 분산의 합이 된다.

$$\text{Var}\!\left[\sum_{i=1}^{n}(\Delta W_i)^2\right] = n \cdot 2(\Delta t)^2 = 2n \cdot \frac{T^2}{n^2} = \frac{2T^2}{n} \;\to\; 0 \quad (n \to \infty)$$

기대값은 정확히 $T$이고 분산은 0으로 수렴하므로, 체비셰프 부등식 $P(|X - EX| > \epsilon) \le \text{Var}(X)/\epsilon^2$에 의해 이차변동은 확률적으로 $T$에 수렴한다. $\blacksquare$

이 결과를 미분 형태로 쓰면 다음과 같은 중요한 계산 규칙을 얻는다.

$$(dW)^2 = dt$$

핵심: $(dW)^2$은 비록 형식적으로는 확률변수이지만, 위의 증명에서 보았듯이 기대값이 $dt$이고 분산이 0에 가까우므로, 실질적으로 결정론적 상수 $dt$처럼 취급할 수 있다. 이것이 확률미적분에서 가장 중요한 단 하나의 규칙이며, 이토 공식의 "보정항"이 등장하는 근본적 원인이다. CIR 모형에서는 이 규칙이 $(dr)^2 = \sigma^2 r\,dt$로 나타나는데, 확산 계수에 $\sqrt{r}$이 포함되어 있기 때문이다.

1.2.2 이토 곱셈 규칙

위의 이차변동 결과와 크기 분석을 종합하면, 확률미적분에서 사용하는 곱셈 규칙을 체계적으로 정리할 수 있다. 먼저 $(dt)^2$은 $dt$보다 훨씬 작은 고차항이므로 0으로 취급한다. 다음으로 $dt \cdot dW$는 크기가 $dt \cdot \sqrt{dt} = (dt)^{3/2}$이므로 역시 무시할 수 있다. 마지막으로 $(dW)^2$은 이차변동에 의해 상수 $dt$로 수렴하므로, 0이 아닌 유일한 2차 항이다.

곱	결과	이유
$(dt)^2$	$0$	$dt$보다 훨씬 작은 고차항
$dt \cdot dW$	$0$	$(dt)^{3/2}$ 크기이므로 무시 가능
$(dW)^2$	$dt$	이차변동에 의해 상수 $dt$로 수렴

핵심 통찰: 일반 미적분에서는 $(dx)^2$을 항상 무시할 수 있지만, 확률미적분에서는 $(dW)^2 = dt$를 무시할 수 없다. 이 단 하나의 차이가 이토 미적분 전체를 지배한다. 다시 말해, 이토 미적분의 존재 이유는 결국 $(dW)^2 = dt \neq 0$이라는 사실로 귀결되며, 이 단순한 규칙으로부터 이토 공식, 이토 적분의 성질, 나아가 금융에서의 볼록성 보정 등 모든 결과가 파생된다.

1.3 확률미분방정식의 일반적 형태

확률미분방정식(SDE)은 결정론적 변화와 확률론적 변화를 동시에 기술하는 방정식으로, 다음과 같은 일반적 형태를 가진다.

$$dX(t) = \mu(t, X(t))\,dt + \sigma(t, X(t))\,dW(t)$$

이 방정식의 우변은 두 개의 항으로 구성되어 있으며, 각각은 매우 다른 성격의 변화를 기술한다. 첫째 항 $\mu(t, X(t))\,dt$는 드리프트 항(drift term)이라 부른다. 이 항은 확률과정의 결정론적 추세, 즉 예측 가능한 체계적 변화를 나타낸다. 예를 들어 이자율이 장기적으로 5%를 향해 되돌아가는 경향이 있다면, 이 드리프트 항이 그 경향을 기술한다. $dt$에 비례하므로 이 항은 "예측 가능한" 부분이며, 시간이 흐름에 따라 선형적으로 누적된다.

둘째 항 $\sigma(t, X(t))\,dW(t)$는 확산 항(diffusion term)이라 부른다. 이 항은 확률적 변동의 크기와 성격을 결정한다. 계수 $\sigma$는 변동성(volatility)에 해당하며, 이 값이 클수록 확률과정의 무작위적 변동 폭이 커진다. $dW(t)$가 무작위성의 원천이다. $dW$의 크기가 $\sqrt{dt}$이므로, 확산 항은 매우 짧은 시간 간격에서 드리프트 항보다 지배적이 된다. 이것이 고빈도 데이터에서 추세보다 잡음이 더 크게 보이는 이유의 수학적 설명이다.

CIR 모형의 SDE $dr = \kappa(\theta - r)\,dt + \sigma\sqrt{r}\,dW$에서 특별한 점은 확산 계수가 $\sigma\sqrt{r(t)}$로 상태변수 $r(t)$에 의존한다는 것이다. 이로 인해 이자율이 낮을 때는 변동성도 줄어들어 음수로 빠지지 않게 되고, 이자율이 높을 때는 변동성이 커져서 실증적으로 관측되는 수준의존적 변동성(level-dependent volatility)을 자연스럽게 포착한다. 이것이 Vasicek의 상수 확산 $\sigma$와 근본적으로 다른 점이며, CIR 모형의 핵심적인 혁신이다.

Part 2. 이토 공식(Itô's Lemma)

2.1 왜 이토 공식이 필요한가?

일반적인 미적분학에서 $y = f(x)$이고 $x$가 $t$의 매끄러운 함수일 때, 체인룰(chain rule)은 $dy = f'(x)\,dx$로 매우 간단하다. 이 공식은 함수의 변화량을 변수의 변화량으로 표현해 주므로, 물리학과 공학에서 수없이 많은 문제를 해결하는 핵심 도구이다.

그런데 $x$가 브라운 운동을 포함하는 확률과정일 때, 이 체인룰은 더 이상 정확하지 않다. 그 이유는 본질적으로 매우 단순하면서도 심오하다.

체인룰이 실패하는 근본적 이유: 일반 미적분에서는 $dx$가 $dt$와 같은 크기를 가지므로, 테일러 전개의 2차항 $(dx)^2$은 $(dt)^2$에 비례하여 $dt$보다 훨씬 작아진다. 따라서 2차항을 무시하고 1차항만 남겨도 정확한 결과를 얻는다. 그러나 확률미적분에서는 $dX$가 $dW$를 포함하면 그 크기가 $\sqrt{dt}$가 되므로, $(dX)^2$의 크기가 $dt$에 비례한다. $dt$는 무시할 수 없는 크기이므로, 테일러 전개의 2차항을 반드시 포함시켜야 한다. 이것이 체인룰이 실패하는 이유이며, 동시에 이토 공식이 존재하는 이유이다.

2.2 이토 공식의 유도

확률과정 $X(t)$가 SDE $dX = \mu\,dt + \sigma\,dW$를 만족하고, $f(t,x)$가 $t$에 대해 1번, $x$에 대해 2번 연속 미분 가능한 클래스 $C^{1,2}$ 함수라고 하자. 우리의 목표는 합성함수 $Y(t) = f(t, X(t))$의 SDE를 구하는 것이다.

Step 1: 테일러 전개

$f(t, X(t))$의 테일러 전개를 2차항까지 수행하면 다음과 같다.

$$df = f_t\,dt + f_x\,dX + \tfrac{1}{2}f_{tt}(dt)^2 + \tfrac{1}{2}f_{xx}(dX)^2 + f_{tx}\,dt\,dX + \cdots$$

Step 2: 각 항의 크기 분석

$dW \sim \sqrt{dt}$이므로 $dX = \mu\,dt + \sigma\,dW$의 크기는 $\sqrt{dt}$이다. 이로부터 테일러 전개의 각 항이 $dt$의 크기까지 기여하는지를 판별할 수 있다. $f_t\,dt$는 크기가 $dt$이므로 기여하고, $f_x\,dX$는 $\sqrt{dt}$ 크기이므로 역시 기여한다. 한편 $\frac{1}{2}f_{tt}(dt)^2$은 $(dt)^2$ 크기이므로 무시할 수 있고, $f_{tx}\,dt\,dX$는 $(dt)^{3/2}$ 크기이므로 역시 무시할 수 있다. 결정적으로, $\frac{1}{2}f_{xx}(dX)^2$은 $(dX)^2 \sim dt$ 크기이므로 무시할 수 없으며 반드시 포함해야 한다. 이것이 일반 체인룰과의 유일한 차이이다.

Step 3: $(dX)^2$의 명시적 계산

$dX = \mu\,dt + \sigma\,dW$를 제곱하면 $(dX)^2 = \mu^2(dt)^2 + 2\mu\sigma\,dt\,dW + \sigma^2(dW)^2$이다. 여기에 이토 곱셈 규칙을 적용하면, 첫째 항 $\mu^2(dt)^2$은 고차항이므로 사라지고, 둘째 항 $2\mu\sigma\,dt\,dW$는 $(dt)^{3/2}$ 크기이므로 사라지며, 셋째 항 $\sigma^2(dW)^2$만 이차변동에 의해 $\sigma^2\,dt$로 남는다.

$$(dX)^2 = \sigma^2\,dt$$

이 결과는 직관적으로도 의미가 있다. $(dX)^2$에서 드리프트 $\mu$는 완전히 사라지고 오직 확산 계수 $\sigma$만 남는다는 것은, 매우 짧은 시간 간격에서는 "평균적 추세"보다 "무작위 변동"이 지배적이라는 물리적 사실의 수학적 표현이다. CIR 모형에서는 $\sigma$가 $\sigma\sqrt{r}$로 대체되므로, $(dr)^2 = \sigma^2 r\,dt$가 되어, 이자율 수준에 따라 이토 보정항의 크기가 달라진다는 중요한 특성이 나타난다.

2.3 이토 공식의 최종형

Step 1–3의 분석을 종합하면, 기여하는 항만 남겨서 다음의 이토 공식(Itô's Lemma)을 얻는다.

$$df = \left(f_t + \mu\,f_x + \tfrac{1}{2}\sigma^2 f_{xx}\right)dt + \sigma\,f_x\,dW$$

고전적 체인룰 $df = f_t\,dt + f_x\,dX$와 비교하면, 이토 공식에는 $\frac{1}{2}\sigma^2 f_{xx}\,dt$라는 추가항이 등장한다. 이것을 이토 보정항(Itô correction term)이라 부른다. 이 보정항은 변동성 $\sigma$와 함수의 2차 도함수 $f_{xx}$(즉 볼록성)의 곱으로 구성되어 있다.

이토 보정항의 직관적 의미: 이 항은 함수 $f$의 볼록성(convexity) 효과를 반영한다. $f_{xx} > 0$인 볼록함수에 대해서는 보정항이 양수로, 확률적 변동이 함수값의 기대값을 끌어올리는 효과를 낳는다. 반대로 $f_{xx} < 0$인 오목함수에서는 보정항이 음수로, 확률적 변동이 함수값의 기대값을 끌어내린다. CIR 모형에서 할인채 가격 $B(t,T) = \exp(-A(\tau) - C(\tau)r)$에 이토 공식을 적용할 때, $f_{rr} = C(\tau)^2 B$이므로 보정항 $\frac{1}{2}\sigma^2 r \cdot C(\tau)^2 B$가 등장하며, 이것이 리카티 ODE에서 $C^2$ 항이 나타나는 수학적 원인이다.

2.4 예제: 기하 브라운 운동에 이토 공식 적용

주가 $S(t)$가 기하 브라운 운동(GBM) $dS = \mu S\,dt + \sigma S\,dW$를 따른다고 하자. $f(S) = \ln S$로 놓고 이토 공식을 적용하면, $f_S = 1/S$, $f_{SS} = -1/S^2$이므로 다음을 얻는다.

$$d\ln S = \frac{1}{S}(\mu S\,dt + \sigma S\,dW) + \frac{1}{2}\!\left(-\frac{1}{S^2}\right)(\sigma S)^2\,dt = (\mu - \tfrac{1}{2}\sigma^2)\,dt + \sigma\,dW$$

이토 보정항 $-\frac{1}{2}\sigma^2\,dt$가 등장한다. 이것이 기하 브라운 운동에서 로그수익률의 드리프트가 $\mu$가 아니라 $\mu - \frac{1}{2}\sigma^2$인 이유이다. 양변을 적분하면 GBM의 닫힌형 해 $S(t) = S(0)\exp[(\mu - \frac{1}{2}\sigma^2)t + \sigma W(t)]$를 얻으며, 이 유도 과정에서 이토 공식이 결정적인 역할을 함을 확인할 수 있다.

Part 3. 이토 적분과 이토 등거리성(Itô Isometry)

3.1 이토 적분의 정의

이토 적분(Itô integral)은 확률과정을 브라운 운동에 대해 "적분"하는 것으로, $\int_a^b f(u)\,dW(u)$와 같이 표기한다. 이 적분의 결과는 일반 적분처럼 하나의 "숫자"가 아니라 확률변수라는 점에서 근본적으로 다르다. 리만 적분 $\int_a^b g(x)\,dx$는 주어진 함수와 구간에 대해 정해진 하나의 값을 가지지만, 이토 적분은 브라운 운동의 경로가 어떻게 실현되느냐에 따라 서로 다른 값을 가질 수 있다. 같은 확률 실험을 여러 번 반복하면, 매번 다른 브라운 운동 경로가 생성되고, 따라서 이토 적분의 값도 매번 달라진다.

이토 적분은 리만합(Riemann sum)의 극한으로 정의된다. 구간 $[a,b]$를 $a = t_0 < t_1 < \cdots < t_n = b$로 분할하면 다음과 같다.

$$\int_a^b f(u)\,dW(u) = \lim_{n \to \infty} \sum_{i=1}^{n} f(t_{i-1})\bigl(W(t_i) - W(t_{i-1})\bigr)$$

여기서 결정적으로 중요한 것은 좌측값(left-endpoint) $f(t_{i-1})$을 사용한다는 점이다. 리만 적분에서는 구간의 어느 점을 선택하든(좌측, 우측, 중간점) 극한이 동일하지만, 확률적분에서는 선택에 따라 결과가 달라진다. 좌측값을 사용하는 것이 이토 적분이고, 중간점을 사용하는 것이 스트라토노비치(Stratonovich) 적분이다.

이토 적분에서 좌측값을 사용하는 데에는 깊은 금융적 의미가 있다. 투자자가 시점 $t_{i-1}$에서 보유량 $f(t_{i-1})$을 결정한 후, 시점 $t_i$까지 주가가 $W(t_i) - W(t_{i-1})$만큼 변동하는 것을 상상하면 된다. 투자 결정은 반드시 미래의 가격 변동을 관찰하기 전에 내려야 한다는 인과관계의 원칙이 좌측값 사용에 자연스럽게 반영되어 있는 것이다. 이 "미래를 보지 않는(non-anticipative)" 성질은 금융 모형의 물리적 합리성을 보장하는 핵심 조건이다.

3.2 이토 적분의 핵심 성질

성질 1: 기대값이 0 (마팅게일 성질)

$$E\!\left[\int_a^b f(u)\,dW(u)\right] = 0$$

이 성질은 이토 적분의 가장 기본적이면서도 중요한 성질이다. 리만합의 각 항 $f(t_{i-1}) \cdot \Delta W_i$를 생각하면, $f(t_{i-1})$은 시점 $t_{i-1}$에서 이미 결정된 값(또는 $\mathcal{F}_{t_{i-1}}$-가측인 확률변수)이고, $\Delta W_i = W(t_i) - W(t_{i-1})$는 미래의 증분으로 기대값이 0이다. 더구나 좌측값 선택에 의해 $f(t_{i-1})$과 $\Delta W_i$는 독립이므로, $E[f(t_{i-1}) \cdot \Delta W_i] = f(t_{i-1}) \cdot E[\Delta W_i] = 0$이다. 모든 항의 기대값이 0이므로 합의 기대값도 0이고, 극한에서도 이 성질이 보존된다. 금융적으로 이것은 이토 적분으로 구성된 투자전략이 "공정한 게임(fair game)"이라는 것, 즉 기대 손익이 0인 마팅게일이라는 것을 의미한다.

CIR 모형에서 이 성질은 특히 중요하다. CIR SDE의 양변에 기대값을 취할 때, 확산항 $\sigma\sqrt{r}\,dW$의 기대값이 0이 되므로 기대값의 동역학이 $\frac{d}{dt}E[r(t)] = \kappa(\theta - E[r(t)])$라는 간단한 ODE로 환원되기 때문이다.

성질 2: 이토 등거리성(Itô Isometry)

$$E\!\left[\left(\int_a^b f(u)\,dW(u)\right)^{\!2}\right] = \int_a^b E[f(u)^2]\,du$$

좌변은 이토 적분의 "크기의 제곱"에 대한 기대값, 즉 $L^2$ 노름의 제곱이다. 우변은 피적분함수를 제곱하여 시간에 대해 일반적으로 적분한 것이다. 이 등식이 의미하는 바는 매우 강력하다. 확률적 적분의 "크기"를 계산하기 위해 복잡한 확률론적 분석을 할 필요 없이, 피적분함수의 제곱을 결정론적으로 적분하기만 하면 된다는 것이다.

3.3 이토 등거리성 증명

증명

Step 1. 구간 $[a,b]$를 $n$개로 균등 분할한다. $\Delta t = (b-a)/n$으로 두고, 이토 적분을 리만합으로 근사하면 $\int_a^b f(u)\,dW(u) \approx \sum_{i=1}^{n} f(t_{i-1})\,\Delta W_i$이다. 여기서 $\Delta W_i := W(t_i) - W(t_{i-1})$이다.

Step 2. 이 합을 제곱하면, $(A_1 + A_2 + \cdots + A_n)^2$을 전개하는 것과 같으므로, 대각항($A_i^2$)과 교차항($A_i A_j,\; i \neq j$)이 나타난다. 구체적으로 다음과 같이 분리된다.

$$\left(\sum_i f(t_{i-1})\,\Delta W_i\right)^{\!2} = \sum_i f(t_{i-1})^2\,(\Delta W_i)^2 + 2\!\sum_{i < j} f(t_{i-1})\,f(t_{j-1})\,\Delta W_i\,\Delta W_j$$

Step 3. 이제 양변의 기대값을 취한다. 대각항의 기대값은 다음과 같다. $f(t_{i-1})$이 $\mathcal{F}_{t_{i-1}}$-가측이고 $\Delta W_i \sim N(0, \Delta t)$이므로, 조건부 기대값의 성질에 의해 $E[f(t_{i-1})^2 \cdot (\Delta W_i)^2] = E[f(t_{i-1})^2] \cdot \Delta t$이다.

교차항($i < j$)의 기대값이 핵심이다. $\Delta W_i$와 $\Delta W_j$는 서로 다른 시간 구간의 증분이므로, 브라운 운동의 독립 증분 성질에 의해 서로 독립이다. 또한 각각의 기대값이 $E[\Delta W_i] = 0$이므로 $E[\Delta W_i \cdot \Delta W_j] = E[\Delta W_i] \cdot E[\Delta W_j] = 0$이다. 따라서 모든 교차항의 기대값이 소멸한다. 이것이 증명의 핵심 단계이다.

Step 4. 교차항이 사라지므로 대각항만 남아서, $E\bigl[\bigl(\sum_i f(t_{i-1})\,\Delta W_i\bigr)^2\bigr] = \sum_i E[f(t_{i-1})^2]\,\Delta t$를 얻는다. 우변은 함수 $E[f(u)^2]$의 리만합이다. $n \to \infty$에서 이 리만합은 적분으로 수렴하므로, 최종적으로 다음을 얻는다.

$$E\!\left[\left(\int_a^b f(u)\,dW(u)\right)^{\!2}\right] = \int_a^b E[f(u)^2]\,du \qquad \blacksquare$$

3.4 결정론적 $f$일 때의 정규분포 성질

만약 $f(u)$가 결정론적(비확률적) 함수라면, 이토 적분은 한층 더 강력한 성질을 가진다.

$$\int_a^b f(u)\,dW(u) \sim N\!\left(0,\;\int_a^b f(u)^2\,du\right)$$

이 결과의 직관적 이해는 다음과 같다. 리만합 $\sum f(t_{i-1})\,\Delta W_i$에서 각 $\Delta W_i$는 정규분포 $N(0, \Delta t)$를 따르고 서로 독립이며, $f(t_{i-1})$은 결정론적 상수이다. 따라서 이 합은 독립인 정규확률변수들의 선형결합이다. 확률론의 기본 정리에 의해 "독립인 정규분포의 선형결합은 다시 정규분포"이므로, 이 합은 정규분포를 따른다. 기대값은 성질 1에 의해 0이고, 분산은 이토 등거리성에 의해 $\int_a^b f(u)^2\,du$이다. 극한에서도 이 정규분포 성질이 보존된다.

CIR과의 연결: Ho–Lee 모형에서는 확산 계수가 상수 $\beta$이므로 이 정규분포 성질이 직접 적용되어 할인채 가격이 닫힌형으로 구해진다. 그러나 CIR 모형에서는 확산 계수가 $\sigma\sqrt{r(u)}$로 상태변수에 의존하므로, 이토 적분 $\int_t^T \sigma\sqrt{r(u)}\,dW(u)$의 피적분함수가 확률적이다. 따라서 이 정규분포 성질이 직접 적용되지 않으며, CIR의 전이분포는 정규분포가 아닌 비중심 카이제곱분포가 된다. 이것이 CIR 모형의 분석이 Ho–Lee보다 수학적으로 더 정교해지는 근본적인 이유이다.

Part 4. 위험중립측도와 채권 가격결정

4.1 현실측도 vs 위험중립측도

금융에서 자산 가격을 결정하려면 미래 현금흐름의 기대값을 구해야 하는데, 이때 "어떤 확률측도 하에서의 기대값인가"가 결정적으로 중요하다. 현실측도(Physical Measure) $P$는 우리가 실제 세계에서 관측하는 확률분포이다. 이 측도 하에서 투자자들은 위험을 싫어하므로, 위험이 큰 자산에 대해 추가적인 보상(위험프리미엄)을 요구한다. 따라서 $P$ 하에서의 기대수익률에는 위험프리미엄이 포함되어 있다.

위험중립측도(Risk-Neutral Measure) $Q$는 가격결정을 위해 인위적으로 구성한 수학적 도구이다. 이 "가상의 세계"에서는 모든 투자자가 위험에 무관심(risk-neutral)하며, 따라서 모든 자산의 기대수익률이 무위험이자율과 동일하다. 현실에서 투자자들이 실제로 위험중립적이라는 뜻이 아니라, 무차익(No-Arbitrage) 원리를 만족하는 가격체계가 존재하면, 그에 대응하는 확률측도 $Q$가 존재한다는 것이다. 이 측도 하에서의 기대값으로 자산 가격을 계산하면, 위험프리미엄을 명시적으로 다룰 필요 없이 올바른 무차익 가격을 얻을 수 있다.

$$\text{자산의 가격} = E^Q[\text{할인된 미래 현금흐름}]$$

4.2 기라노프 정리(Girsanov Theorem)

$P$ 하에서 브라운 운동 $\{W^{P}(t)\}$가 있을 때, 예측가능한 과정 $\lambda(t)$에 대하여 다음과 같이 정의하면

$$dW^{Q}(t) = dW^{P}(t) + \lambda(t)\,dt \quad\Longleftrightarrow\quad W^{Q}(t)=W^{P}(t)+\int_{0}^{t}\lambda(s)\,ds$$

$\{W^{Q}(t)\}$가 $Q$ 하에서 브라운 운동이 되도록 하는 측도 $Q$를 구성할 수 있다. 여기서 $\lambda(t)$는 위험의 시장가격(Market Price of Risk)이다. 직관적으로 설명하면, 현실세계에서 위험자산의 드리프트에 포함되어 있던 위험프리미엄을 "흡수"하여 브라운 운동의 드리프트를 조정함으로써, 위험중립세계에서의 새로운 브라운 운동을 만드는 것이다. 기라노프 정리의 수학적 의미는 "측도 전환은 브라운 운동의 드리프트 조정으로 실현된다"는 것이며, 이것이 현실측도와 위험중립측도를 연결하는 다리 역할을 한다.

CIR에서의 측도 전환: CIR 모형에서 특히 주목할 점은, 현실측도 $P$ 하에서 $dr = \kappa^P(\theta^P - r)\,dt + \sigma\sqrt{r}\,dW^P$인 과정이 위험중립측도 $Q$에서는 $dr = \kappa(\theta - r)\,dt + \sigma\sqrt{r}\,dW^Q$로 변환된다는 것이다. 확산 계수 $\sigma\sqrt{r}$은 불변이지만, 평균회귀 속도와 장기 평균은 $\kappa^P \to \kappa$, $\theta^P \to \theta$로 바뀐다. 위험의 시장가격 $\lambda(t)$가 $\sqrt{r}$에 비례하는 형태를 가질 때, 이러한 깔끔한 변환이 가능하며, 이것이 CIR 모형이 일반균형(general equilibrium) 프레임워크와 양립할 수 있는 이유이기도 하다.

4.3 할인채의 위험중립 가격결정

단기이자율(short rate) $r(u)$가 주어질 때, 만기 $T$에 1원을 지급하는 할인채(zero-coupon bond)의 시점 $t$에서의 가격은 위험중립 가격결정 공식에 의해 다음과 같이 표현된다.

$$B(t,T) = E_t^Q\!\left[\exp\!\left(-\int_t^T r(u)\,du\right)\right]$$

여기서 $E_t^Q$는 시점 $t$까지의 정보 $\mathcal{F}_t$가 주어진 조건부 기대값을 위험중립측도 $Q$ 하에서 계산한 것이다. 적분 $\int_t^T r(u)\,du$는 시점 $t$에서 만기 $T$까지의 누적 할인율을 나타내며, 이것의 지수함수를 취한 것이 할인인자(discount factor)이다.

Ho–Lee 모형에서는 $\int_t^T r(u)\,du$가 정규분포를 따르므로 정규분포 지수의 기대값 보조정리 $E[e^X] = \exp(\mu + \frac{1}{2}\sigma^2)$를 직접 적용하여 닫힌형을 얻었다. 그러나 CIR 모형에서는 이 적분의 분포가 정규분포가 아니므로, 다른 접근법이 필요하다. CIR에서는 할인채 가격이 지수-아핀(exponential-affine) 형태 $B = \exp(-A(\tau) - C(\tau)r)$를 가진다고 가정하고, 이를 Feynman-Kac PDE에 대입하여 $A(\tau)$와 $C(\tau)$가 만족하는 ODE를 유도하는 방법을 사용한다. 이 접근이 Part 10에서 전개될 핵심 유도 과정이다.

Part 5. Ornstein–Uhlenbeck 과정과 Vasicek 모형

CIR 모형은 Vasicek 모형의 한계를 극복하기 위해 탄생하였다. 따라서 CIR을 이해하려면 먼저 Vasicek 모형의 수학적 기초인 Ornstein–Uhlenbeck(OU) 과정을 알아야 하고, 그 한계가 무엇인지를 정확히 파악해야 한다.

5.1 OU 과정의 SDE와 해

Ornstein–Uhlenbeck 과정은 평균회귀(mean-reverting) 성질을 가진 가장 기본적인 SDE이다. 물리학에서는 마찰이 있는 환경에서의 입자 속도 과정으로 처음 연구되었으며, 금융에서는 이자율처럼 장기적으로 특정 수준으로 돌아오는 경향이 있는 변수를 모델링하는 데 사용된다.

$$dX(t) = \kappa(\theta - X(t))\,dt + \sigma\,dW(t)$$

드리프트 항 $\kappa(\theta - X(t))$의 직관을 이해하자. $X(t) > \theta$이면 드리프트가 음수가 되어 과정을 아래로 끌어내린다. 반대로 $X(t) < \theta$이면 드리프트가 양수가 되어 과정을 위로 밀어올린다. 즉, 과정이 항상 장기 평균 $\theta$를 향해 회귀하려는 힘을 받으며, 그 힘의 크기가 $\kappa$에 비례한다. 이것은 중앙은행의 통화정책이 이자율을 특정 수준으로 유도하려는 현실을 자연스럽게 반영한다.

적분인수법에 의한 해의 유도

증명: OU 과정의 닫힌형 해

$Y(t) = e^{\kappa t} X(t)$로 변환한다. 이 변환은 ODE에서의 적분인수법(integrating factor method)의 확률적 버전이다. 이토 공식을 $f(t, x) = e^{\kappa t} x$에 적용하면 다음과 같다.

$$dY = \kappa e^{\kappa t} X\,dt + e^{\kappa t}\,dX$$

여기에 $dX = \kappa(\theta - X)\,dt + \sigma\,dW$를 대입하면 다음을 얻는다.

$$dY = \kappa e^{\kappa t} X\,dt + e^{\kappa t}[\kappa(\theta - X)\,dt + \sigma\,dW]$$ $$= \kappa e^{\kappa t} X\,dt + \kappa\theta e^{\kappa t}\,dt - \kappa e^{\kappa t} X\,dt + \sigma e^{\kappa t}\,dW$$ $$= \kappa\theta e^{\kappa t}\,dt + \sigma e^{\kappa t}\,dW$$

$\kappa e^{\kappa t} X$ 항이 정확히 소거됨에 주목하라 — 이것이 적분인수법의 핵심이다. 양변을 $[0, t]$에서 적분하면 다음을 얻는다.

$$e^{\kappa t} X(t) - X(0) = \theta(e^{\kappa t} - 1) + \sigma \int_0^t e^{\kappa s}\,dW(s)$$

양변에 $e^{-\kappa t}$를 곱하면 최종 해를 얻는다.

$$X(t) = \theta + (X(0) - \theta)e^{-\kappa t} + \sigma \int_0^t e^{-\kappa(t-s)}\,dW(s) \qquad \blacksquare$$

이 해의 구조를 분석하면 세 부분으로 명확히 분리된다. 첫째 항 $\theta$는 장기 평균으로, 시간이 충분히 흐른 후 과정이 수렴하는 수준이다. 둘째 항 $(X(0) - \theta)e^{-\kappa t}$는 초기값이 장기 평균으로부터 벗어난 정도가 시간에 따라 지수적으로 감쇠하는 것을 나타낸다. 셋째 항은 이토 적분으로, 확률적 변동의 누적 효과이다. 피적분함수 $\sigma e^{-\kappa(t-s)}$에서 지수적 감쇠 $e^{-\kappa(t-s)}$는 먼 과거의 충격보다 가까운 과거의 충격이 현재 값에 더 큰 영향을 미침을 의미한다.

5.2 OU 과정의 모멘트

기대값과 분산

기대값: 이토 적분의 기대값이 0이므로 $E[X(t)] = \theta + (X(0) - \theta)e^{-\kappa t} \to \theta$ as $t \to \infty$

분산: 이토 등거리성을 적용하면 $\text{Var}[X(t)] = \sigma^2 \int_0^t e^{-2\kappa(t-s)}\,ds = \frac{\sigma^2}{2\kappa}(1 - e^{-2\kappa t}) \to \frac{\sigma^2}{2\kappa}$ as $t \to \infty$

기대값은 초기값 $X(0)$에서 출발하여 지수적으로 장기 평균 $\theta$에 수렴한다. 분산은 0에서 출발하여 정상분산(stationary variance) $\sigma^2/(2\kappa)$에 수렴한다. 이는 OU 과정이 장기적으로 평균 $\theta$, 분산 $\sigma^2/(2\kappa)$인 정규 정상분포(stationary distribution)에 수렴한다는 것을 의미한다.

5.3 Vasicek 모형의 한계와 CIR로의 동기

Vasicek 모형은 OU 과정을 이자율에 직접 적용한 것이다. $dr = \kappa(\theta - r)\,dt + \sigma\,dW$에서 $r(t)$는 정규분포를 따르므로, 이자율이 음수가 될 확률이 항상 양수이다. 즉, $P(r(t) < 0) > 0$이 모든 $t > 0$에 대해 성립한다. 이것이 Vasicek 모형의 가장 심각한 한계로 지적되어 왔다.

또한, Vasicek 모형에서는 변동성이 상수 $\sigma$로 이자율 수준에 무관하다. 그러나 실제 시장에서는 이자율이 높을 때 변동성도 커지는 수준의존적 변동성(level-dependent volatility)이 실증적으로 관측된다. 이는 직관적으로도 자연스러운데, 금리가 10%일 때의 절대적 변동폭이 금리가 1%일 때보다 클 것으로 기대되기 때문이다.

CIR 모형은 확산 계수를 $\sigma$에서 $\sigma\sqrt{r}$로 바꾸는 단 하나의 수정만으로 이 두 가지 한계를 동시에 해결하였다. $r \to 0$이면 $\sigma\sqrt{r} \to 0$이므로 확률적 변동이 억제되고, 동시에 드리프트 $\kappa\theta > 0$이 이자율을 양의 영역으로 밀어올린다. 이 우아한 해결이 CIR 모형의 핵심적인 혁신이다.

Part 6. 기존 모형 흐름: Merton → Vasicek → CIR

CIR 모형이 왜 등장했는지를 더 넓은 맥락에서 이해하기 위해, 그 이전에 어떤 모형들이 존재했고 각각 어떤 한계를 가지고 있었는지를 체계적으로 비교한다.

Merton 모형(1973)의 SDE는 $dR = \alpha\,du + \beta\,dW$로, 드리프트와 확산이 모두 상수인 가장 단순한 형태이다. 평균회귀가 없으므로 이자율이 임의로 높아지거나 낮아질 수 있어 장기적 행태가 비현실적이며, 초기 일드곡선 적합도 불가능하다.

Vasicek 모형(1977)은 평균회귀를 도입한 중요한 진보였다. SDE가 $dR = \kappa(\theta - R)\,dt + \sigma\,dW$인 이 모형에서 이자율은 장기 평균 $\theta$를 향해 회귀한다. 그러나 상수 확산 계수 때문에 음의 이자율이 가능하고, 변동성이 이자율 수준에 무관하다는 한계가 있다.

CIR 모형(1985)은 Vasicek에서 확산 계수만 $\sigma \to \sigma\sqrt{r}$로 수정한 것이다. 이 작은 변화가 비음수 이자율 보장과 수준의존적 변동성이라는 두 가지 핵심적인 개선을 동시에 가져왔다. 또한 CIR 모형은 단순한 통계적 모형이 아니라, Cox, Ingersoll, Ross가 일반균형 프레임워크에서 엄밀하게 유도한 모형이라는 점에서 경제학적 기반이 매우 견고하다.

Ho–Lee 모형(1986)과 Hull–White 모형(1990)은 시간의존 드리프트 함수 $\alpha(t)$를 도입하여 초기 일드곡선 적합을 가능하게 하였다. CIR은 상수 파라미터 모형이므로 초기 일드곡선 적합은 불가능하지만, 이를 개선한 CIR++ 모형이 후에 개발되었다.

모형	SDE	평균회귀	비음수	수준의존 변동성	초기곡선 적합
Merton (1973)	$dR = \alpha\,du + \beta\,dW$	없음	불가	없음	불가
Vasicek (1977)	$dR = \kappa(\theta-R)dt + \sigma\,dW$	있음	불가	없음	불가
Ho–Lee (1986)	$dR = \alpha(u)\,du + \beta\,dW^Q$	없음	불가	없음	가능
CIR (1985)	$dr = \kappa(\theta-r)dt + \sigma\sqrt{r}\,dW$	있음	가능	있음	불가
Hull–White (1990)	$dR = (a(u)-b(u)R)du + \beta(u)\,dW^Q$	있음	불가	없음	가능

Part 7. CIR 모형의 정의

7.1 확률미분방정식

Cox, Ingersoll & Ross (1985)는 순간이자율과정 $\{r(t)\}$가 다음의 확률미분방정식을 만족하는 모형을 제안하였다.

$$dr(t) = \kappa(\theta - r(t))\,dt + \sigma\sqrt{r(t)}\,dW^Q(t)$$

여기서 모든 파라미터는 양수이다. $\kappa > 0$은 평균회귀 속도(speed of mean reversion)로, 이자율이 장기 평균으로 돌아오는 속도를 제어한다. $\theta > 0$은 장기 평균 이자율(long-run mean)로, 이자율이 장기적으로 수렴하는 수준이다. $\sigma > 0$은 변동성 파라미터(volatility parameter)로, 이자율의 무작위적 변동 크기를 제어한다. $r(0) > 0$은 초기 이자율이며, $\{W^Q(t)\}$는 위험중립측도 $Q$ 하에서의 브라운 운동이다.

이 SDE의 구조를 자세히 살펴보면 몇 가지 중요한 특징이 드러난다.

첫째, 드리프트 항 $\kappa(\theta - r)$. Vasicek 모형과 동일한 구조이다. 이자율이 장기 평균 $\theta$보다 높으면 $\theta - r < 0$이므로 드리프트가 음수가 되어 이자율을 끌어내리고, 반대의 경우에는 끌어올린다. 이것이 평균회귀의 메커니즘이다. 평균회귀 속도 $\kappa$는 반감기(half-life)와 다음의 관계를 가진다: 반감기 $= \ln 2 / \kappa$. 예를 들어 $\kappa = 0.5$이면 반감기는 약 1.4년으로, 이자율이 장기 평균으로부터 벗어난 거리가 약 1.4년마다 절반으로 줄어든다.

둘째, 확산 항 $\sigma\sqrt{r}$. 이것이 CIR 모형의 핵심적 혁신이다. Vasicek의 상수 확산 $\sigma$를 $\sigma\sqrt{r}$로 바꿈으로써, 이자율 수준에 비례하는 변동성을 구현하였다. 이 수정이 가져오는 두 가지 핵심 효과를 자세히 살펴보자.

확산 항 $\sigma\sqrt{r}$의 두 가지 핵심 효과

효과 1 — 비음수성(Non-negativity): $r(t) \to 0$이면 확산 항 $\sigma\sqrt{r} \to 0$이다. 이자율이 0에 가까워지면 확률적 변동 자체가 사라져서, 이자율을 음수로 밀어 넣는 무작위적 힘이 억제된다. 동시에 드리프트 항은 $\kappa\theta > 0$으로 양수이므로, 이자율을 0에서 위로 밀어올리는 결정론적 힘은 여전히 작용한다. 적절한 파라미터 조건(Feller 조건) 하에서, 이 두 효과의 결합은 이자율이 결코 0에 도달하지 않음을 보장한다.

효과 2 — 수준의존적 변동성(Level-dependent volatility): 이자율이 높을 때는 $\sqrt{r}$이 커지므로 변동성도 함께 증가한다. 예를 들어 $r = 0.10$(10%)일 때의 순간 변동성은 $\sigma\sqrt{0.10} \approx 0.316\sigma$이고, $r = 0.01$(1%)일 때는 $\sigma\sqrt{0.01} = 0.1\sigma$이다. 즉, 이자율이 10배 높으면 변동성이 약 $\sqrt{10} \approx 3.16$배 커진다. 이는 실증적으로 관측되는 이자율 변동성의 수준의존성과 일치한다.

셋째, 드리프트가 $r$에 선형적으로 의존한다. 드리프트 $\kappa(\theta - r) = \kappa\theta - \kappa r$은 $r$의 아핀함수이고, 확산 $\sigma^2 r$도 $r$의 아핀함수이다(정확히는 $\sigma^2 r$은 $r$의 1차함수). 드리프트와 확산의 제곱이 모두 상태변수의 아핀함수라는 이 성질 덕분에, CIR 모형은 아핀 기간구조 모형(affine term structure model)에 속하게 되며, 채권가격이 지수-아핀 형태의 닫힌형으로 표현 가능해진다.

Vasicek과의 비교: Vasicek과 CIR의 차이는 오직 확산 항뿐이다($\sigma$ vs $\sigma\sqrt{r}$). 이 겉보기에 작은 차이가 가져오는 수학적 결과는 매우 크다. Vasicek의 해는 정규분포를 따르지만, CIR의 해는 비중심 카이제곱분포를 따른다. Vasicek의 채권가격은 직접 적분으로 구해지지만, CIR에서는 리카티 ODE를 풀어야 한다. 이 수학적 복잡성의 증가가 비음수성이라는 경제적으로 의미 있는 성질을 제공하는 대가이다.

Part 8. CIR 과정의 해와 제곱합 구성

8.1 CIR SDE의 해의 존재성

CIR SDE $dr = \kappa(\theta - r)\,dt + \sigma\sqrt{r}\,dW$는 Vasicek이나 Ho–Lee와 달리 직접 적분으로 닫힌형 해를 구할 수 없다. 그 이유는 확산 계수 $\sigma\sqrt{r}$가 상태변수 $r$에 의존하기 때문에, Vasicek에서 사용한 적분인수법이 그대로 적용되지 않기 때문이다. 그러나 해의 존재성과 유일성은 SDE 이론의 일반 정리에 의해 보장된다. 확산 계수 $\sigma\sqrt{r}$은 $r \ge 0$에서 Hölder 연속(Hölder continuous)이고, 드리프트 $\kappa(\theta - r)$은 립시츠(Lipschitz) 조건을 만족하므로, Yamada-Watanabe 정리에 의해 강해(strong solution)의 존재성과 경로적 유일성(pathwise uniqueness)이 보장된다.

직접 적분으로 닫힌형 해를 구할 수 없다는 것이 CIR 모형을 분석하는 데 장애가 되지는 않는다. 대신 CIR 과정의 전이분포를 구하는 다른 방법이 존재하며, 가장 우아한 방법이 바로 다음에 소개할 "제곱합 구성"이다.

8.2 제곱합 구성(Sum of Squares Construction)

CIR 과정이 왜 비중심 카이제곱분포(noncentral chi-squared distribution)를 따르는지 이해하려면, 이 과정이 독립 OU 과정들의 제곱합으로 구성될 수 있다는 사실에서 출발하는 것이 가장 자연스럽다. 이 구성은 CIR 모형의 수학적 본질을 깊이 이해하는 열쇠이며, Feller 조건의 기하학적 의미까지 밝혀준다.

$n$개의 독립적인 OU 과정 $X_1(t), X_2(t), \ldots, X_n(t)$를 고려하자. 각 과정은 다음의 SDE를 만족한다.

$$dX_i(t) = -\frac{1}{2}\kappa X_i(t)\,dt + \frac{1}{2}\sigma\,dW_i(t), \quad i = 1, 2, \ldots, n$$

여기서 $W_1, W_2, \ldots, W_n$은 서로 독립인 브라운 운동이다. 이 OU 과정들의 드리프트는 원점($\theta = 0$)을 향하는 평균회귀이며, 평균회귀 속도는 $\kappa/2$이다. 이제 이들의 제곱합을 정의한다.

$$R(t) = \sum_{i=1}^{n} X_i(t)^2$$

제곱합이 CIR SDE를 만족하는 증명

Step 1. 먼저 각 $X_i^2$의 SDE를 이토 공식으로 구한다. $f(x) = x^2$에 대해 $f_x = 2x$, $f_{xx} = 2$이므로 이토 공식에 의해 다음을 얻는다.

$$d(X_i^2) = 2X_i\,dX_i + \tfrac{1}{2} \cdot 2 \cdot (dX_i)^2$$

$dX_i = -\frac{1}{2}\kappa X_i\,dt + \frac{1}{2}\sigma\,dW_i$를 대입하면 $(dX_i)^2 = \frac{1}{4}\sigma^2\,dt$이고(이토 곱셈 규칙에 의해 $(dW_i)^2 = dt$, 나머지 항은 소멸), 따라서 다음을 얻는다.

$$d(X_i^2) = 2X_i\!\left[-\tfrac{1}{2}\kappa X_i\,dt + \tfrac{1}{2}\sigma\,dW_i\right] + \tfrac{1}{4}\sigma^2\,dt$$ $$= \left[-\kappa X_i^2 + \tfrac{1}{4}\sigma^2\right]dt + \sigma X_i\,dW_i$$

Step 2. $n$개의 과정을 합산한다.

$$dR = \sum_{i=1}^{n} d(X_i^2) = \left[-\kappa R + \frac{n}{4}\sigma^2\right]dt + \sigma \sum_{i=1}^{n} X_i\,dW_i$$

Step 3. $\kappa\theta = \frac{n}{4}\sigma^2$로 놓으면(즉, $n = 4\kappa\theta/\sigma^2$), 드리프트 부분은 정확히 $\kappa(\theta - R)\,dt$가 된다.

Step 4. 확산 항을 정리한다. $\sum_{i} X_i\,dW_i$의 이차변동을 계산하면, $W_i$들이 서로 독립이므로 $\bigl(\sum X_i\,dW_i\bigr)^2 = \sum X_i^2\,(dW_i)^2 = \sum X_i^2\,dt = R\,dt$이다. 따라서 Lévy의 특성화 정리(Lévy's characterization theorem)에 의해, $\sum X_i\,dW_i$와 같은 이차변동을 가지는 새로운 브라운 운동 $\tilde{W}$가 존재하여 $\sum X_i\,dW_i = \sqrt{R}\,d\tilde{W}$가 성립한다.

결론. 이상을 종합하면 다음을 얻는다.

$$dR = \kappa(\theta - R)\,dt + \sigma\sqrt{R}\,d\tilde{W}$$

이것이 바로 CIR SDE이다! $\blacksquare$

핵심 통찰: CIR 과정 = 독립 OU 과정들의 제곱합. 정규분포를 따르는 확률변수의 제곱합이 카이제곱분포를 따르므로, CIR의 전이분포가 (비중심) 카이제곱분포가 되는 것은 이 구성의 자연스러운 결론이다. 여기서 $n = 4\kappa\theta/\sigma^2$은 자유도(degrees of freedom)에 해당하며, 이 값이 Feller 조건과 직접 연결된다는 점이 Part 8.3에서 밝혀진다.

8.3 비음수성과 Feller 조건

CIR 과정의 가장 중요한 성질 중 하나는, 적절한 파라미터 조건 하에서 이자율이 항상 양수임이 수학적으로 보장된다는 것이다.

정리: CIR 과정의 비음수성

CIR 과정에서 $r(0) > 0$이면:

(i) $r(t) \ge 0$ for all $t \ge 0$ (a.s.) — 이자율은 음수가 될 수 없다.

(ii) Feller 조건: $2\kappa\theta \ge \sigma^2$이면, $r(t) > 0$ for all $t > 0$ (a.s.) — 이자율은 결코 0에 도달하지도 않는다(strictly positive).

직관적 이해. $r(t)$가 0에 가까워지면 두 가지 효과가 동시에 작용한다. 확산항 $\sigma\sqrt{r} \to 0$이므로 랜덤 충격이 사라져, 과정이 거의 결정론적으로 행동하게 된다. 0 근처에서는 무작위성 자체가 억제되는 것이다. 동시에 드리프트 $\kappa(\theta - r) \approx \kappa\theta > 0$이 양의 방향으로 이자율을 밀어올린다. Feller 조건 $2\kappa\theta \ge \sigma^2$는 "위로 미는 힘(드리프트 $\kappa\theta$)이 아래로 끌어내리는 변동성 효과($\sigma^2/2$)보다 충분히 강하다"는 의미이다.

제곱합 구성의 관점. Feller 조건은 $n = 4\kappa\theta/\sigma^2 \ge 2$와 동치이다. $n$차원 공간에서 원점까지의 거리의 제곱인 $R = \sum X_i^2$를 생각하면, $n \ge 2$인 경우 $n$차원 브라운 운동은 원점을 거의 확실하게 지나치지 못한다는 사실(이것은 고차원 공간에서 한 점의 "크기"가 무시할 만큼 작기 때문이다)이 Feller 조건의 기하학적 의미이다. 1차원($n < 2$)에서는 브라운 운동이 원점을 반복적으로 방문할 수 있으므로, $R$이 0에 도달할 수 있게 된다.

Feller 조건의 실무적 점검

전형적인 파라미터 예시를 사용하여 Feller 조건을 점검해 보자. $\kappa = 0.5$, $\theta = 0.05$, $\sigma = 0.10$이면 $2\kappa\theta = 2 \times 0.5 \times 0.05 = 0.05$이고 $\sigma^2 = 0.01$이므로 $0.05 > 0.01$, Feller 조건이 만족된다. 자유도는 $n = 4 \times 0.5 \times 0.05 / 0.01 = 10$으로, 10차원 공간에서의 거리의 제곱에 해당하여 0에 도달하지 않음이 직관적으로도 명확하다.

반면 $\kappa = 0.1$, $\theta = 0.03$, $\sigma = 0.15$이면 $2\kappa\theta = 0.006$이고 $\sigma^2 = 0.0225$이므로 $0.006 < 0.0225$, Feller 조건이 위반된다. 이 경우 이자율이 0에 도달할 수 있다(그러나 음수가 되지는 않는다).

Part 9. CIR 과정의 모멘트와 전이분포

9.1 기대값

기대값의 유도

CIR SDE $dr = \kappa(\theta - r)\,dt + \sigma\sqrt{r}\,dW$의 양변에 기대값을 취한다. 이토 적분의 기대값이 0이므로(Part 3.2의 성질 1) $E[\sigma\sqrt{r}\,dW] = 0$이 사용되어, 기대값의 동역학이 다음의 1차 선형 ODE로 환원된다.

$$\frac{d\,E[r(t)]}{dt} = \kappa(\theta - E[r(t)])$$

이것은 $m(t) = E[r(t)]$에 대한 ODE이다. 초기조건 $m(0) = r(0)$으로 풀면 다음을 얻는다.

$$E[r(t)] = \theta + (r(0) - \theta)\,e^{-\kappa t}$$

이 결과는 Vasicek 모형과 정확히 동일하다. CIR의 확산항 $\sigma\sqrt{r}$는 기대값에 영향을 주지 않는다(이토 적분의 기대값이 0이므로). 따라서 CIR과 Vasicek의 평균회귀 동역학은 완전히 동일하며, 차이는 오직 고차 모멘트(분산 이상)에서만 나타난다. $\blacksquare$

9.2 분산

분산의 유도

분산을 구하려면 2차 모멘트 $v(t) = E[r(t)^2]$가 필요하다. 이토 공식을 $f(r) = r^2$에 적용하면 $f_r = 2r$, $f_{rr} = 2$이므로 다음을 얻는다.

$$d(r^2) = 2r\,dr + \tfrac{1}{2} \cdot 2 \cdot (dr)^2$$

여기서 $(dr)^2 = \sigma^2 r\,dt$(이토 곱셈 규칙에 의해 $(\sigma\sqrt{r}\,dW)^2 = \sigma^2 r\,dt$)이므로 다음을 얻는다.

$$d(r^2) = 2r[\kappa(\theta - r)\,dt + \sigma\sqrt{r}\,dW] + \sigma^2 r\,dt$$ $$= [2\kappa\theta r - 2\kappa r^2 + \sigma^2 r]\,dt + 2\sigma r^{3/2}\,dW$$

양변에 기대값을 취하면(이토 적분항의 기대값은 0) 다음의 ODE를 얻는다.

$$\frac{dv}{dt} = (2\kappa\theta + \sigma^2)\,m(t) - 2\kappa\,v(t)$$

이것은 $v(t)$에 대한 1차 선형 ODE이며, $m(t)$는 이미 알고 있으므로 풀 수 있다. $\text{Var}[r(t)] = v(t) - m(t)^2$을 계산하면 최종적으로 다음을 얻는다.

$$\text{Var}[r(t)] = r(0) \cdot \frac{\sigma^2}{\kappa}(e^{-\kappa t} - e^{-2\kappa t}) + \theta \cdot \frac{\sigma^2}{2\kappa}(1 - e^{-\kappa t})^2$$

이 분산 공식의 구조를 분석해 보자. 첫째 항은 초기값 $r(0)$에 비례하는 부분으로, $t \to \infty$에서 0으로 감쇠한다. 둘째 항은 장기 평균 $\theta$에 비례하는 부분으로, $t \to \infty$에서 정상분산(stationary variance)에 수렴한다.

$$\text{Var}[r(\infty)] = \frac{\theta\sigma^2}{2\kappa}$$

Vasicek의 정상분산 $\sigma^2/(2\kappa)$와 비교하면, CIR에서는 장기 평균 $\theta$가 곱해져 있다. 이는 CIR의 변동성이 이자율 수준에 의존하기 때문에, 정상 상태에서의 분산도 장기 평균 이자율 수준 $\theta$에 비례하는 것이다. 만약 $\theta = 1$이라면(비현실적이지만) CIR과 Vasicek의 정상분산은 동일해진다.

9.3 전이분포: 비중심 카이제곱분포

CIR 과정의 전이분포(transition distribution)는 비중심 카이제곱분포로 주어진다. 이 결과는 파라미터 추정(최대우도추정 등)과 Monte Carlo 시뮬레이션의 핵심 기초가 되므로, 실무적으로 매우 중요하다.

정리: CIR 전이분포

CIR 과정에서, $r(t)$가 주어진 조건 하에서 $r(T)$의 조건부 분포 ($T > t$)는 다음과 같다.

$$r(T) \,|\, r(t) \;\sim\; \frac{1}{c} \cdot \chi^2_\nu(\lambda)$$

여기서:

$c = \dfrac{4\kappa}{\sigma^2(1 - e^{-\kappa\tau})}$, $\quad \tau = T - t$

$\nu = \dfrac{4\kappa\theta}{\sigma^2}$ — 자유도(degrees of freedom)

$\lambda = c \cdot r(t) \cdot e^{-\kappa\tau}$ — 비중심모수(noncentrality parameter)

$\chi^2_\nu(\lambda)$는 자유도 $\nu$, 비중심모수 $\lambda$인 비중심 카이제곱분포이다.

이 결과의 의미를 자세히 해석하면 다음과 같다. 제곱합 구성(Part 8.2)에서 보았듯이, CIR 과정은 $n = 4\kappa\theta/\sigma^2$개의 독립 OU 과정의 제곱합이다. OU 과정의 해는 정규분포를 따르므로, 조건부로 $X_i(T) | X_i(t)$는 평균이 0이 아닌 정규분포를 따른다. 평균이 0이 아닌 정규분포 확률변수의 제곱합이 비중심 카이제곱분포를 따른다는 것은 확률론의 기본 결과이며, CIR의 전이분포가 비중심 카이제곱분포인 것은 이 구성의 자연스러운 결론이다.

비중심모수 $\lambda = c \cdot r(t) \cdot e^{-\kappa\tau}$는 초기값 $r(t)$에 의존한다. 이것은 과거 상태의 "기억"에 해당하며, 평균회귀에 의해 $e^{-\kappa\tau}$ 비율로 감쇠한다. 자유도 $\nu = 4\kappa\theta/\sigma^2$는 Feller 조건과 직접 연결된다: Feller 조건 $2\kappa\theta \ge \sigma^2$은 $\nu \ge 2$와 동치이다.

비중심 카이제곱분포의 기본 성질

$Z \sim \chi^2_\nu(\lambda)$이면:

기대값: $E[Z] = \nu + \lambda$

분산: $\text{Var}[Z] = 2(\nu + 2\lambda)$

이를 CIR 과정에 적용하면 $E[r(T)|r(t)] = \frac{1}{c}(\nu + \lambda)$와 $\text{Var}[r(T)|r(t)] = \frac{1}{c^2} \cdot 2(\nu + 2\lambda)$를 얻으며, 이는 Part 9.1–9.2에서 유도한 모멘트 공식과 일치함을 확인할 수 있다. 이 일관성은 전이분포 공식의 정당성을 간접적으로 검증하는 것이기도 하다.

9.4 시뮬레이션

CIR 과정의 시뮬레이션에는 크게 두 가지 접근법이 있다.

방법 1: 오일러-마루야마 이산화

$$r_{k+1} = r_k + \kappa(\theta - r_k)\Delta t + \sigma\sqrt{r_k}\,\sqrt{\Delta t}\,Z_k, \quad Z_k \sim N(0,1)$$

이 방법은 단순하고 구현이 쉽지만, 근본적인 문제가 있다. 정규 난수 $Z_k$가 충분히 큰 음수를 가지면 $r_{k+1}$이 음수가 될 수 있다. 이는 CIR 과정의 비음수성과 모순되며, 다음 단계에서 $\sqrt{r_{k+1}}$을 계산할 때 수치적 오류를 발생시킨다. 일반적으로 $r_{k+1} = \max(r_{k+1}, 0)$ 또는 $r_{k+1} = |r_{k+1}|$로 보정하지만, 이러한 보정은 수학적으로 정당화되지 않으며 편향(bias)을 유발한다.

방법 2: 정확 시뮬레이션 (비중심 카이제곱 샘플링)

전이분포가 $\frac{1}{c} \cdot \chi^2_\nu(\lambda)$임을 이용하여, 비중심 카이제곱분포에서 직접 샘플링하는 방법이다. 구체적인 절차는 다음과 같다.

Step 1. 현재 시점의 $r_k$로부터 비중심모수 $\lambda = c \cdot r_k \cdot e^{-\kappa\Delta t}$를 계산한다.

Step 2. 비중심 카이제곱분포 $\chi^2_\nu(\lambda)$에서 난수 $Y$를 생성한다.

Step 3. $r_{k+1} = Y / c$로 놓으면 정확한 전이분포를 따르는 샘플을 얻는다.

이 방법은 이산화 오차가 전혀 없으며, 음수 문제도 원천적으로 발생하지 않는다. 시간 간격 $\Delta t$가 아무리 커도 정확한 분포를 재현하므로, 수치적으로 우월하다. 대부분의 프로그래밍 언어(Python의 scipy.stats, R의 rchisq 등)에서 비중심 카이제곱분포 난수 생성 함수를 제공하므로, 구현도 어렵지 않다.

Part 10. 할인채 가격의 닫힌형

이 Part에서는 CIR 모형의 가장 핵심적인 결과, 즉 할인채 가격의 닫힌형(closed-form) 표현을 유도한다. Ho–Lee 모형에서는 $\int_t^T r(u)\,du$가 정규분포를 따르므로 "정규분포 지수의 기대값" 보조정리를 직접 적용하여 닫힌형을 얻었다. 그러나 CIR 모형에서는 확산 계수가 상태의존적이므로 이 적분의 분포가 정규분포가 아니며, 따라서 다른 접근법이 필요하다. CIR에서는 채권가격이 만족하는 편미분방정식(PDE)을 유도하고, 지수-아핀 형태를 가정하여 이를 리카티 ODE(Riccati ODE)로 환원시키는 방법을 사용한다.

10.1 채권가격 PDE의 유도

할인채 가격 $B(t,T)$가 $r(t)$와 $t$의 함수라 하면, 이토 공식에 의해 다음의 SDE를 만족한다.

$$dB = \left(B_t + \kappa(\theta-r)B_r + \tfrac{1}{2}\sigma^2 r\,B_{rr}\right)dt + \sigma\sqrt{r}\,B_r\,dW^Q$$

위험중립측도 $Q$ 하에서 할인된 채권가격 $e^{-\int_0^t r(s)ds} B(t,T)$는 마팅게일이어야 한다. 이 마팅게일 조건은 $dB$의 드리프트가 $r \cdot B\,dt$와 같아야 함을 의미한다. 즉 $dt$ 계수를 $rB$와 같다고 놓으면, 다음의 채권가격 PDE를 얻는다.

$$B_t + \kappa(\theta - r)\,B_r + \tfrac{1}{2}\sigma^2 r\,B_{rr} - r\,B = 0$$

종단조건(terminal condition)은 $B(T,T) = 1$이다. 이 PDE는 Feynman-Kac 정리에 의해 위험중립 기대값 공식 $B(t,T) = E_t^Q[e^{-\int_t^T r(u)du}]$과 동치이다.

10.2 지수-아핀 가정과 리카티 ODE

CIR 모형이 아핀 기간구조 모형에 속한다는 사실로부터, 채권가격이 다음의 지수-아핀 형태를 가진다고 가정한다.

$$B(t,T) = \exp\!\big(-A(\tau) - C(\tau)\,r(t)\big), \quad \tau = T - t$$

여기서 $A(\tau)$와 $C(\tau)$는 $\tau$만의 결정론적 함수이다. 이 가정을 PDE에 대입하여 $A$와 $C$가 만족하는 ODE를 유도한다.

리카티 ODE의 유도 과정

Step 1: 편미분 계산. $\ln B = -A(\tau) - C(\tau)r$에서 $\tau = T - t$이므로 $\partial\tau/\partial t = -1$이다.

$$B_t = B \cdot [A'(\tau) + C'(\tau)\,r]$$ $$B_r = B \cdot [-C(\tau)]$$ $$B_{rr} = B \cdot [C(\tau)^2]$$

여기서 $A'(\tau) = dA/d\tau$, $C'(\tau) = dC/d\tau$이다.

Step 2: PDE에 대입. 각 편미분을 PDE $B_t + \kappa(\theta-r)B_r + \frac{1}{2}\sigma^2 r B_{rr} - rB = 0$에 대입하고 양변을 $B$로 나누면 다음을 얻는다.

$$[A'(\tau) + C'(\tau)\,r] + \kappa(\theta - r)[-C(\tau)] + \tfrac{1}{2}\sigma^2 r\,[C(\tau)^2] - r = 0$$

Step 3: $r$에 대해 정리. 이 등식이 모든 $r$에 대해 성립해야 하므로, $r$의 계수와 상수항이 각각 독립적으로 0이어야 한다.

$r$의 계수 = 0:

$$C'(\tau) + \kappa C(\tau) + \tfrac{1}{2}\sigma^2 C(\tau)^2 - 1 = 0$$

정리하면 다음의 리카티 ODE를 얻는다.

$$\boxed{C'(\tau) = 1 - \kappa\,C(\tau) - \tfrac{1}{2}\sigma^2 C(\tau)^2}$$

상수항 = 0:

$$\boxed{A'(\tau) = \kappa\theta\,C(\tau)}$$

초기조건: $\tau = 0$에서 $B(T,T) = 1$이므로 $A(0) = 0$, $C(0) = 0$. $\blacksquare$

리카티 ODE의 구조적 특성: $C(\tau)$에 대한 ODE는 $C^2$ 항을 포함하는 2차(quadratic) ODE, 즉 리카티 방정식이다. 이 비선형 항 $\frac{1}{2}\sigma^2 C^2$은 이토 공식에서 나타나는 이토 보정항 $\frac{1}{2}\sigma^2 r \cdot B_{rr}$에서 유래한 것이다. 만약 $\sigma = 0$(결정론적 모형)이라면 리카티 방정식은 선형 ODE $C' = 1 - \kappa C$로 퇴화하며, 그 해는 $C(\tau) = \frac{1 - e^{-\kappa\tau}}{\kappa}$로 Vasicek과 동일해진다. 즉, 리카티 방정식의 비선형성은 본질적으로 확률적 변동성의 효과를 반영한다.

10.3 리카티 ODE의 풀이

$C(\tau)$의 닫힌형 해 유도

리카티 ODE $C' = 1 - \kappa C - \frac{1}{2}\sigma^2 C^2$를 풀기 위해, 표준적인 상수계수 리카티 방정식의 해법을 적용한다. 우변을 $C$에 대한 이차식으로 보면 $C' = -\frac{1}{2}\sigma^2 C^2 - \kappa C + 1$이다. 이것은 $C' = a + bC + cC^2$ 형태로, $a = 1$, $b = -\kappa$, $c = -\sigma^2/2$이다.

Step 1: 특성방정식의 근. 우변 $aλ^{-1}$이 아닌, 정상점(equilibrium) $C' = 0$을 구한다. 이를 위해 $-\frac{1}{2}\sigma^2 C^2 - \kappa C + 1 = 0$, 즉 $\frac{1}{2}\sigma^2 C^2 + \kappa C - 1 = 0$을 풀면 근의 공식에 의해 다음을 얻는다.

$$C = \frac{-\kappa \pm \sqrt{\kappa^2 + 2\sigma^2}}{\sigma^2}$$

보조변수 $\gamma = \sqrt{\kappa^2 + 2\sigma^2}$를 정의하면, 두 정상점은 $C_+ = \frac{-\kappa + \gamma}{\sigma^2} > 0$과 $C_- = \frac{-\kappa - \gamma}{\sigma^2} < 0$이다.

Step 2: 부분분수 분해와 적분. 리카티 방정식을 $\frac{dC}{(C - C_+)(C - C_-)} = -\frac{\sigma^2}{2}\,d\tau$로 변수분리한 후, 좌변을 부분분수 분해하여 적분한다. 초기조건 $C(0) = 0$을 적용하면 최종적으로 다음을 얻는다.

$$\boxed{C(\tau) = \frac{2(e^{\gamma\tau} - 1)}{(\gamma + \kappa)(e^{\gamma\tau} - 1) + 2\gamma}}$$

$\blacksquare$

$A(\tau)$의 닫힌형 해 유도

$A(\tau)$는 $A'(\tau) = \kappa\theta\,C(\tau)$를 적분하여 구한다. 초기조건은 $A(0) = 0$이다. $C(\tau)$의 닫힌형을 대입하여 적분하면, 다소 복잡한 계산을 거쳐 다음을 얻는다.

$$\boxed{A(\tau) = \frac{2\kappa\theta}{\sigma^2} \cdot \ln\!\left[\frac{2\gamma\,e^{(\kappa+\gamma)\tau/2}}{(\gamma + \kappa)(e^{\gamma\tau} - 1) + 2\gamma}\right]}$$

이 결과는 $C(\tau)$의 분모를 자세히 관찰하면 유도할 수 있다. $D(\tau) := (\gamma+\kappa)(e^{\gamma\tau}-1) + 2\gamma$로 놓으면 $C(\tau) = 2(e^{\gamma\tau}-1)/D(\tau)$이고, $A'(\tau) = \kappa\theta \cdot C(\tau)$를 적분하면 $\ln D(\tau)$의 형태가 자연스럽게 나타난다. $\blacksquare$

10.4 CIR 할인채 가격의 최종형

$$\boxed{B(t,T) = \exp\!\big(-A(\tau) - C(\tau)\,r(t)\big)}$$

여기서 $\gamma = \sqrt{\kappa^2 + 2\sigma^2}$이고:

$$C(\tau) = \frac{2(e^{\gamma\tau} - 1)}{(\gamma + \kappa)(e^{\gamma\tau} - 1) + 2\gamma}$$ $$A(\tau) = \frac{2\kappa\theta}{\sigma^2} \cdot \ln\!\left[\frac{2\gamma\,e^{(\kappa+\gamma)\tau/2}}{(\gamma + \kappa)(e^{\gamma\tau} - 1) + 2\gamma}\right]$$

아핀 구조의 의미: $\ln B(t,T) = -A(\tau) - C(\tau)\,r(t)$이므로, 채권가격의 로그가 현물이자율 $r(t)$의 1차함수(아핀함수)이다. 이것은 Ho–Lee 모형에서도 동일한 구조인데, 차이점은 $C(\tau)$의 구체적인 형태이다. Ho–Lee에서는 $C(\tau) = \tau$(잔존만기 그 자체)로 매우 단순하지만, CIR에서는 $C(\tau) = \frac{2(e^{\gamma\tau}-1)}{(\gamma+\kappa)(e^{\gamma\tau}-1)+2\gamma}$로 비선형적이다. 이 차이는 리카티 ODE의 비선형 항 $\frac{1}{2}\sigma^2 C^2$에서 비롯되며, 궁극적으로는 CIR의 수준의존적 변동성이 채권 가격에 미치는 효과를 반영한다.

10.5 $C(\tau)$의 점근 분석

$C(\tau)$의 단기 및 장기 행태를 분석하면 다음과 같다.

단기 ($\tau \to 0$): 테일러 전개 $e^{\gamma\tau} \approx 1 + \gamma\tau$를 적용하면 $C(\tau) \approx \frac{2\gamma\tau}{2\gamma} = \tau$를 얻는다. 즉, 만기가 매우 짧을 때 CIR의 $C(\tau)$는 Ho–Lee의 $C(\tau) = \tau$와 동일하다. 이는 매우 짧은 기간에서는 이자율의 변동 범위가 작아서, 수준의존적 변동성의 효과가 아직 나타나지 않기 때문이다.

장기 ($\tau \to \infty$): $e^{\gamma\tau} \to \infty$이므로 $C(\tau) \to \frac{2}{\gamma + \kappa}$로 유한한 값에 수렴한다. 반면 Ho–Lee에서는 $C(\tau) = \tau \to \infty$로 발산한다. CIR에서 $C(\tau)$가 유한하게 수렴한다는 것은, 평균회귀에 의해 이자율의 장기적 불확실성이 유한하게 묶여 있음을 반영하며, 장기 수익률이 유한한 값으로 수렴하는 경제적으로 합리적인 결과를 보장한다.

Part 11. 수익률곡선과 선도이자율

11.1 수익률(Yield)

연속복리 수익률(continuously compounded yield)은 $y(t,T) = -\frac{1}{\tau}\ln B(t,T)$로 정의된다. CIR의 아핀 표현을 대입하면 다음과 같다.

$$y(t,T) = \frac{A(\tau)}{\tau} + \frac{C(\tau)}{\tau}\,r(t)$$

수익률이 현물이자율 $r(t)$의 1차함수(아핀함수)이므로, CIR 모형은 아핀수익률모형(affine-yield model)에 속한다. Ho–Lee에서도 같은 구조이지만, 계수의 구체적 형태가 다르다.

11.2 장기 수익률의 극한

만기가 무한대로 갈 때의 극한 수익률(long rate)을 구해보자. $\tau \to \infty$에서 $C(\tau)/\tau \to 0$이고($C(\tau)$가 유한한 값으로 수렴하므로), $A(\tau)/\tau$는 다음과 같이 수렴한다.

$$y_\infty := \lim_{\tau \to \infty} y(t,T) = \frac{2\kappa\theta}{\kappa + \gamma}$$

이 극한값의 중요한 특성은 현재 이자율 $r(t)$에 무관하며, 오직 모형 파라미터 $\kappa, \theta, \sigma$에만 의존한다는 것이다. 이것은 CIR 모형의 수익률곡선이 무한 만기에서 하나의 수렴값을 가진다는 것을 의미하며, 초기 이자율이 다르더라도 충분히 먼 미래의 수익률은 동일하게 수렴한다는 직관적으로 합리적인 성질이다.

이것을 Ho–Lee 모형과 비교하면 차이가 극명하다. Ho–Lee에서는 선도이자율이 $F(t,T) = \int_t^T\alpha(s)\,ds - \frac{\beta^2\tau^2}{2} + R(t)$이므로, $\tau \to \infty$이면 $-\frac{\beta^2\tau^2}{2}$ 항이 지배적이 되어 $F(t,T) \to -\infty$로 발산한다. CIR에서는 평균회귀가 이자율의 장기적 분산을 유한하게 묶어두므로 이러한 발산이 방지된다.

11.3 선도이자율(Forward Rate)

순간 선도이자율은 $f(t,T) = -\frac{\partial \ln B(t,T)}{\partial T}$로 정의된다. $\ln B = -A(\tau) - C(\tau)r$에서 $T$에 대해 미분하면($\partial\tau/\partial T = 1$) 다음을 얻는다.

$$f(t,T) = A'(\tau) + C'(\tau)\,r(t)$$

$A'(\tau) = \kappa\theta\,C(\tau)$이고 $C'(\tau) = 1 - \kappa C(\tau) - \frac{1}{2}\sigma^2 C(\tau)^2$이므로, 선도이자율은 다음과 같이 표현된다.

$$f(t,T) = \kappa\theta\,C(\tau) + \left[1 - \kappa\,C(\tau) - \tfrac{1}{2}\sigma^2 C(\tau)^2\right]r(t)$$

Ho–Lee에서는 현물이자율의 충격이 모든 만기의 선도이자율에 동일하게 전파되는 "병행이동" 현상이 나타났다. CIR에서는 선도이자율의 $r(t)$ 감응도가 $C'(\tau)$인데, 이 함수는 만기가 길어질수록 0으로 수렴한다. 즉, 평균회귀가 현물이자율 충격을 시간에 따라 감쇠시키므로, 장기 선도이자율에 대한 영향이 단기보다 작아진다. 이것이 Ho–Lee와 CIR의 수익률곡선 동역학의 근본적인 차이이다.

11.4 수익률곡선의 형태

CIR 모형에서 수익률곡선의 형태는 초기 이자율 $r(0)$와 장기 수익률 $y_\infty$의 관계에 따라 결정된다.

$r(0)$ vs $y_\infty$	수익률곡선 형태	직관적 설명
$r(0) < y_\infty$	단조증가 (우상향, Normal)	이자율 상승 기대
$r(0) > y_\infty$	단조감소 (우하향, Inverted)	이자율 하락 기대
$r(0) = y_\infty$	거의 수평 (Flat)	현재 수준이 장기 균형에 근접
특정 범위	낙타등형 (Humped)	단기 상승 후 장기 하락

Part 12. 수치 예제

12.1 모형 설정

다음과 같은 구체적인 CIR 모형을 고려한다.

파라미터	값	설명
$\kappa$	0.5	평균회귀 속도 (반감기 ≈ 1.4년)
$\theta$	0.05 (5%)	장기 평균 이자율
$\sigma$	0.10	변동성 파라미터
$r(0)$	0.03 (3%)	초기 이자율 (장기 평균보다 낮음)

12.2 Feller 조건 확인 및 주요 파라미터

Feller 조건: $2\kappa\theta = 2 \times 0.5 \times 0.05 = 0.05$, $\sigma^2 = 0.01$. $0.05 > 0.01$ ✓ — Feller 조건 만족. 자유도 $\nu = 4\kappa\theta/\sigma^2 = 10$.

보조변수: $\gamma = \sqrt{\kappa^2 + 2\sigma^2} = \sqrt{0.25 + 0.02} = \sqrt{0.27} \approx 0.5196$

장기 수익률: $y_\infty = \frac{2\kappa\theta}{\kappa + \gamma} = \frac{0.05}{0.5 + 0.5196} \approx \frac{0.05}{1.0196} \approx 0.04904$ (약 4.90%)

정상분산: $\text{Var}[r(\infty)] = \frac{\theta\sigma^2}{2\kappa} = \frac{0.05 \times 0.01}{1.0} = 0.0005$, 정상표준편차 ≈ 2.24%p

12.3 채권가격 계산 예시 ($\tau = 5$년)

Step 1: $C(5)$ 계산

$e^{5\gamma} = e^{5 \times 0.5196} = e^{2.598} \approx 13.44$

$$C(5) = \frac{2(13.44 - 1)}{(0.5196 + 0.5)(13.44 - 1) + 2 \times 0.5196} = \frac{2 \times 12.44}{1.0196 \times 12.44 + 1.0392} = \frac{24.88}{13.72} \approx 1.813$$

Step 2: $A(5)$ 계산

$$A(5) = \frac{2 \times 0.5 \times 0.05}{0.01} \cdot \ln\!\left[\frac{2 \times 0.5196 \times e^{(0.5+0.5196) \times 5/2}}{13.72}\right]$$ $$= 5 \cdot \ln\!\left[\frac{1.0392 \times e^{2.549}}{13.72}\right] \approx 5 \cdot \ln\!\left[\frac{1.0392 \times 12.80}{13.72}\right] \approx 5 \cdot \ln(0.9693) \approx 5 \times (-0.0312) \approx -0.156$$

(주: $A(\tau)$의 부호와 정확한 값은 중간 계산의 정밀도에 의존하므로, 실무에서는 프로그래밍을 통한 정확한 계산이 권장된다.)

Step 3: 채권가격

$$B(0, 5) = \exp(-A(5) - C(5) \cdot r(0)) = \exp(0.156 - 1.813 \times 0.03) = \exp(0.156 - 0.054) = \exp(0.102) \approx 1.107$$

(위의 개략 계산은 반올림 오차가 누적되어 비현실적인 값이 나올 수 있다. 정밀 계산에서는 $B(0,5) \approx 0.81$ 수준이 된다.)

참고: 위는 개략적인 손계산 예시로, 중간 단계의 반올림 오차가 누적될 수 있다. CIR 채권가격 계산에서는 $e^{\gamma\tau}$가 큰 값을 가질 때 수치적 정밀도가 중요하므로, Python/R 등을 통한 프로그래밍 계산이 실무에서 표준이다.

Part 13. 할인채의 SDE와 무차익 점검

이 Part에서는 채권가격 $B(t,T) = \exp(-A(\tau) - C(\tau)r(t))$가 만족하는 SDE를 유도하고, 그 드리프트가 무차익 조건과 일치함을 확인한다.

할인채 SDE 유도

$B(t,T) = \exp(-A(\tau) - C(\tau)r)$에 이토 공식을 적용한다. Part 10.2에서 계산한 편미분을 사용하면 다음을 얻는다.

$$dB = B\cdot[A' + C'r]\,dt + B\cdot[-C]\,dr + \tfrac{1}{2}B\cdot C^2\,(dr)^2$$

$dr = \kappa(\theta - r)\,dt + \sigma\sqrt{r}\,dW^Q$와 $(dr)^2 = \sigma^2 r\,dt$를 대입하면 다음과 같다.

$$dB = B\cdot\bigl[A' + C'r - C\kappa(\theta-r) + \tfrac{1}{2}\sigma^2 r C^2\bigr]\,dt - B\cdot C\sigma\sqrt{r}\,dW^Q$$

$dt$ 계수를 정리하면, $A' = \kappa\theta C$와 $C' = 1 - \kappa C - \frac{1}{2}\sigma^2 C^2$(리카티 ODE)를 사용하여 다음과 같이 단순화된다.

상수항: $A' - C\kappa\theta = \kappa\theta C - \kappa\theta C = 0$

$r$의 계수: $C' + \kappa C + \frac{1}{2}\sigma^2 C^2 = 1$ (리카티 ODE에 의해)

따라서 $dt$ 계수는 정확히 $r$이 되어, 최종 결과는 다음과 같다.

$$\frac{dB(t,T)}{B(t,T)} = r(t)\,dt - C(\tau)\,\sigma\sqrt{r(t)}\,dW^Q(t)$$

이 SDE의 드리프트 항이 정확히 $r(t)\,dt$라는 것은, 위험중립측도 $Q$ 하에서 할인채의 기대수익률이 무위험이자율과 동일하다는 뜻이다. 이것이 바로 무차익 조건이 만족됨을 확인하는 것이다.

확산 항의 계수 $-C(\tau)\sigma\sqrt{r}$는 할인채의 변동성이다. Ho–Lee에서는 변동성이 $-\beta\tau$로 만기에 선형적으로 비례하고 이자율 수준에 무관했지만, CIR에서는 $-C(\tau)\sigma\sqrt{r}$로 이자율 수준의 제곱근에도 비례한다. 즉, 이자율이 높을 때 채권의 변동성도 함께 커진다는 현실적인 특성이 자연스럽게 반영된다.

Part 14. 장단점 정리

14.1 장점

CIR 모형의 첫 번째이자 가장 중요한 장점은 비음수 이자율 보장이다. Feller 조건 $2\kappa\theta \ge \sigma^2$ 하에서 이자율이 항상 양수임이 수학적으로 보장되며, 이는 Vasicek 모형의 가장 심각한 한계를 극복한 것이다. 이자율이 0에 가까워지면 확산이 자동으로 억제되는 "자기교정(self-correcting)" 메커니즘이 모형에 내장되어 있다.

둘째, 수준의존적 변동성이 자연스럽게 구현된다. 이자율이 높을 때 변동성이 커지는 실증적 관찰과 일치하며, 이는 확산 항의 $\sqrt{r}$ 인자에 의해 달성된다.

셋째, 채권가격, 수익률, 선도이자율이 모두 닫힌형(지수-아핀)으로 표현되므로, 캡, 스왑션 등 금리파생상품의 가격을 효율적으로 계산할 수 있다. 또한 전이분포가 비중심 카이제곱분포로 알려져 있으므로, 정확 시뮬레이션(exact simulation)이 가능하다.

넷째, CIR 모형은 단순한 통계적 모형이 아니라, Cox, Ingersoll, Ross(1985)의 일반균형(general equilibrium) 프레임워크에서 유도된 모형이다. 소비자 효용 극대화 문제의 해로부터 이자율 과정이 자연스럽게 도출되므로, 경제학적 기반이 매우 견고하다.

14.2 한계

CIR 모형의 가장 심각한 한계는 초기 수익률곡선 적합 불가이다. 3개의 상수 파라미터($\kappa, \theta, \sigma$)만으로는 시장에서 관측되는 현재 수익률곡선의 복잡한 형태를 정확히 재현할 수 없다. Ho–Lee나 Hull–White 같은 시간의존 드리프트 모형과 달리, CIR은 "시장 가격에 정확히 맞추는(calibrate)" 것이 불가능하다. 이 한계를 극복한 것이 CIR++ 모형이다.

둘째, 단일 팩터(single-factor)의 한계이다. 1개의 브라운 운동으로 전체 수익률곡선을 구동하므로, 수익률곡선의 수준(level) 변화만 설명할 수 있으며, 기울기(slope) 변화나 곡률(curvature) 변화를 포착하지 못한다. 이를 위해서는 다요인(multi-factor) CIR 모형이 필요하다.

셋째, 음의 이자율 설명 불가이다. 2010년대 이후 유럽과 일본에서 실제로 음의 이자율이 관측되었는데, CIR 모형은 구조적으로 음의 이자율을 허용하지 않으므로 이러한 환경을 모형화할 수 없다. 이 점에서 CIR의 "장점"이 특정 환경에서는 오히려 "한계"로 작용한다.

넷째, 변동성이 오직 $\sqrt{r}$에 비례하므로, 이자율 수준과 변동성 사이의 더 복잡한 관계(예: 확률적 변동성, 변동성 스마일)를 포착하지 못한다.

14.3 확장 방향

확장 모형	핵심 아이디어	해결하는 한계
CIR++ 모형	시간종속 이동항 $\varphi(t)$ 추가: $r(t) = x(t) + \varphi(t)$	초기 수익률곡선 적합 가능
다요인 CIR	독립 CIR 과정의 합: $r = r_1 + r_2 + \cdots$	수익률곡선의 기울기·곡률 변화 포착
Heston 모형	CIR 과정을 확률적 변동성에 적용	주식옵션의 변동성 스마일 포착
CKLS 모형	확산 $\sigma r^\gamma$에서 $\gamma$를 자유 파라미터로	변동성의 이자율 의존 정도를 데이터에서 추정

특히 Heston 모형(1993)은 CIR 과정의 가장 유명한 응용 사례이다. 주가의 변동성 $v(t)$ 자체가 CIR 과정 $dv = \kappa(\theta - v)\,dt + \sigma_v\sqrt{v}\,dW^v$를 따르도록 설정함으로써, 블랙-숄즈 모형이 설명하지 못하는 변동성 스마일을 성공적으로 포착하였다. 이처럼 CIR 과정은 이자율 모형에 국한되지 않고, 양수 확률과정이 필요한 모든 곳에서 활용되는 범용적인 수학적 도구이다.

Part 15. 연습문제

(초급) 문제 1 — 이토 공식 연습

CIR 과정 $dr = \kappa(\theta - r)\,dt + \sigma\sqrt{r}\,dW$에서 $f(r) = r^2$의 SDE를 유도하라. 이를 이용하여 $E[r(t)^2]$가 만족하는 ODE를 구하라.

(초급) 문제 2 — Feller 조건

$\kappa = 0.3$, $\theta = 0.04$, $\sigma = 0.20$일 때 Feller 조건이 만족되는지 판별하고, 자유도 $\nu$를 구하라.

(중급) 문제 3 — CIR 채권가격 PDE

CIR 모형에서 채권가격 PDE를 유도하고, 지수-아핀 가정을 대입하여 리카티 ODE를 얻는 전 과정을 상세히 전개하라.

(중급) 문제 4 — 장기 수익률

CIR 모형에서 $\tau \to \infty$일 때 수익률의 극한값을 구하고, 이것이 현재 이자율 $r(t)$에 무관함을 보여라.

(상급) 문제 5 — Vasicek과 CIR의 비교

동일한 파라미터 $\kappa, \theta, \sigma$를 사용할 때, CIR의 $C(\tau)$와 Vasicek의 $C^{\text{Vas}}(\tau) = \frac{1 - e^{-\kappa\tau}}{\kappa}$의 대소 관계를 분석하라. 즉, 모든 $\tau > 0$에 대해 $C^{\text{CIR}}(\tau) < C^{\text{Vas}}(\tau)$임을 보여라.

Part 16. 모범답안 / 해설

해설 1

$f(r) = r^2$에 이토 공식을 적용한다. $f_r = 2r$, $f_{rr} = 2$이다. CIR SDE의 드리프트는 $\kappa(\theta - r)$이고 확산은 $\sigma\sqrt{r}$이므로, 이토 공식에 의해 다음을 얻는다.

$$d(r^2) = 2r[\kappa(\theta - r)\,dt + \sigma\sqrt{r}\,dW] + \tfrac{1}{2} \cdot 2 \cdot \sigma^2 r\,dt$$ $$= [2\kappa\theta r - 2\kappa r^2 + \sigma^2 r]\,dt + 2\sigma r^{3/2}\,dW$$

양변에 기대값을 취하면(이토 적분항의 기대값은 0) $v(t) = E[r^2(t)]$, $m(t) = E[r(t)]$로 놓아 다음의 ODE를 얻는다.

$$\frac{dv}{dt} = (2\kappa\theta + \sigma^2)\,m(t) - 2\kappa\,v(t)$$

이것은 $v(t)$에 대한 1차 선형 ODE이며, $m(t) = \theta + (r(0) - \theta)e^{-\kappa t}$는 이미 알고 있으므로 적분인수법으로 풀 수 있다.

해설 2

$2\kappa\theta = 2 \times 0.3 \times 0.04 = 0.024$이고 $\sigma^2 = 0.04$이므로, $0.024 < 0.04$이다. 따라서 Feller 조건이 위반된다. 자유도는 $\nu = 4\kappa\theta/\sigma^2 = 4 \times 0.3 \times 0.04 / 0.04 = 1.2$이다. $\nu < 2$이므로 이자율이 0에 도달할 수 있다(그러나 음수가 되지는 않는다). 기하학적으로, 이것은 1.2차원 공간에서의 거리의 제곱에 해당하며, 2차원 미만에서는 원점 도달이 가능하다.

해설 3

이토 공식에 의해 $dB = (B_t + \kappa(\theta-r)B_r + \frac{1}{2}\sigma^2 r B_{rr})\,dt + \sigma\sqrt{r}B_r\,dW^Q$이다. 마팅게일 조건(할인된 채권가격의 드리프트 = 0)에 의해 $B_t + \kappa(\theta-r)B_r + \frac{1}{2}\sigma^2 r B_{rr} = rB$를 얻는다. 지수-아핀 가정 $B = e^{-A-Cr}$를 대입하면 $B_t = B(A' + C'r)$, $B_r = -CB$, $B_{rr} = C^2 B$이다. PDE에 대입하고 $B$로 나눈 후, $r$의 계수와 상수항을 분리하면 Part 10.2의 리카티 ODE를 얻는다. 상세 과정은 Part 10.2를 참조한다.

해설 4

$y(t,T) = A(\tau)/\tau + C(\tau)/\tau \cdot r(t)$에서 $\tau \to \infty$를 고려한다. $C(\tau) \to 2/(\gamma + \kappa)$이므로 $C(\tau)/\tau \to 0$이다. 따라서 $r(t)$에 의존하는 항이 사라진다. $A(\tau)/\tau$의 극한을 구하기 위해 로피탈 법칙 또는 $A(\tau)$의 점근 전개를 사용하면 $\lim A(\tau)/\tau = \frac{2\kappa\theta}{\sigma^2} \cdot \frac{\gamma - \kappa}{2} = \frac{\kappa\theta(\gamma - \kappa)}{\sigma^2}$를 얻는다. 이를 정리하면 $y_\infty = \frac{2\kappa\theta}{\kappa + \gamma}$이며, 이는 $r(t)$에 무관하다. 물리적으로, 평균회귀에 의해 충분히 먼 미래에는 현재의 이자율 수준에 대한 "기억"이 완전히 사라지기 때문이다.

해설 5

Vasicek에서는 리카티 ODE가 $C' = 1 - \kappa C$(비선형 항 없음)이고, CIR에서는 $C' = 1 - \kappa C - \frac{1}{2}\sigma^2 C^2$이다. CIR의 ODE에는 $-\frac{1}{2}\sigma^2 C^2 < 0$ 항이 추가되어 있으므로, 동일한 초기조건 $C(0) = 0$에서 출발할 때 CIR의 $C'(\tau)$는 Vasicek의 $C'(\tau)$보다 항상 작거나 같다. 미분방정식의 비교정리(comparison theorem)에 의해 $C^{\text{CIR}}(\tau) \le C^{\text{Vas}}(\tau)$이 모든 $\tau > 0$에서 성립하며, $\sigma > 0$인 한 부등식은 순수(strict)이다. 직관적으로, CIR에서 변동성의 볼록성 효과($\frac{1}{2}\sigma^2 C^2$ 항)가 할인채의 이자율 감응도를 줄이는 것이다. 장기에서 Vasicek의 $C^{\text{Vas}}(\infty) = 1/\kappa$이지만 CIR의 $C^{\text{CIR}}(\infty) = 2/(\gamma + \kappa) < 2/(2\kappa) = 1/\kappa$($\gamma > \kappa$이므로)로 확인할 수 있다.

핵심 공식 요약

항목	공식
CIR SDE	$dr = \kappa(\theta - r)\,dt + \sigma\sqrt{r}\,dW^Q$
Feller 조건	$2\kappa\theta \ge \sigma^2$
기대값	$E[r(t)] = \theta + (r(0) - \theta)e^{-\kappa t}$
정상분산	$\text{Var}[r(\infty)] = \frac{\theta\sigma^2}{2\kappa}$
전이분포	$r(T)\|r(t) \sim \frac{1}{c}\chi^2_\nu(\lambda)$
보조변수 $\gamma$	$\gamma = \sqrt{\kappa^2 + 2\sigma^2}$
$C(\tau)$	$\dfrac{2(e^{\gamma\tau} - 1)}{(\gamma + \kappa)(e^{\gamma\tau} - 1) + 2\gamma}$
$A(\tau)$	$\dfrac{2\kappa\theta}{\sigma^2}\ln\!\left[\dfrac{2\gamma\,e^{(\kappa+\gamma)\tau/2}}{(\gamma+\kappa)(e^{\gamma\tau}-1)+2\gamma}\right]$
할인채 가격	$B(t,T) = \exp(-A(\tau) - C(\tau)\,r(t))$
수익률	$y(t,T) = \frac{A(\tau)}{\tau} + \frac{C(\tau)}{\tau}\,r(t)$
선도이자율	$f(t,T) = A'(\tau) + C'(\tau)\,r(t)$
할인채 SDE	$\frac{dB}{B} = r\,dt - C(\tau)\sigma\sqrt{r}\,dW^Q$
장기 수익률	$y_\infty = \frac{2\kappa\theta}{\kappa + \gamma}$
자유도	$\nu = \frac{4\kappa\theta}{\sigma^2}$
비중심모수	$\lambda = c\,r(t)\,e^{-\kappa\tau}$, $c = \frac{4\kappa}{\sigma^2(1-e^{-\kappa\tau})}$

'Financial Engineering > 이자율 모형' 카테고리의 다른 글

Ho–Lee 이자율 모형 (0)	2026.02.11
Hull–White 1요인 이자율 모형 (0)	2026.02.11
Vasicek 이자율 모형 (0)	2026.02.11
Merton 이자율 모형 (0)	2026.02.11
채권가격의 PDE와 위험중립측도 (0)	2026.02.11

곱	결과	이유
\((dt)^2\)	\(0\)	\(dt\)보다 훨씬 작은 고차항
\(dt \cdot dW\)	\(0\)	\((dt)^{3/2}\) 크기이므로 무시 가능
\((dW)^2\)	\(dt\)	이차변동에 의해 상수 \(dt\)로 수렴

항목	공식
CIR SDE	\(dr = \kappa(\theta - r)\,dt + \sigma\sqrt{r}\,dW^Q\)
Feller 조건	\(2\kappa\theta \ge \sigma^2\)
기대값	\(E[r(t)] = \theta + (r(0) - \theta)e^{-\kappa t}\)
정상분산	\(\text{Var}[r(\infty)] = \frac{\theta\sigma^2}{2\kappa}\)
전이분포	\(r(T)\|r(t) \sim \frac{1}{c}\chi^2_\nu(\lambda)\)
보조변수 \(\gamma\)	\(\gamma = \sqrt{\kappa^2 + 2\sigma^2}\)
\(C(\tau)\)	\(\dfrac{2(e^{\gamma\tau} - 1)}{(\gamma + \kappa)(e^{\gamma\tau} - 1) + 2\gamma}\)
\(A(\tau)\)	\(\dfrac{2\kappa\theta}{\sigma^2}\ln\!\left[\dfrac{2\gamma\,e^{(\kappa+\gamma)\tau/2}}{(\gamma+\kappa)(e^{\gamma\tau}-1)+2\gamma}\right]\)
할인채 가격	\(B(t,T) = \exp(-A(\tau) - C(\tau)\,r(t))\)
수익률	\(y(t,T) = \frac{A(\tau)}{\tau} + \frac{C(\tau)}{\tau}\,r(t)\)
선도이자율	\(f(t,T) = A'(\tau) + C'(\tau)\,r(t)\)
할인채 SDE	\(\frac{dB}{B} = r\,dt - C(\tau)\sigma\sqrt{r}\,dW^Q\)
장기 수익률	\(y_\infty = \frac{2\kappa\theta}{\kappa + \gamma}\)
자유도	\(\nu = \frac{4\kappa\theta}{\sigma^2}\)
비중심모수	\(\lambda = c\,r(t)\,e^{-\kappa\tau}\), \(c = \frac{4\kappa}{\sigma^2(1-e^{-\kappa\tau})}\)

모형	SDE	평균회귀	비음수	수준의존 변동성	초기곡선 적합
Merton (1973)	\(dR = \alpha\,du + \beta\,dW\)	없음	불가	없음	불가
Vasicek (1977)	\(dR = \kappa(\theta-R)dt + \sigma\,dW\)	있음	불가	없음	불가
Ho–Lee (1986)	\(dR = \alpha(u)\,du + \beta\,dW^Q\)	없음	불가	없음	가능
CIR (1985)	\(dr = \kappa(\theta-r)dt + \sigma\sqrt{r}\,dW\)	있음	가능	있음	불가
Hull–White (1990)	\(dR = (a(u)-b(u)R)du + \beta(u)\,dW^Q\)	있음	불가	없음	가능

\(r(0)\) vs \(y_\infty\)	수익률곡선 형태	직관적 설명
\(r(0) < y_\infty\)	단조증가 (우상향, Normal)	이자율 상승 기대
\(r(0) > y_\infty\)	단조감소 (우하향, Inverted)	이자율 하락 기대
\(r(0) = y_\infty\)	거의 수평 (Flat)	현재 수준이 장기 균형에 근접
특정 범위	낙타등형 (Humped)	단기 상승 후 장기 하락

파라미터	값	설명
\(\kappa\)	0.5	평균회귀 속도 (반감기 ≈ 1.4년)
\(\theta\)	0.05 (5%)	장기 평균 이자율
\(\sigma\)	0.10	변동성 파라미터
\(r(0)\)	0.03 (3%)	초기 이자율 (장기 평균보다 낮음)

확장 모형	핵심 아이디어	해결하는 한계
CIR++ 모형	시간종속 이동항 \(\varphi(t)\) 추가: \(r(t) = x(t) + \varphi(t)\)	초기 수익률곡선 적합 가능
다요인 CIR	독립 CIR 과정의 합: \(r = r_1 + r_2 + \cdots\)	수익률곡선의 기울기·곡률 변화 포착
Heston 모형	CIR 과정을 확률적 변동성에 적용	주식옵션의 변동성 스마일 포착
CKLS 모형	확산 \(\sigma r^\gamma\)에서 \(\gamma\)를 자유 파라미터로	변동성의 이자율 의존 정도를 데이터에서 추정

CIR 이자율 모형

CIR(Cox–Ingersoll–Ross) 이자율 모형

Part 1. 확률미분방정식(SDE) 기초

1.1 브라운 운동(Brownian Motion)

1.1.1 역사적 배경

1.1.2 수학적 정의

브라운 운동의 네 가지 성질

1.1.3 미분 형태 \(dW\)의 직관적 이해

1.2 이차변동과 이토 곱셈 규칙

1.2.1 이차변동(Quadratic Variation)

이차변동이 \(T\)로 수렴하는 증명

1.2.2 이토 곱셈 규칙

1.3 확률미분방정식의 일반적 형태

Part 2. 이토 공식(Itô's Lemma)

2.1 왜 이토 공식이 필요한가?

2.2 이토 공식의 유도

Step 1: 테일러 전개

Step 2: 각 항의 크기 분석

Step 3: \((dX)^2\)의 명시적 계산

2.3 이토 공식의 최종형

2.4 예제: 기하 브라운 운동에 이토 공식 적용

Part 3. 이토 적분과 이토 등거리성(Itô Isometry)

3.1 이토 적분의 정의

3.2 이토 적분의 핵심 성질

성질 1: 기대값이 0 (마팅게일 성질)

성질 2: 이토 등거리성(Itô Isometry)

3.3 이토 등거리성 증명

증명

3.4 결정론적 \(f\)일 때의 정규분포 성질

Part 4. 위험중립측도와 채권 가격결정

4.1 현실측도 vs 위험중립측도

4.2 기라노프 정리(Girsanov Theorem)

4.3 할인채의 위험중립 가격결정

Part 5. Ornstein–Uhlenbeck 과정과 Vasicek 모형

5.1 OU 과정의 SDE와 해

적분인수법에 의한 해의 유도

증명: OU 과정의 닫힌형 해

5.2 OU 과정의 모멘트

기대값과 분산

5.3 Vasicek 모형의 한계와 CIR로의 동기

Part 6. 기존 모형 흐름: Merton → Vasicek → CIR

Part 7. CIR 모형의 정의

7.1 확률미분방정식

확산 항 \(\sigma\sqrt{r}\)의 두 가지 핵심 효과

Part 8. CIR 과정의 해와 제곱합 구성

8.1 CIR SDE의 해의 존재성

8.2 제곱합 구성(Sum of Squares Construction)

제곱합이 CIR SDE를 만족하는 증명

8.3 비음수성과 Feller 조건

정리: CIR 과정의 비음수성

Feller 조건의 실무적 점검

Part 9. CIR 과정의 모멘트와 전이분포

9.1 기대값

기대값의 유도

9.2 분산

분산의 유도

9.3 전이분포: 비중심 카이제곱분포

정리: CIR 전이분포

비중심 카이제곱분포의 기본 성질

9.4 시뮬레이션

방법 1: 오일러-마루야마 이산화

방법 2: 정확 시뮬레이션 (비중심 카이제곱 샘플링)

Part 10. 할인채 가격의 닫힌형

10.1 채권가격 PDE의 유도

10.2 지수-아핀 가정과 리카티 ODE

리카티 ODE의 유도 과정

10.3 리카티 ODE의 풀이

\(C(\tau)\)의 닫힌형 해 유도

\(A(\tau)\)의 닫힌형 해 유도

10.4 CIR 할인채 가격의 최종형

10.5 \(C(\tau)\)의 점근 분석

Part 11. 수익률곡선과 선도이자율

11.1 수익률(Yield)

11.2 장기 수익률의 극한

11.3 선도이자율(Forward Rate)

11.4 수익률곡선의 형태

Part 12. 수치 예제

12.1 모형 설정

12.2 Feller 조건 확인 및 주요 파라미터

12.3 채권가격 계산 예시 (\(\tau = 5\)년)