Chapter 5. 로컬 변동성과 내재변동성
Local Volatility and Implied Volatility — 시장이 요구하는 순간변동성의 구조
목표: 시장이 제공하는 유럽형 옵션의 내재변동성(Implied Volatility, IV) 표면을 출발점으로 삼아, 그 표면을 이론적으로 정확히 재현하는 1차원 확산 모형의 로컬 변동성(Local Volatility) \(\sigma_{\text{loc}}(S,t)\)를 완전히 이해하고 유도한다. 이 과정에서 확률과정론, Ito 해석학, 위험중립 가격결정, Fokker–Planck 방정식, Breeden–Litzenberger 공식, Dupire 공식을 단계별로 상세히 전개하며, FX 시장의 실무 관행(델타 인용, 스트라이크 변환, 로그 모니니스)과 수치 구현의 함정까지 포괄한다.
0. 이 장을 읽기 전에 반드시 알아야 할 배경지식
이 장의 핵심 질문은 다음과 같다: "시장에서 관찰되는 수많은 옵션 가격들이 암시하는 변동성 구조를 하나의 일관된 확산 모형으로 표현할 수 있는가? 그렇다면 그 모형의 계수(로컬 변동성)를 시장 데이터로부터 직접 역산하는 공식은 무엇인가?"
이에 대한 Dupire(1994)와 Derman–Kani(1994)의 답은 "가능하다"였다. 그들이 제시한 방법은, 무차익 조건을 만족하는 유럽형 옵션 가격표면이 주어지면, 그 표면을 생성하는 유일한 1차원 마르코프 확산의 로컬 변동성 함수를 분석적으로 구성할 수 있다는 것이다. 이 결과는 금융공학 역사에서 가장 실용적인 성과 중 하나로 꼽힌다.
0.1 확률과정과 브라운 운동: "랜덤하게 움직인다"를 수학으로 쓰는 법
금융에서 "가격이 랜덤하게 움직인다"는 직관을 수학적으로 정확하게 표현하기 위해서는 연속시간에서 정의된 랜덤한 함수, 즉 확률과정(stochastic process)이 필요하다. 그 가장 기본적인 모델이 브라운 운동(Brownian motion) 또는 위너 과정(Wiener process) \(W_t\)이다.
브라운 운동은 다음 네 가지 공리(axiomatic definition)로 정의된다:
- (W1) 초기값: \(W_0 = 0\) (항상 0에서 출발한다)
- (W2) 독립 증분: 서로 겹치지 않는 시간 구간 \([s_1, t_1]\)과 \([s_2, t_2]\)에서의 증분 \(W_{t_1}-W_{s_1}\)과 \(W_{t_2}-W_{s_2}\)는 서로 독립이다. 이는 "과거가 미래에 영향을 주지 않는다"는 마르코프성(Markov property)의 강한 형태다.
- (W3) 정규 증분: 임의의 \(0 \le s < t\)에 대해 \(W_t - W_s \sim \mathcal{N}(0, t-s)\). 즉 증분은 평균이 0이고 분산이 시간 간격에 비례하는 정규분포를 따른다.
- (W4) 연속 경로: \(t \mapsto W_t\)는 확률 1로 연속 함수다. 즉 점프(갑작스러운 불연속)가 없다.
이 정의에서 가장 중요한 것은 (W3)이다. \(W_t - W_s\)의 분산이 \(t-s\)라는 것은, 짧은 구간에서의 "불확실성의 크기"가 \(\sqrt{t-s}\)에 비례함을 의미한다. 이것이 연속시간 변동성 이론 전체의 뿌리다.
왜 정규분포인가? 중심극한정리(Central Limit Theorem)에 의해, 매우 많은 작은 독립적 충격들의 합은 정규분포로 수렴한다. 금융 가격 변화를 "수많은 작은 정보의 합"으로 보면, 정규분포 가정은 자연스럽다. 물론 실제 금융 수익률은 두터운 꼬리(fat tails)를 보이므로 이 가정은 근사일 뿐이지만, 이론적 토대로서 매우 강력하다.
기호 상의 관례: \(dW_t\)는 "극히 짧은 시간 \(dt\) 동안의 브라운 운동 증분"을 의미한다. 엄밀하게는 확률미분(stochastic differential)으로 정의되지만, 직관적으로는 \(dW_t \sim \mathcal{N}(0, dt)\)로 이해하면 된다. 즉, \(dW_t \approx \sqrt{dt} \cdot \varepsilon\), \(\varepsilon \sim \mathcal{N}(0,1)\)이다.
자산 가격 \(S_t\)의 연속적 변동을 수식으로 표현하는 가장 일반적인 틀은 다음과 같은 확률미분방정식(SDE)이다:
$$dS_t = \mu(t, S_t)\,dt + \sigma(t, S_t)\,S_t\,dW_t$$각 항의 의미를 정확하게 이해해야 한다.
\(\mu(t, S_t)\,dt\) — 드리프트 항(drift term): 짧은 시간 \(dt\) 동안 가격이 "평균적으로" 얼마나 변하는지를 나타낸다. 결정론적(deterministic)인 항으로, 예측 가능한 부분이다. 위험중립 측도 \(\mathbb{Q}\) 하에서 FX 스팟의 드리프트는 \((r_d - r_f)S_t\)가 된다. 여기서 \(r_d\)는 국내 무위험이자율, \(r_f\)는 해외(외화) 무위험이자율이다.
\(\sigma(t, S_t)\,S_t\,dW_t\) — 확산 항(diffusion term): 짧은 시간 \(dt\) 동안 가격이 "랜덤하게" 흔들리는 부분이다. \(\sigma(t, S_t)\)를 순간 변동성(instantaneous volatility)이라 부른다. 이 계수의 제곱 \(\sigma^2\)은 단위 시간당 분산의 기여율을 결정한다. 즉, \(dt\)간격에서 \(S_t\)의 조건부 분산은 대략 \(\sigma^2(t, S_t) S_t^2 \,dt\)이다.
왜 \(S_t\)를 곱하는가? \(\sigma(t, S_t) S_t\)처럼 현재 가격에 비례하는 형태로 확산 항을 쓰면, 로그수익률 \(d\ln S_t\)의 변동성이 \(\sigma(t, S_t)\)가 된다. 이는 "수익률"이 레벨에 무관하게 일정한 불확실성을 갖는다는 경제적으로 자연스러운 가정이다. (즉, 주가가 100원이든 10,000원이든, 1%의 변동은 동등한 불확실성을 가진다는 뜻이다.)
가장 단순한 형태인 블랙-숄즈(Black-Scholes) 모형은 \(\sigma(t, S_t) = \sigma\) (상수)를 가정한다. 로컬 변동성 모형은 이를 \(\sigma_{\text{loc}}(t, S_t)\)로 일반화하여, 변동성이 시간과 가격 수준에 따라 달라질 수 있도록 한다. 이 일반화가 바로 스마일/스큐 현상을 1차원 마르코프 확산으로 흡수하는 핵심이다.
0.2 Ito 보정: 왜 연속시간에서 미적분이 달라지는가
일반 미적분(deterministic calculus)에서는 함수 \(f(x)\)의 미분을 연쇄법칙으로 \(df = f'(x)\,dx\)로 쓴다. 그러나 확률과정에서는 이 공식이 수정되어야 한다. 이유를 직관적으로 이해하는 것이 Ito 해석학의 출발점이다.
왜 수정이 필요한가? 브라운 운동 \(W_t\)는 너무 불규칙해서 무한 변동(infinite variation)을 가진다. 수학적으로 \(dW_t\)는 "\(\sqrt{dt}\)" 규모인데, 이를 제곱하면 \((dW_t)^2 = dt\) 규모가 된다. 즉, 아주 짧은 시간에도 브라운 운동의 이차 변동(quadratic variation)은 유한하고 무시할 수 없다. 반면 보통 함수에서는 \((dx)^2\)이 \(dt\)보다 훨씬 작은 \((dt)^2\) 규모라 무시한다.
이 특성 때문에, 확률과정의 함수를 테일러 전개할 때 2차 항이 살아남는다. 이것이 Ito 보정항(Ito correction term)이다.
이 세 규칙이 Ito 계산 전체의 기초다. 첫 번째 규칙이 모든 보정항의 근원이다.
\(dS_t = a_t\,dt + b_t\,dW_t\)라 하자. 부드러운 함수 \(f(S)\)에 대해 \(f(S_t)\)의 미분을 테일러 전개한다.
일반 미적분이라면 \((dS_t)^2 \sim (dt)^2\)이라 무시하겠지만, 확률과정에서는 다르다.
Ito의 곱 규칙을 적용한다: \((dt)^2 = 0\), \(dt \cdot dW_t = 0\), \((dW_t)^2 = dt\)이므로:
$$(dS_t)^2 = b_t^2\,dt$$이것이 핵심이다. \((dS_t)^2\)이 \(dt\) 규모로 살아남는다!
왼쪽 괄호 안이 결정론적 드리프트이고, 오른쪽이 랜덤 항이다. 두 번째 미분 항 \(\frac{1}{2}b_t^2 f''(S_t)\)이 바로 Ito 보정항이다.
로그 가격에의 적용 — 가장 중요한 예시: \(f(S) = \ln S\)로 놓으면, \(f'(S) = 1/S\), \(f'' (S) = -1/S^2\)이므로:
$$d\ln S_t = \frac{dS_t}{S_t} - \frac{1}{2}\sigma^2(t, S_t)\,dt$$이것이 금융에서 로그수익률의 드리프트가 \(\mu - \frac{1}{2}\sigma^2\)이 되는 수학적 이유다. \(-\frac{1}{2}\sigma^2\)이 바로 Ito 보정이다. 직관적으로는 "분산이 있으면 기하평균이 산술평균보다 작아지는 Jensen의 불등식 효과"이다.
0.3 위험중립 측도(Risk-Neutral Measure)와 옵션 가격의 기본 원리
금융에서 확률은 두 가지 "버전"이 공존한다. 이 두 버전을 혼동하는 것이 초심자의 가장 흔한 실수다.
현실 측도 \(\mathbb{P}\) (Physical/Real-world measure): 우리가 실제로 관찰하는 세계의 확률이다. 주가의 드리프트는 기대수익률 \(\mu\)이며, 이는 위험 프리미엄(risk premium)을 포함한다. 즉, 위험을 감수한 대가로 기대되는 초과수익이 \(\mu - r\)이다. 그러나 \(\mu\)는 추정하기 어렵고, 투자자마다 다를 수 있다.
위험중립 측도 \(\mathbb{Q}\) (Risk-neutral/Pricing measure): 파생상품 가격결정을 위해 인위적으로 구성된 수학적 확률이다. 이 측도 하에서는 모든 자산의 할인된 가격이 마팅게일(martingale), 즉 기대 성장률이 0이 된다. 다르게 말하면, 위험중립 세계에서는 모든 자산의 기대수익률이 무위험이자율 \(r\)과 같다.
왜 \(\mathbb{Q}\)를 쓰는가? 무차익(arbitrage-free) 조건 하에서 Girsanov 정리에 의해, \(\mathbb{P}\)에서 \(\mathbb{Q}\)로의 확률 변환이 항상 존재한다. 이 변환 하에서 드리프트 \(\mu\)가 \(r\)로 대체된다. 그 결과 파생상품 가격이 투자자의 위험 선호나 기대수익률 추정에 무관하게 결정되는 "객관적인" 가격 체계가 만들어진다.
이 공식의 의미를 분해하면:
- \(\text{Payoff}(S_T)\): 만기 \(T\)에서 자산 가격 \(S_T\)에 따라 결정되는 지급액
- \(e^{-\int_0^T r_d(u)\,du}\): 국내 무위험이자율로의 할인 인자(discount factor)
- \(\mathbb{E}^{\mathbb{Q}}[\cdot]\): 위험중립 측도 \(\mathbb{Q}\) 하에서의 기대값
즉, 파생상품의 현재 가치는 "위험중립 세계에서 만기 페이오프의 현재가치 기대값"이다.
FX에서의 위험중립 드리프트: 외환시장에서 스팟 환율 \(S_t\) (단위: 단위 외화당 국내화 금액)는 위험중립 측도 하에서:
$$dS_t = (r_d - r_f)S_t\,dt + \sigma_{\text{loc}}(S_t, t)\,S_t\,dW_t$$드리프트가 \(r_d - r_f\)인 이유: 직관적으로 외화 보유는 외화이자율 \(r_f\)의 "배당"을 지급하는 자산으로 취급한다. 따라서 무차익 균형에서 스팟의 자본이득(capital gain)은 두 이자율의 차이 \(r_d - r_f\)가 되어야 한다. 이것은 이자율 평형이론(Interest Rate Parity)의 연속시간 버전이기도 하다.
0.4 내재변동성(Implied Volatility)이란 정확히 무엇인가: 시장과 모형의 연결 고리
블랙-숄즈 공식 \(C_{\text{BS}}(S, K, T, r, \sigma)\)는 상수 변동성 \(\sigma\)를 가정한다. 시장에서 관찰된 옵션 가격 \(C_{\text{mkt}}(K, T)\)가 주어졌을 때, 다음 방정식을 \(\sigma\)에 대해 역으로 푼 해를 내재변동성이라 한다:
$$C_{\text{BS}}(S_0, K, T, r_d, r_f, \sigma_{\text{imp}}) = C_{\text{mkt}}(K, T)$$이 역산은 수치적으로(예: Newton-Raphson) 수행하며, 유럽형 콜 가격이 \(\sigma\)에 대해 순증가(베가 \(> 0\))이므로 항상 유일한 해가 존재한다(무차익 조건 만족 시).
내재변동성의 경제적 의미: \(\sigma_{\text{imp}}(K, T)\)는 단순히 "이 옵션이 블랙-숄즈 공식과 일치하려면 변동성이 얼마여야 하는가"에 대한 답이다. 이것은 구간 \([0, T]\) 전체에 걸친 실현변동성의 기대값(기술적으로는 분산의 시간평균의 제곱근)과 관련이 있지만, 리스크 프리미엄, 투자자 공포심, 시장 수급 등 여러 요소가 뒤섞인 숫자다.
결정적인 한계: \(\sigma_{\text{imp}}(K, T)\)는 행사가격 \(K\)와 만기 \(T\)에 따라 달라진다. 같은 기초자산, 같은 만기임에도 \(K\)가 다르면 서로 다른 내재변동성이 나온다. 이것이 변동성 스마일(smile) 또는 스큐(skew) 현상이다. 이 현상은 블랙-숄즈의 상수 변동성 가정이 현실과 맞지 않음을 직접적으로 보여준다. 로컬 변동성 이론은 바로 이 불일치를 메우기 위해 개발되었다.
초심자가 가장 많이 혼동하는 부분은 두 변동성 개념의 "좌표(coordinate)"가 다르다는 점이다.
내재변동성 \(\sigma_{\text{imp}}(K, T)\)의 좌표: \(K\)는 "계약에 명시된 행사가격(strike price)"이고, \(T\)는 "만기(expiry date)"다. 이 두 값은 옵션 계약에 처음부터 고정된 숫자들이다. 스팟 \(S_0\)가 어떻게 변하든, 이미 발행된 옵션의 \(K\)와 \(T\)는 변하지 않는다.
로컬 변동성 \(\sigma_{\text{loc}}(S, t)\)의 좌표: \(S\)는 "기초자산의 현재 가격 레벨"이고, \(t\)는 "현재 시각"이다. 이 두 값은 시간이 흐르면서 계속 변하는 상태(state)다. 로컬볼은 "지금 이 순간, 가격이 \(S\)인 상태에서 다음 순간의 확산 크기가 얼마인가"를 말한다.
이 차이가 중요한 이유: 내재변동성 표면은 "오늘 시점에서 본 시장의 스냅샷"이지만, 로컬볼은 "미래 어떤 시점에 어떤 가격 수준에 도달했을 때의 동학"을 기술한다. 전자는 현재 observable한 숫자들의 집합이고, 후자는 모형이 부여하는 "미래의 함수"다.
0.5 변동성 스마일/스큐의 관찰과 경제적 의미
1973년 블랙-숄즈 모형이 발표된 직후에는 모든 만기와 행사가격에서 내재변동성이 거의 일정하다고 관찰되었다. 그러나 1987년 10월 "블랙 먼데이(Black Monday)" 주가 대폭락 이후 시장의 구조가 바뀌었다.
스큐(Skew)의 정의: 같은 만기 내에서, 낮은 행사가격(OTM 풋, 하방보호 수요)의 내재변동성이 높은 행사가격(OTM 콜)보다 체계적으로 높은 현상을 "네거티브 스큐(negative skew)" 또는 단순히 "스큐"라 한다. 주식 지수 옵션에서 전형적으로 관찰된다.
스마일(Smile)의 정의: ATM(등가격, at-the-money) 대비 깊은 OTM(외가격) 옵션과 깊은 ITM(내가격) 옵션 모두에서 내재변동성이 높아지는 U자형 패턴을 "변동성 스마일"이라 한다. 통화(FX) 옵션에서 전형적으로 관찰된다.
경제적 해석: 스큐는 시장 참여자들이 급격한 하락(crash)에 대한 위험을 특별히 비싸게 평가한다는 것을 반영한다. 다시 말해, 낮은 행사가 풋옵션은 "재난 보험(disaster insurance)"으로 기능하며, 그 프리미엄이 단순 블랙-숄즈가 예측하는 수준보다 높다.
모형 측면에서의 해석: 스마일/스큐는 실제 \(S_T\)의 분포가 대수정규분포(블랙-숄즈 가정)와 다르다는 것을 의미한다. 구체적으로: (1) 꼬리가 더 두껍다(fat tails) — 이것이 양 끝에서 IV가 높아지는 스마일을 만들고, (2) 분포가 비대칭이다(negatively skewed) — 이것이 좌측에서 IV가 더 높은 스큐를 만든다.
1. 왜 단일 블랙-숄즈 변동성은 시장 전체를 설명하지 못하는가
1.1 만기 구조(Term Structure)와 스마일: 두 가지 독립적인 문제
블랙-숄즈 모형의 핵심 가정은 "변동성이 상수"라는 것이다. 이 가정이 현실과 어떻게 다른지를 정확하게 이해하려면, 두 가지 독립적인 방향의 변화를 분리해서 생각해야 한다.
첫 번째 차원: 만기에 따른 IV 변화(Term Structure)
같은 행사가격(예: ATM)에서도 만기가 1개월인 옵션과 1년인 옵션의 내재변동성이 다르다. 이것은 "단기 변동성"과 "장기 변동성"이 다르다는 것을 의미하며, 현실에서 흔히 관찰된다. 예를 들어, 시장 위기 시에는 단기 변동성이 폭등하지만 장기 변동성은 상대적으로 안정적인 경향이 있다.
두 번째 차원: 행사가격에 따른 IV 변화(Smile/Skew)
같은 만기라도 행사가격 \(K\)에 따라 내재변동성이 다르다. 이것은 미래 자산 가격의 분포가 블랙-숄즈가 가정하는 대수정규분포와 다르다는 직접적인 증거다.
단일 상수 \(\sigma\)는 이 두 차원 모두에서 실패한다. 로컬 변동성 \(\sigma_{\text{loc}}(S, t)\)는 시간(\(t\)) 의존성과 상태(\(S\)) 의존성을 동시에 갖춤으로써 두 문제를 동시에 해결하는 가장 일반적인 1차원 마르코프 모형이다.
1.2 만기 구조 문제: "구간 변동성(Forward Volatility)"의 개념
먼저 만기 구조 문제만 있고 스마일이 없는 경우를 생각해 보자. 이때는 로컬볼이 \(S\)에 의존하지 않고 시간 \(t\)에만 의존하는 함수 \(\sigma_t\)로 충분하다. 이 경우를 상세히 이해하면 더 일반적인 경우로의 확장이 자연스러워진다.
위험중립 하에서 가격 과정이 \(dS_t = r S_t\,dt + \sigma_t S_t\,dW_t\)를 따른다고 하자. (단순화를 위해 \(r_d = r_f = r\)로 쓴다.)
Ito의 공식으로 \(X_t = \ln S_t\)를 전개하면:
$$dX_t = \left(r - \frac{1}{2}\sigma_t^2\right)dt + \sigma_t\,dW_t$$따라서 \(X_T - X_0 = \ln(S_T/S_0)\)의 분산은:
$$\text{Var}[X_T - X_0] = \int_0^T \sigma_t^2\,dt$$이 적분이 "누적 분산(cumulative variance)"이다. 분산은 독립 증분의 기여가 단순히 더해지므로 가법적(additive)이다.
블랙-숄즈 공식에서 상수 변동성 \(\sigma_{\text{imp}}\)를 사용할 경우, 만기 \(T\)의 콜 옵션 가격을 맞추려면 분산이 일치해야 한다:
$$\sigma_{\text{imp}}^2(T) \cdot T = \int_0^T \sigma_t^2\,dt$$이것은 구간 \([0, T]\)에 걸친 순간변동성 제곱의 "시간평균의 제곱근(Root Mean Square, RMS)"이다.
두 만기 \(T_1 < T_2\)의 내재변동성 \(\sigma_1 = \sigma_{\text{imp}}(T_1)\), \(\sigma_2 = \sigma_{\text{imp}}(T_2)\)가 알려져 있다면:
누적 분산: \(\sigma_1^2 T_1 = \int_0^{T_1}\sigma_t^2\,dt\), \(\sigma_2^2 T_2 = \int_0^{T_2}\sigma_t^2\,dt\)
구간 \([T_1, T_2]\)의 누적 분산은 차이로 계산된다:
$$\int_{T_1}^{T_2}\sigma_t^2\,dt = \sigma_2^2 T_2 - \sigma_1^2 T_1$$물리적 해석: 이 공식은 "분산은 가법적"이라는 원리의 직접적인 표현이다. 누적 분산 = 시간 × (IV)² 관계로부터, 두 만기의 누적 분산의 차이를 구간 길이로 나누면 그 구간의 "평균 순간 분산(RMS²)"이 나온다.
무차익 조건: \(\sigma_{\text{fwd}}^2 \geq 0\)이어야 하므로, \(T_2\sigma_2^2 \geq T_1\sigma_1^2\)가 성립해야 한다. 즉, 누적 분산은 만기에 대해 단조 증가해야 한다. 이것이 만기 구조의 기본 무차익 조건이다.
비전문가들이 흔히 저지르는 실수는 두 만기의 IV를 선형 보간하는 것이다. 예를 들어 6M IV = 20%, 1Y IV = 24%라면 9M IV를 22%로 추정하는 방식이다. 이것은 잘못된 방법이다.
올바른 보간은 분산(variance) 공간에서 선형으로 해야 한다. 분산은 가법적이지만 변동성(표준편차)은 그렇지 않기 때문이다. 6M 누적 분산 = 0.5 × 0.20² = 0.02, 1Y 누적 분산 = 1 × 0.24² = 0.0576. 9M(= 0.75년) 누적 분산 = 0.5 × (0.02 + 0.0576) = 0.03880(선형 보간). 따라서 9M IV = \(\sqrt{0.03880/0.75} \approx 22.7\%\)이며, 22%와 다르다. 이 차이가 구조화 상품에서 상당한 가격 오차를 야기할 수 있다.
1.3 스마일 문제: 왜 상태 의존성이 불가피한가
만기 구조 문제는 \(\sigma_t\)로 해결된다는 것을 보았다. 이제 같은 만기에서 \(K\)에 따라 IV가 변하는 스마일 문제를 살펴보자.
Breeden-Litzenberger 공식(5.2절에서 상세히 다룬다)에 의해, 내재변동성 표면이 있으면 미래 자산 가격의 위험중립 분포를 역산할 수 있다. 이 역산된 분포를 "시장 내재 분포(risk-neutral distribution implied by the market)"라 한다.
스마일이 없는(플랫한) IV 표면은 대수정규분포에 대응한다. 반면 스마일/스큐가 있는 IV 표면은 대수정규분포와 다른 분포, 즉 더 두꺼운 꼬리, 또는 비대칭적인 분포에 대응한다.
핵심 질문: 이 "비대수정규" 분포를 연속시간 1차원 확산(\(dS = \text{drift}\cdot dt + \sigma(S,t)S\,dW\))으로 모형화할 수 있는가? Dupire의 답은 "가능하다"이며, 그 \(\sigma\)가 로컬 변동성이다. 단, 이때 \(\sigma\)는 상수가 아니라 \(S\)와 \(t\)에 의존해야 한다.
직관: 낮은 주가 수준에서 변동성이 높고 높은 주가 수준에서 변동성이 낮다면(\(\sigma_{\text{loc}}(S) \text{ decreasing in }S\)), 저주가 구역에서 분포가 더 넓게 퍼지고 고주가 구역에서 좁게 퍼진다. 이 비대칭적 확산이 바로 음의 스큐를 만들어낸다. 로컬 변동성은 이 직관을 수학적으로 정확하게 실현하는 함수다.
2. Fokker–Planck 방정식: 확률 분포가 시간에 따라 어떻게 변하는가
2.1 Forward PDE vs Backward PDE: 시간의 방향이 다른 두 관점
동일한 확산 모형이라도 두 종류의 PDE가 존재한다. 이 두 PDE의 역할을 명확하게 구분하는 것이 로컬볼 이론을 이해하는 데 필수적이다.
Backward PDE (후진 방정식): 가격 함수 \(V(S, t)\)를 시작으로, 만기 \(T\)에서 경계조건(payoff)을 두고 시각 \(t\)로 "뒤로" 적분하여 현재 가격을 구하는 PDE다. 블랙-숄즈 PDE가 대표적이다. 가격 계산에 직접 사용된다.
$$\frac{\partial V}{\partial t} + \frac{1}{2}\sigma^2(S,t)S^2\frac{\partial^2 V}{\partial S^2} + (r_d - r_f)S\frac{\partial V}{\partial S} - r_d V = 0$$Forward PDE (전진 방정식 = Fokker–Planck): 확률 밀도 \(p(S, t)\)를 시작으로, 초기 조건(현재 \(S_0\)에서의 디랙 델타)에서 출발하여 미래 \(t\)로 "앞으로" 전파하는 PDE다. 분포의 시간 진화를 기술한다.
왜 로컬볼 구성에는 Forward PDE가 자연스러운가: 로컬볼 구성의 목표는 "주어진 만기별 분포단면(옵션 가격에서 역산)을 정확히 재현하는 확산계수를 구하는 것"이다. 이것은 본질적으로 "초기에서 미래로 분포를 전파하는 기계(Forward PDE)의 계수를 역으로 구하는" 문제이므로 Forward PDE가 자연스럽다.
| 구분 | Backward PDE | Forward PDE (Fokker–Planck) |
|---|---|---|
| 대상 함수 | 옵션 가격 \(V(S, t)\) | 확률 밀도 \(p(S, t)\) |
| 시간 방향 | 만기 → 현재 (역방향) | 현재 → 미래 (순방향) |
| 경계조건 | 만기 payoff | 초기 분포 (디랙 델타) |
| 주요 용도 | 특정 상품의 가격 산출 | 전체 분포의 시간 진화, 로컬볼 역산 |
2.2 Fokker–Planck 방정식의 완전한 유도: 테스트 함수를 이용한 약형(weak form) 접근
Fokker–Planck 방정식을 엄밀하게 유도하는 가장 명확한 방법은 임의의 "테스트 함수(test function)"를 사용하는 약형(weak form) 접근이다. 이 방법은 수학적으로 엄밀하면서도 각 단계의 의미를 명확하게 보여준다.
설정: 상태변수 \(X_t\)가 다음 SDE를 따른다:
$$dX_t = a(X_t, t)\,dt + b(X_t, t)\,dW_t$$여기서 \(a\)는 드리프트 계수, \(b\)는 확산 계수다. \(p(x, t)\)를 \(X_t\)의 전이 밀도(transition density)라 하자. 즉, \(\mathbb{P}(X_t \in [x, x+dx]) = p(x,t)\,dx\).
목표: \(p(x, t)\)가 만족하는 PDE를 구한다.
충분히 매끈하고(smooth) 무한대에서 빠르게 0으로 감소하는(compactly supported 또는 rapidly decaying) 임의의 함수 \(g(x)\)를 잡는다. \(G_t = g(X_t)\)라 정의하자.
왜 테스트 함수를 쓰는가? \(p(x,t)\) 자체가 고전적 해(classical solution)를 가진다는 보장이 없을 수 있으므로, 적분 형태(약형)로 관계를 세우는 것이 더 일반적이다. \(g\)가 임의이므로 유도된 관계가 강형(pointwise)으로도 성립한다.
\(g(X_t)\)의 미분을 Ito의 공식으로 계산한다:
$$dG_t = dg(X_t) = g'(X_t)\,dX_t + \frac{1}{2}g''(X_t)\,(dX_t)^2$$\(dX_t = a\,dt + b\,dW_t\)를 대입하고 \((dX_t)^2 = b^2\,dt\)를 이용하면:
$$dG_t = \left[a(X_t, t)\,g'(X_t) + \frac{1}{2}b^2(X_t, t)\,g''(X_t)\right]dt + b(X_t, t)\,g'(X_t)\,dW_t$$기대값을 취하면 \(dW_t\) 항이 사라진다. 이유: \(b(X_t, t)g'(X_t)\,dW_t\)의 기대값은 (적분 가능성 조건 하에서) 0이다. 이것은 Ito 적분이 마팅게일(martingale)이라는 성질에서 나온다.
$$\frac{d}{dt}\mathbb{E}[G_t] = \mathbb{E}\left[a(X_t, t)\,g'(X_t) + \frac{1}{2}b^2(X_t, t)\,g''(X_t)\right]$$밀도 \(p(x, t)\)를 이용하면 기대값은 적분으로:
$$\frac{d}{dt}\mathbb{E}[G_t] = \int_{-\infty}^{\infty}\left[a(x,t)\,g'(x) + \frac{1}{2}b^2(x,t)\,g''(x)\right]p(x,t)\,dx$$적분 안에서 \(g'\)와 \(g''\)를 제거하기 위해 부분적분을 적용한다. 경계 조건(\(g\) 및 \(g'\)가 무한대에서 0)에 의해 경계 항이 사라진다.
첫 번째 항 (한 번 부분적분):
$$\int a(x,t)\,g'(x)\,p(x,t)\,dx = -\int g(x)\,\frac{\partial[a(x,t)\,p(x,t)]}{\partial x}\,dx$$두 번째 항 (두 번 부분적분):
$$\int \frac{1}{2}b^2(x,t)\,g''(x)\,p(x,t)\,dx = \int g(x)\,\frac{1}{2}\frac{\partial^2[b^2(x,t)\,p(x,t)]}{\partial x^2}\,dx$$따라서:
$$\frac{d}{dt}\mathbb{E}[G_t] = \int g(x)\left[-\frac{\partial(ap)}{\partial x} + \frac{1}{2}\frac{\partial^2(b^2 p)}{\partial x^2}\right]dx$$Step 5와 Step 6에서 얻은 두 식이 동일하고, \(g\)가 임의이므로 피적분함수가 같아야 한다:
이것이 확률 밀도의 시간 진화를 지배하는 방정식이다.
2.3 Fokker–Planck의 물리적 해석: 확률질량 보존의 법칙
Fokker–Planck 방정식은 확률질량(probability mass)의 보존 법칙이다. 이를 유체역학의 연속 방정식(continuity equation)과 비교하면 직관이 명확해진다.
오른쪽 첫 번째 항 \(-\frac{\partial(ap)}{\partial x}\): 드리프트에 의한 수송(convection)
드리프트 \(a\)는 확률질량을 특정 방향으로 "흘린다". \(-\frac{\partial}{\partial x}\)는 이 흐름의 결과로 국소적 확률 밀도가 어떻게 변하는지를 나타낸다. 예를 들어, 드리프트가 오른쪽(양의 방향)으로 균일하면, 왼쪽에서 확률질량이 빠져나가고 오른쪽에 쌓이는 효과가 있다.
오른쪽 두 번째 항 \(\frac{1}{2}\frac{\partial^2(b^2 p)}{\partial x^2}\): 확산에 의한 퍼짐(diffusion)
확산계수 \(b\)는 확률질량을 사방으로 "퍼뜨린다". 이 항은 순 흡수(net source or sink)가 없는 순수한 퍼짐을 나타내며, 열방정식(heat equation)의 \(\frac{1}{2}b^2 \frac{\partial^2 p}{\partial x^2}\)와 구조적으로 같다. 단, 여기서 확산계수 \(b^2\)이 \(x\)에 의존하므로 더 일반적이다.
전체 방정식의 의미: "어떤 공간 구역에서 밀도가 시간에 따라 변하는 것은, 드리프트로 인한 질량의 유입/유출과 확산으로 인한 질량의 퍼짐의 합이다." 이것은 확률이 보존된다는 사실(\(\int p\,dx = 1\)이 시간에 무관)의 미분 형태이기도 하다.
2.4 로컬볼 모형에서의 Fokker–Planck: 스팟 좌표에서의 구체적 형태
로컬볼 모형 \(dS_t = (r_d - r_f)S_t\,dt + \sigma_{\text{loc}}(S_t, t)S_t\,dW_t\)에서 \(X_t = S_t\)로 놓으면:
$$a(S, t) = (r_d - r_f)S, \qquad b(S, t) = \sigma_{\text{loc}}(S, t)\cdot S$$이를 Fokker–Planck에 대입하면 스팟 가격의 밀도 \(p(S, t)\)의 시간 진화 방정식을 얻는다:
이 방정식이 바로 Dupire 공식 유도의 핵심 도구다. 여기서 미지수는 \(\sigma_{\text{loc}}(S, t)\)이며, 옵션 가격표면으로부터 역산하는 것이 목표다.
3. Breeden–Litzenberger: 옵션 가격에서 확률 밀도를 꺼내는 법
3.1 콜 가격과 미래 분포의 관계: "적분 표현"에서 출발
Dupire 공식의 첫 번째 논리적 기둥은 Breeden–Litzenberger(1978) 공식이다. 이 공식은 "유럽형 옵션 가격이 이미 미래 자산가격의 분포를 내포하고 있다"는 사실을 수학적으로 보여준다.
만기 \(T\), 행사가격 \(K\)의 유럽형 콜옵션 가격은 위험중립 가격결정 공식에 의해:
$$C(K, T) = D_d(0, T)\,\mathbb{E}^{\mathbb{Q}}\big[(S_T - K)^+\big]$$여기서 \(D_d(0, T) = e^{-\int_0^T r_d(u)\,du}\)는 국내통화 할인인자다. \(S_T\)의 위험중립 밀도를 \(f_{S_T}(s)\)라 하면:
$$C(K, T) = D_d(0, T)\int_0^{\infty}(s-K)^+\,f_{S_T}(s)\,ds = D_d(0, T)\int_K^{\infty}(s-K)\,f_{S_T}(s)\,ds$$적분 구간이 \([K, \infty)\)인 이유: \(s < K\)에서는 \((s-K)^+ = 0\)이기 때문이다.
적분 \(\int_K^\infty (s-K)f_{S_T}(s)\,ds\)를 \(K\)로 미분할 때, 두 가지 효과가 있다:
- 효과 1: 적분 하한 \(K\)의 변화. Leibniz 규칙에 의해 하한 변화에서 나오는 항은 \(-(s-K)|_{s=K} \cdot f_{S_T}(K) = 0\)이다. (왜냐하면 \(s = K\)에서 \(s - K = 0\)이기 때문이다.)
- 효과 2: 피적분함수 내에서 \(K\)의 미분. \(\frac{\partial}{\partial K}(s-K) = -1\)이므로:
따라서:
$$\frac{\partial C}{\partial K} = -D_d(0, T)\,\mathbb{Q}(S_T \geq K)$$해석: \(-\frac{1}{D_d}\frac{\partial C}{\partial K}\)는 \(S_T \geq K\)일 위험중립 확률이다. 이것은 바로 디지털 콜옵션(binary call option)의 가격과 같다. 콜 가격이 \(K\)가 커질수록 감소하는(\(\partial_K C \leq 0\)) 이유도 이 공식에서 직접 보인다: 행사가격이 높을수록 페이오프가 발생할 확률이 낮아진다.
Step 2의 결과를 \(K\)로 다시 미분한다:
$$\frac{\partial^2 C}{\partial K^2} = -D_d(0, T)\,\frac{\partial}{\partial K}\int_K^\infty f_{S_T}(s)\,ds$$미적분의 기본 정리에 의해 \(\frac{d}{dK}\int_K^\infty f(s)\,ds = -f(K)\)이므로:
$$\frac{\partial^2 C}{\partial K^2} = -D_d(0, T)\cdot(-f_{S_T}(K)) = D_d(0, T)\,f_{S_T}(K)$$만기 \(T\)에서의 위험중립 밀도 \(f_{S_T}\)는 콜 가격을 행사가격으로 두 번 미분하고 할인인자로 나눈 것이다.
3.2 Breeden–Litzenberger의 무차익 조건으로의 해석
Breeden–Litzenberger 공식은 무차익 조건의 수학적 표현이기도 하다.
조건 1: \(\frac{\partial C}{\partial K} \leq 0\) (단조 감소)
콜 가격은 행사가격이 높아질수록 낮아진다. 이것이 위반되면, 높은 행사가격 콜을 사고 낮은 행사가격 콜을 팔아 무위험 이익을 얻을 수 있다(Bull spread arbitrage).
조건 2: \(\frac{\partial^2 C}{\partial K^2} \geq 0\) (볼록성, convexity)
Breeden–Litzenberger에 의해 이것은 \(f_{S_T}(K) \geq 0\)과 동치다. 즉, 밀도는 음수가 될 수 없다. 만약 어떤 구간에서 콜 가격이 오목(concave)하다면, 그 구간에서 콜 스프레드(butterfly spread)를 통한 차익거래가 가능하다.
조건 3: \(\frac{\partial C}{\partial T} \geq 0\) (캘린더 스프레드 조건)
같은 행사가격에서 만기가 긴 콜이 짧은 콜보다 비싸야 한다(대략). 이것이 위반되면 캘린더 스프레드를 통한 차익거래가 가능하다.
이 세 조건이 Dupire 로컬볼 공식에서 분자(\(\partial_T C \geq 0\))와 분모(\(\partial_{KK} C \geq 0\))가 모두 양수여야 한다는 요구와 정확하게 대응한다. 즉, 무차익 표면이라야 로컬볼이 양수로 결정된다는 것이다.
3.3 IV 표면에서 밀도를 읽는 방법: 스마일 모양과 분포 꼬리의 관계
Breeden–Litzenberger를 활용하면 내재변동성의 형태로부터 미래 분포의 특성을 직접 읽어낼 수 있다.
플랫한 IV 표면 (스마일 없음) → 대수정규분포: 블랙-숄즈 가정과 정확히 일치한다. 분포의 꼬리가 대수정규분포의 그것과 같다.
U자형 스마일(양쪽 IV가 높음) → 두터운 꼬리(fat tails): 낮은 \(K\)와 높은 \(K\) 모두에서 IV가 높다는 것은, 그 영역에서의 밀도 \(f_{S_T}(K) \propto \partial_{KK}C\)가 대수정규보다 크다는 것을 의미한다. 즉, 극단적 결과가 발생할 확률이 더 높다.
음의 스큐(낮은 \(K\)에서 IV 높음) → 왼쪽 꼬리가 두텁고 오른쪽 꼬리는 얇음: 큰 하락이 발생할 확률이 대수정규보다 높고, 큰 상승은 오히려 낮다. 주식 지수의 전형적 패턴이다.
양의 스큐(높은 \(K\)에서 IV 높음) → 오른쪽 꼬리가 두텁고 왼쪽 꼬리는 얇음: 일부 원자재 시장에서 나타나는 패턴이다.
4. Dupire 공식: 시장 가격표면에서 로컬 변동성을 역산하는 법
4.1 Dupire 구성의 논리 구조: 왜 이것이 가능한가
Dupire(1994)의 핵심 통찰은 "유럽형 옵션 가격표면이 주어지면, 그 표면과 완전히 일관된 1차원 마르코프 확산이 유일하게 존재한다"는 것이다. 그 구성은 다음 논리 구조를 따른다:
논리 1: 유럽형 콜 가격 \(C(K, T)\)를 \(K\)로 두 번 미분하면 만기별 위험중립 밀도 \(f_{S_T}(K)\)를 얻는다(Breeden–Litzenberger).
논리 2: 이 밀도는 1차원 확산 모형에서 나온다면 Fokker–Planck 방정식을 만족해야 한다.
논리 3: Fokker–Planck 방정식에 밀도를 \(C\)의 미분으로 표현하면, 미지수인 로컬볼 \(\sigma_{\text{loc}}\)이 분리되어 나온다.
논리 4: 이렇게 구한 \(\sigma_{\text{loc}}\)이 실제로 원래 가격표면을 재현하는지 확인한다(일관성 검증).
4.2 가장 단순한 경우: 금리가 0인 경우의 Dupire 유도
설정: 금리가 0이면 할인인자가 1이 되고, 스팟의 드리프트도 0이 된다:
$$dS_t = \sigma_{\text{loc}}(S_t, t)\,S_t\,dW_t$$금리 0이면 \(C(K, T) = \mathbb{E}[(S_T - K)^+] = \int_K^\infty (s-K)f_{S_T}(s)\,ds\)이다.
\(C\)를 \(T\)로 미분하면(Leibniz rule, 하한 \(K\)는 \(T\)에 무관하므로 경계 항 없음):
$$\frac{\partial C}{\partial T} = \int_K^\infty (s-K)\,\frac{\partial f_{S_T}(s)}{\partial T}\,ds$$여기서 \(f_{S_T}(s) = p(s, T)\)를 전이 밀도로 쓴다.
금리 0, 드리프트 0인 로컬볼 모형의 Fokker–Planck:
$$\frac{\partial p(s, T)}{\partial T} = \frac{1}{2}\frac{\partial^2\big[\sigma_{\text{loc}}^2(s,T)\,s^2\,p(s,T)\big]}{\partial s^2}$$이를 위 적분에 대입:
$$\frac{\partial C}{\partial T} = \int_K^\infty (s-K)\cdot\frac{1}{2}\frac{\partial^2\big[\sigma_{\text{loc}}^2(s,T)\,s^2\,p(s,T)\big]}{\partial s^2}\,ds$$피적분함수 안의 \(\frac{\partial^2}{\partial s^2}\)를 제거하기 위해 부분적분을 두 번 수행한다. 경계에서 \(p(s, T) \to 0\) (충분히 빠르게)이므로 경계 항이 사라진다.
첫 번째 부분적분: \(\int_K^\infty (s-K)\frac{\partial^2 G}{\partial s^2}\,ds = \left[(s-K)\frac{\partial G}{\partial s}\right]_K^\infty - \int_K^\infty 1\cdot\frac{\partial G}{\partial s}\,ds\)
여기서 \(G = \sigma_{\text{loc}}^2(s,T)s^2 p(s,T)\). 경계 항: \(s \to \infty\)에서 \(G \to 0\) (밀도가 빠르게 감소), \(s = K\)에서 \((s-K)|_{s=K} = 0\). 따라서 경계 항이 사라지고:
$$\frac{\partial C}{\partial T} = -\frac{1}{2}\int_K^\infty\frac{\partial\big[\sigma_{\text{loc}}^2(s,T)s^2 p(s,T)\big]}{\partial s}\,ds$$두 번째 부분적분 (또는 미적분의 기본정리 직접 적용):
$$-\frac{1}{2}\int_K^\infty\frac{\partial G}{\partial s}\,ds = -\frac{1}{2}\big[G(s)\big]_K^\infty = \frac{1}{2}G(K)$$(왜냐하면 \(G(\infty) = 0\)이므로.) 따라서:
$$\frac{\partial C}{\partial T} = \frac{1}{2}\sigma_{\text{loc}}^2(K, T)\,K^2\,p(K, T)$$Breeden–Litzenberger에 의해 금리 0이면 \(p(K, T) = \frac{\partial^2 C}{\partial K^2}\). 이를 대입하면:
$$\frac{\partial C}{\partial T} = \frac{1}{2}\sigma_{\text{loc}}^2(K, T)\,K^2\,\frac{\partial^2 C}{\partial K^2}$$\(\sigma_{\text{loc}}^2\)에 대해 풀면:
4.3 FX에서 일반적인 경우: 국내 및 해외 금리를 포함한 Dupire 공식
FX 옵션에서는 국내금리 \(r_d\)와 해외금리 \(r_f\)가 모두 존재한다. 드리프트가 0이 아닌 경우 Fokker–Planck에 수송항이 추가되며, 이것이 분자의 보정항으로 나타난다.
FX에서 콜 가격은 \(C(K, T) = D_d(0,T)\,\mathbb{E}^{\mathbb{Q}}[(S_T - K)^+]\). 계산의 편의상 "미할인 기대값" \(\tilde{C} = C/D_d\)를 생각하거나, 또는 직접 \(C\)에 대해 작업할 수 있다. 여기서는 \(C\)를 직접 다룬다.
드리프트가 있는 경우 Fokker–Planck:
$$\frac{\partial p}{\partial T} = -\frac{\partial\big[(r_d - r_f)s\,p\big]}{\partial s} + \frac{1}{2}\frac{\partial^2\big[\sigma_{\text{loc}}^2 s^2 p\big]}{\partial s^2}$$이를 \(\partial_T C = \int_K^\infty(s-K)\,\partial_T p\,ds\)에 대입하고 부분적분을 적용한다. 이번에는 드리프트 항에서도 부분적분이 필요하다.
드리프트 항: \(-\int_K^\infty(s-K)\frac{\partial[(r_d-r_f)sp]}{\partial s}\,ds\)
한 번 부분적분(경계 항 = 0): \((r_d - r_f)\int_K^\infty s\,p(s,T)\,ds - (r_d-r_f)\cdot 0 = (r_d-r_f)\int_K^\infty s\,p\,ds\)
여기서 \(\int_K^\infty s\,p\,ds\)는 \(C\)와 \(\partial_K C\)로 표현된다. Breeden–Litzenberger 역방향으로 이 적분을 되돌리면 \(C(K,T)/D_d\) 및 \(K\,\partial_K(C/D_d)\) 항들이 나온다. 정확한 계산 후 최종 결과는:
분자의 세 항의 의미:
- \(\dfrac{\partial C}{\partial T}\): 시간이 흐르면서 분포가 진화하는 효과 (확산)
- \((r_d - r_f)\,K\,\dfrac{\partial C}{\partial K}\): 드리프트에 의해 분포 전체가 이동하는 효과 (수송 보정)
- \(r_f\,C(K,T)\): 해외금리로 인한 할인 구조 보정 (carry 보정)
Dupire 공식의 가장 중요한 메시지는 다음과 같다: 무차익 유럽형 옵션 가격표면 \(C(K, T)\)가 충분히 매끈하게 주어지면, 로컬 변동성 \(\sigma_{\text{loc}}(K, T)\)는 표면의 1차/2차 미분만으로 완전히 결정된다. 이것은 추정(estimation)이 아니라 계산(calculation)이다.
이 공식은 또한 다음 정리의 형태로 표현할 수 있다: "1차원 마르코프 확산 중에서 주어진 유럽형 가격표면과 일치하는 것이 존재한다면, 그것은 유일(unique)하며 바로 Dupire의 로컬볼 함수로 주어진다."
4.4 내재변동성 표면으로부터 로컬볼을 계산하는 형태: 실무에서 더 많이 사용되는 버전
실무에서는 보통 콜 가격 \(C(K, T)\)보다 내재변동성 \(\sigma_{\text{imp}}(K, T)\)가 더 안정적이고 직접적으로 관찰된다. 따라서 \(C\)의 미분을 \(\sigma_{\text{imp}}\)의 미분으로 변환하여 Dupire 공식을 내재변동성 표현으로 바꾸는 것이 유용하다.
블랙-숄즈 공식 \(C = C_{\text{BS}}(S, K, T, r_d, r_f, \sigma_{\text{imp}})\)에서 연쇄 법칙을 적용한다:
$$\frac{\partial C}{\partial T} = \frac{\partial C_{\text{BS}}}{\partial T}\bigg|_{\sigma} + \frac{\partial C_{\text{BS}}}{\partial \sigma}\cdot\frac{\partial \sigma_{\text{imp}}}{\partial T} = \Theta_{\text{BS}} + \mathcal{V}_{\text{BS}}\cdot\partial_T\sigma_{\text{imp}}$$ $$\frac{\partial C}{\partial K} = \frac{\partial C_{\text{BS}}}{\partial K}\bigg|_{\sigma} + \mathcal{V}_{\text{BS}}\cdot\frac{\partial \sigma_{\text{imp}}}{\partial K}$$ $$\frac{\partial^2 C}{\partial K^2} = \frac{\partial^2 C_{\text{BS}}}{\partial K^2}\bigg|_{\sigma} + 2\frac{\partial^2 C_{\text{BS}}}{\partial K\partial\sigma}\cdot\partial_K\sigma + \mathcal{V}_{\text{BS}}\cdot\partial_{KK}\sigma$$여기서 \(\mathcal{V}_{\text{BS}} = \partial C_{\text{BS}}/\partial\sigma\)는 블랙-숄즈 베가다. 이를 Dupire 공식에 대입하면 \(\sigma_{\text{imp}}\)의 편미분들로 이루어진 형태가 나온다.
여기서 \(F_T = S_0 e^{(r_d-r_f)T}\)는 선물환 가격이다. \(y = \ln(K/F_T)\)로 좌표를 바꾸면 수식이 현저히 단순해진다. \(w = \sigma_{\text{imp}}^2\,T\) (총 분산, total variance)를 도입하면:
$$\sigma_{\text{loc}}^2 = \frac{\dfrac{\partial w}{\partial T}}{1 - \dfrac{y}{w}\dfrac{\partial w}{\partial y} + \dfrac{1}{4}\left(-\dfrac{1}{4} - \dfrac{1}{w} + \dfrac{y^2}{w^2}\right)\!\left(\dfrac{\partial w}{\partial y}\right)^2 + \dfrac{1}{2}\dfrac{\partial^2 w}{\partial y^2}}$$이 형태는 Gatheral(2006)이 제시한 형태로, 수치적 안정성이 좋고 금융적 해석이 명확하다. 분자의 \(\partial_T w\)는 표면의 만기 방향 기울기이며, 분모의 여러 항들은 스마일의 기울기(\(\partial_y w\))와 곡률(\(\partial_{yy} w\))에 의한 보정이다.
5. 내재변동성과 로컬 변동성의 관계: 같은 단어, 다른 개념
5.1 두 변동성의 본질적 차이: 수학적 정의부터 다르다
내재변동성 \(\sigma_{\text{imp}}(K, T)\):
- 정의: 블랙-숄즈 공식에 넣었을 때 시장 가격을 재현하는 단일 "상수 변동성" 값
- 의미: 구간 \([0, T]\) 전체에 걸친 "평균적 변동성 효과"의 요약
- 좌표: \((K, T)\) — 계약상 고정된 파라미터
- 직관: "이 옵션의 가격을 블랙-숄즈로 설명하려면 변동성이 이 값이어야 한다"
- 정보 손실: 구간 내의 경로 정보가 완전히 무시됨
로컬 변동성 \(\sigma_{\text{loc}}(S, t)\):
- 정의: SDE \(dS_t = \ldots + \sigma_{\text{loc}}(S_t, t)S_t\,dW_t\)의 확산계수
- 의미: 시각 \(t\)에 가격이 \(S\)일 때의 "순간적 변동성"
- 좌표: \((S, t)\) — 시간과 함께 변화하는 상태 변수
- 직관: "지금 이 순간, 이 가격 수준에서 다음 순간 가격이 얼마나 흔들리는가"
- 완전성: 1차원 마르코프 확산의 완전한 명세
| 비교 항목 | 내재변동성 (IV) | 로컬 변동성 (LV) |
|---|---|---|
| 시간 범위 | 전체 만기 기간 \([0,T]\)의 평균 | 순간 \(t\)에서의 값 |
| 상태 의존성 | 행사가격 \(K\) (계약 고정) | 현재 가격 \(S\) (동적 변화) |
| 측정 가능성 | 직접 관찰 (시장 가격에서) | 직접 관찰 불가 (모형 내 양) |
| 경로의존 상품 | 단일값 입력 → 불명확 | 상태별 명확한 입력 |
| 역산 방법 | 단일 옵션 가격 → 단순 역산 | 전체 표면 + 편미분 계산 |
5.2 두 변동성 사이의 정량적 관계: 로컬볼이 IV의 "두 배" 기울기를 갖는 이유
Chapter 18(변동성 변화 패턴)에서 다루는 스티키 로컬볼(sticky local volatility) 규칙과의 연결을 위해, 두 변동성 사이의 정량적 관계를 살펴보자. 이 관계는 실무에서 매우 중요한 경험칙으로 작동한다.
ATM 근방에서, 내재변동성이 선형 스큐 \(\sigma_{\text{imp}}(K) \approx \sigma_0 - \beta(K - S_0)\)를 가진다고 가정하자. 이때 Dupire 공식을 ATM에서 근사적으로 계산하면:
고정 \(K\)에 대한 로컬볼과 IV의 관계:
$$\frac{\partial \sigma_{\text{loc}}}{\partial K} \approx 2\,\frac{\partial \sigma_{\text{imp}}}{\partial K}$$즉, 로컬 변동성의 행사가격에 대한 기울기가 내재변동성 기울기의 약 두 배가 된다. 이것이 "로컬볼은 내재변동성보다 두 배 가파른 스큐를 갖는다"는 유명한 경험칙의 수학적 근거다.
직관적 이해: 내재변동성은 "구간 전체의 평균"이므로, 국소적인 구조(로컬볼)가 "희석"되어 보인다. 로컬볼이 ATM 근방에서 특정 기울기를 갖는다면, 그 기울기가 만기 전체에 걸쳐 평균화되어 절반 정도의 기울기만 IV로 나타난다.
주의: 이 "두 배" 관계는 ATM 근방, 짧은 만기, 선형 스큐 가정하에서의 근사다. 깊은 OTM이나 긴 만기에서는 비선형 보정이 필요하다.
5.3 로컬볼이 경로의존 옵션에서 중요한 이유: "언제, 어디서" 변동성이 활성화되는가
유럽형 옵션은 만기 시점의 가격 \(S_T\)만 중요하다. 따라서 분포의 "스냅샷"(= IV 표면)만으로 가격이 결정된다. 그러나 경로의존 옵션은 "경로 전체"가 중요하다:
예시 1 — 장벽 옵션(Barrier Option): 기초자산이 특정 장벽 수준을 터치하면 옵션이 소멸(knock-out)하거나 활성화(knock-in)된다. 장벽 근처에서의 변동성 수준이 결정적이다. IV 표면은 만기 분포만 말해주지만, 로컬볼은 "장벽 수준에 도달했을 때의 확산 강도"를 명시적으로 제공한다.
예시 2 — 아시안 옵션(Asian Option): 경로상 평균 가격에 기반한다. 평균이 형성되는 구간의 변동성 구조가 중요한데, 로컬볼은 각 가격 수준에서의 순간 변동성을 제공하므로 자연스럽게 입력된다.
예시 3 — 클리켓 옵션(Cliquet Option): 여러 구간의 수익률 합산에 기반한다. 각 구간의 "구간 변동성(forward volatility)"이 결정적인데, 이것은 로컬볼의 시간 구조에서 직접 결정된다.
따라서 경로의존 상품을 IV 하나로 가격결정하려면 "어떤 \(K\)에 해당하는 IV를 쓸 것인가"라는 임의적 선택이 강요된다. 로컬볼을 쓰면 이 선택이 모형에 의해 자동으로 결정된다.
6. 로컬 변동성 = 조건부 기대값: Gyöngy-Markovian Projection
6.1 핵심 아이디어: 어떤 복잡한 모형의 "마르코프 그림자"
로컬 변동성의 가장 심오한 해석은 "조건부 기대값으로서의 로컬볼"이다. 이 해석은 Gyöngy(1986)의 마르코프 사영(Markovian projection) 정리에 기반하며, 로컬볼 모형이 왜 유럽형 옵션에는 완벽하지만 경로의존 상품에서는 부족할 수 있는지를 명확히 보여준다.
설정: 실제 세계에서는 확률변동성 모형(stochastic volatility model), 예를 들어 Heston 모형이나 SABR 모형처럼 변동성 \(v_t\)가 별도의 확률과정을 따른다고 가정하자:
$$dS_t = \ldots + \sqrt{v_t}\,S_t\,dW_t^S$$ $$dv_t = \kappa(\theta - v_t)\,dt + \xi\sqrt{v_t}\,dW_t^v$$Gyöngy 정리의 내용: 이 2차원 확률과정 \((S_t, v_t)\)의 유럽형 옵션 가격을 정확히 재현하는 1차원 마르코프 확산 \(dS_t = \ldots + \sigma_{\text{loc}}(S_t, t)S_t\,dW_t\)이 존재하며, 그 로컬볼은 다음과 같이 주어진다:
즉, 로컬 분산은 "만기에 가격이 정확히 \(K\)에 있는 조건 하에서의 순간 분산의 기대값"이다.
6.2 조건부 기대값으로서의 로컬볼: 직관과 수학적 유도
설정: 금리 0, 확률변동성 모형에서 \(dS_t = \sqrt{v_t}\,S_t\,dW_t\). 콜 가격은 \(C(K, T) = \mathbb{E}[(S_T - K)^+]\).
함수 \(f(S) = (S - K)^+\)를 \([0, T]\)에 걸쳐 Ito의 공식으로 전개한다. 이 함수는 \(S = K\)에서 미분 불가능하지만, 이차 미분은 디랙 델타 \(\delta(S-K)\)로 이해할 수 있다 (Tanaka-Meyer 공식).
Tanaka의 공식에 의해:
$$(S_T - K)^+ = (S_0 - K)^+ + \int_0^T \mathbf{1}_{\{S_t \geq K\}}\,dS_t + \frac{1}{2}\int_0^T \delta(S_t - K)\,d\langle S\rangle_t$$여기서 \(d\langle S\rangle_t = v_t S_t^2\,dt\)는 \(S_t\)의 이차변동(quadratic variation)이다.
기대값을 취하면 \(\int_0^T \mathbf{1}_{\{S_t\geq K\}}\,dS_t\) 항은 마팅게일이므로 기대값이 0이 된다. 따라서:
$$C(K, T) = (S_0 - K)^+ + \frac{1}{2}\int_0^T K^2\,\mathbb{E}\big[v_t\,\delta(S_t - K)\big]\,dt$$(디랙 델타의 성질: \(\delta(S_t - K) = \delta(K - S_t)\)이고 \(S_t = K\)에서만 기여함)
양변을 \(T\)로 미분하면:
$$\frac{\partial C}{\partial T} = \frac{1}{2}K^2\,\mathbb{E}\big[v_T\,\delta(S_T - K)\big]$$이제 \(\mathbb{E}[v_T\,\delta(S_T - K)]\)를 조건부 기대값으로 분해한다:
$$\mathbb{E}[v_T\,\delta(S_T - K)] = \mathbb{E}[v_T \mid S_T = K]\cdot\mathbb{E}[\delta(S_T - K)] = \mathbb{E}[v_T \mid S_T = K]\cdot f_{S_T}(K)$$따라서:
$$\frac{\partial C}{\partial T} = \frac{1}{2}K^2\,\mathbb{E}[v_T \mid S_T = K]\cdot f_{S_T}(K) = \frac{1}{2}K^2\,\mathbb{E}[v_T \mid S_T = K]\cdot\frac{\partial^2 C}{\partial K^2}$$이것은 Dupire 공식의 좌변과 조건부 기대값의 우변이 완전히 일치함을 보인다.
6.3 조건부 기대값 해석이 주는 실무적 메시지
유럽형 옵션 관점에서: 로컬볼 모형은 어떤 확률변동성 모형이 실제로 작동하든, 유럽형 옵션 가격을 정확히 재현하는 "압축된 1차원 버전"이다. 이 의미에서 로컬볼은 "확률변동성의 조건부 평균"으로 이해할 수 있다.
경로의존 옵션 관점에서: 그러나 이 "압축"이 경로 정보를 잃는다는 것이 핵심 문제다. 확률변동성 모형에서 \(S_t\)는 분산 \(v_t\)와 상관될 수 있으며, 이 상관 구조가 경로의존 옵션 가격에 영향을 준다. 로컬볼 모형은 이 상관 구조를 "조건부 평균"으로 뭉개버린다.
구체적 한계: 변동성이 독립적으로(stochastic volatility with jump in volatility) 움직이는 국면에서 로컬볼은 부정확한 경로를 생성한다. 예를 들어, Heston 모형에서 분산 \(v_t\)가 평균회귀하면서 큰 충격을 받을 수 있는데, 로컬볼은 이런 "분산의 분산(vol of vol)"을 포착하지 못한다.
실무적 대응: 이 한계를 보완하기 위해 로컬-확률변동성(Local-Stochastic Volatility, LSV) 모형이 개발되었다. LSV는 \(dS = \ldots + \sigma_{\text{loc}}(S, t)\sqrt{v_t}S\,dW\)처럼 로컬볼과 확률변동성을 곱하는 구조로, 유럽형 가격도 맞추고 확률변동성의 동학도 보존한다.
7. FX 실무: 델타 인용, 스트라이크 변환, 로그 모니니스
7.1 FX 옵션이 스트라이크가 아닌 델타로 인용되는 이유
FX 옵션 시장의 가장 독특한 관행 중 하나는 옵션을 행사가격 \(K\)가 아니라 델타(\(\Delta\))로 인용하는 것이다. 즉, "행사가가 1.2000달러/유로인 콜옵션"이 아니라 "25델타 유로 콜옵션"처럼 표현한다.
왜 이런 관행이 생겼는가?
첫째, FX 시장에서 환율 레벨은 수시로 변한다. USD/JPY가 140이든 150이든, "5% OTM 콜옵션"의 경제적 의미는 비슷하다. 그러나 절대 스트라이크 \(K\)는 환율 레벨에 따라 완전히 달라진다. 반면 델타는 상대적 모니니스의 안정적인 척도가 된다.
둘째, 델타는 헤지에 직접 사용되는 양이다. 트레이더들은 옵션을 거래할 때 즉시 기초자산(스팟 또는 선물)으로 델타 헤지를 해야 한다. 따라서 델타로 인용하면 거래와 헤지의 통합이 자연스럽다.
셋째, 변동성 스마일은 델타 공간에서 더 안정적인 구조를 가지는 경향이 있다. 스팟이 변해도 특정 델타 수준의 IV는 상대적으로 안정적이다 (sticky delta 규칙).
7.2 FX 옵션의 표준 구조: ATM, Risk Reversal, Butterfly
FX 시장에서 변동성 스마일은 보통 세 가지 '레그(leg)'의 조합으로 표현된다:
(1) ATM 변동성 (At-The-Money Vol): 등가격 옵션의 내재변동성이다. FX에서는 보통 델타 중립 스트라이크(delta-neutral straddle strike)가 ATM으로 정의된다. 즉, 콜과 풋의 델타가 정확히 상쇄되는 스트라이크다. 이것이 "단순히 현재 스팟" 또는 "선물환"과 다를 수 있다는 점에 주의하라.
(2) 리스크 리버설 (Risk Reversal, RR): 동일한 델타의 콜과 풋 간의 IV 차이다. 예를 들어 25D RR = \(\sigma_{\text{imp}}(\text{25D Call}) - \sigma_{\text{imp}}(\text{25D Put})\). 양의 RR은 동등 델타 콜이 더 비싸다는 것(오른쪽 스큐), 음의 RR은 풋이 더 비싸다는 것(음의 스큐)을 의미한다. FX에서 RR은 시장의 방향성 편향(directional bias)을 반영한다.
(3) 버터플라이 (Butterfly, BF): OTM의 평균 IV와 ATM의 차이다. 예를 들어 25D BF = \(\frac{1}{2}[\sigma(\text{25D Call}) + \sigma(\text{25D Put})] - \sigma(\text{ATM})\). 양의 BF는 OTM 옵션들이 ATM보다 비싸다는 것, 즉 스마일 곡률이 있다는 것을 의미한다. BF는 꼬리 위험(tail risk)에 대한 시장의 평가를 반영한다.
7.3 델타 컨벤션의 다양성: 왜 "25델타"라도 계산이 달라지는가
FX 시장에서 "델타"는 하나의 정의가 아니라 여러 컨벤션이 공존한다. 이 컨벤션의 차이를 무시하면 스트라이크 계산에 오류가 발생하고, 결국 로컬볼 표면도 틀려진다.
스팟 델타(Spot Delta): 표준 블랙-숄즈 델타로, 현재 스팟 가격 변화에 대한 옵션 가격 민감도다. 수식으로 \(\Delta_{\text{spot}} = e^{-r_f T}N(d_1)\) (유럽형 콜의 경우).
선물 델타(Forward Delta): 선물환 가격 변화에 대한 민감도다. \(\Delta_{\text{fwd}} = N(d_1)\). 해외 금리를 별도로 처리할 필요가 없어 많은 실무 시스템에서 선호된다.
프리미엄 조정 델타(Premium-Adjusted Delta): 옵션 프리미엄 자체가 외화로 지급되는 경우, 프리미엄 지급이 이미 일부 헤지 효과를 가지므로 이를 제거한 델타다. EM(신흥시장) 통화 옵션에서 흔히 쓰인다.
예를 들어 EUR/USD 3개월 옵션에서 "25D 콜"이라도, 스팟 델타 기준 25D와 선물 델타 기준 25D는 다른 스트라이크에 대응한다. 이 차이는 단기물에서는 작지만 장기물(1년 이상)에서는 의미 있는 수준이 된다.
| 델타 컨벤션 | 공식 | 주요 사용 시장 | 프리미엄 통화 |
|---|---|---|---|
| 스팟 델타 | \(e^{-r_f T}N(d_1)\) | EUR/USD, 주요 통화쌍 | 자국 통화(가변) |
| 선물 델타 | \(N(d_1)\) | 많은 내부 시스템 | - |
| PA 스팟 델타 | \(e^{-r_f T}N(d_1) - C/S_0\) | EM, 일부 원자재 | 외국 통화 |
| PA 선물 델타 | \(N(d_1) - C/F_T\) | 일부 EM, 금 | 외국 통화 |
7.4 델타에서 스트라이크로의 변환: 수치적 역산
Dupire 로컬볼 공식은 스트라이크 \(K\)에 대한 미분을 요구한다. 따라서 델타로 인용된 FX 스마일을 스트라이크 공간으로 변환하는 단계가 반드시 필요하다.
스팟 델타 \(\Delta_{\text{spot}} = e^{-r_f T}N(d_1)\)가 주어졌을 때, 스트라이크 \(K\)를 구하는 과정이다. \(\sigma\)는 해당 포인트의 내재변동성이며, 일반적으로 비선형이므로 반복적으로 풀어야 한다.
\(\Delta_{\text{spot}} = e^{-r_f T}N(d_1)\)이므로:
$$N(d_1) = e^{r_f T}\,\Delta_{\text{spot}}$$ $$d_1 = N^{-1}(e^{r_f T}\,\Delta_{\text{spot}})$$여기서 \(N^{-1}(\cdot)\)은 표준정규분포의 역함수(quantile function)다.
위 공식에는 \(\sigma = \sigma_{\text{imp}}(K, T)\)가 포함되어 있는데, \(K\)를 모르면 \(\sigma\)도 모른다. 따라서 반복법이 필요하다. 실무적 절차: (1) 초기 추정값 \(\sigma^{(0)} = \sigma_{\text{ATM}}\), (2) 위 공식으로 \(K^{(0)}\) 계산, (3) \(K^{(0)}\)에서 스마일을 보간하여 \(\sigma^{(1)}\) 업데이트, (4) 수렴할 때까지 반복. 대개 3~5회 반복으로 충분히 수렴한다.
7.5 로그 모니니스 \(x = \ln(K/F_T)\): 왜 이 좌표가 편리한가
FX에서 선물환 가격은 \(F_T = S_0\,e^{(r_d - r_f)T}\)다. 로그 모니니스는 이 선물환을 기준으로 한 상대적 행사가를 로그 스케일로 나타낸 것이다:
$$x = \ln\!\left(\frac{K}{F_T}\right) = \ln\!\left(\frac{K}{S_0}\right) - (r_d - r_f)T$$왜 단순 모니니스 \(K/F_T\)가 아닌 로그 형태인가?
첫째, 블랙-숄즈에서 로그수익률 \(\ln(S_T/F_T)\)이 정규분포를 따르므로, \(x\)는 자연스러운 좌표계다. ATM (\(x = 0\))에서 좌우 대칭인 양을 다루기 편하다.
둘째, 블랙-숄즈 \(d_1, d_2\) 공식이 \(x\)의 선형 함수로 표현된다:
$$d_1 = \frac{-x + \frac{1}{2}\sigma^2 T}{\sigma\sqrt{T}}, \qquad d_2 = d_1 - \sigma\sqrt{T} = \frac{-x - \frac{1}{2}\sigma^2 T}{\sigma\sqrt{T}}$$셋째, 스마일을 \(x\)의 함수로 표현하면 스팟 레벨의 변화에 상대적으로 불변한 표현이 된다. 스팟이 변해도 "선물환 대비 상대적 위치"는 안정적이다.
넷째, 로컬볼 Dupire 공식을 \(x = \ln(K/F_T)\) 좌표에서 표현하면 금리 항들이 자동으로 흡수되어 수식이 단순해진다.
7.6 FX 변동성 표면 구축의 실무 파이프라인
단계 1: 시장 데이터 수집
각 만기 \(T_i\)에 대해: ATM 변동성 \(\sigma_{\text{ATM}}(T_i)\), 10D/25D Risk Reversal (RR10, RR25), 10D/25D Butterfly (BF10, BF25). 총 5개 숫자 × 만기 수가 기본 입력이다.
단계 2: RR/BF에서 개별 델타 포인트의 IV 계산
RR과 BF 정의에서 각 델타 포인트의 IV를 역산한다. 예: 25D 경우
$$\sigma(\text{25D Call}) = \sigma_{\text{ATM}} + \text{BF25} + \frac{1}{2}\text{RR25}$$ $$\sigma(\text{25D Put}) = \sigma_{\text{ATM}} + \text{BF25} - \frac{1}{2}\text{RR25}$$단계 3: 각 델타 포인트를 스트라이크로 변환
델타 컨벤션을 확인하고, 7.4절의 반복법으로 각 (만기, 델타) → (만기, 스트라이크)로 변환한다.
단계 4: 스트라이크 공간에서의 스마일 보간
각 만기별로 5개(또는 그 이상)의 (K, IV) 점들을 가지고 부드럽고 무차익인 스마일 곡선을 보간한다. 흔히 사용되는 방법: (a) 3차 스플라인 (간단하지만 무차익 보장 없음), (b) SVI(Stochastic Volatility Inspired) 파라메트릭 피팅, (c) SABR 모형 피팅.
단계 5: 만기간 보간
관측 만기 사이의 만기를 분산(variance) 공간에서 선형 보간한다. 구체적으로, 총분산 \(w(K, T) = \sigma_{\text{imp}}^2(K, T)\cdot T\)를 \(T\)에 대해 선형 보간하고, IV로 변환한다. 이것이 "분산은 가법적"이라는 원리와 일치한다.
단계 6: 무차익 검증 및 안정화
보간된 표면에서 \(\partial_{KK}C \geq 0\) (볼록성), \(\partial_T C \geq 0\) (캘린더 스프레드) 조건을 검사한다. 위반 시 표면을 수정하거나 평활화한다.
단계 7: Dupire 로컬볼 계산
매끈한 \(C(K, T)\) 표면에서 \(\partial_T C\), \(\partial_K C\), \(\partial_{KK} C\)를 계산하여 Dupire 공식에 대입한다. 분석적 미분이 가능한 파라메트릭 표면(SVI 등)을 쓰면 수치적으로 더 안정적이다.
단계 8: 경계 처리 (윙 처리)
매우 높거나 낮은 \(K\)에서는 시장 데이터가 없으므로 외삽이 필요하다. 로컬볼이 합리적인 값을 유지하도록 (예: 양수, 유한) 경계 처리를 설계한다.
8. 로컬볼 모형의 PDE와 수치 가격결정
8.1 로컬볼 확산의 PDE: 블랙-숄즈의 자연스러운 일반화
로컬볼 \(\sigma_{\text{loc}}(S, t)\)가 구해지면, 이를 가격결정 PDE의 확산계수로 직접 넣어 경로의존 옵션을 포함한 모든 유럽형/아메리칸형 파생상품의 가격을 계산할 수 있다.
경계 조건: 만기 페이오프 \(V(S, T) = \text{Payoff}(S)\), 그리고 \(S \to 0\)과 \(S \to \infty\)에서의 적절한 경계조건.
블랙-숄즈 PDE와 동일한 구조이되, \(\sigma\)가 상수 대신 \((S, t)\)에 의존하는 함수 \(\sigma_{\text{loc}}(S, t)\)가 된다. 이것이 수치 구현의 핵심: 격자(grid) 상의 각 점 \((S_i, t_j)\)에서 미리 계산된 로컬볼 \(\sigma_{\text{loc}}(S_i, t_j)\)를 조회하여 PDE를 수치적으로 푼다.
8.2 로그 좌표에서의 PDE: 수치 안정성이 좋은 형태
스팟 좌표 \(S\)보다 로그 스팟 \(X = \ln S\) 좌표에서 PDE를 푸는 것이 수치적으로 유리한 경우가 많다. 이유: (1) \(X\)는 음수도 취할 수 있어 경계조건이 대칭적이 되고, (2) 격자 간격을 균일하게 잡아도 원래 공간에서 상대적으로 균일한 해상도를 제공한다.
Ito의 공식으로 \(X_t = \ln S_t\)의 SDE를 구하면:
$$dX_t = \left(r_d - r_f - \frac{1}{2}\sigma_{\text{loc}}^2(e^{X_t}, t)\right)dt + \sigma_{\text{loc}}(e^{X_t}, t)\,dW_t$$여기서 \(\hat{\sigma}(x, t) = \sigma_{\text{loc}}(e^x, t)\)는 로그 좌표에서의 로컬볼이다. 이 형태에서 확산 계수가 상수 \(\frac{1}{2}\hat{\sigma}^2\)처럼 보이지만 실제로는 \((x, t)\)에 의존한다.
8.3 몬테카를로(MC) 시뮬레이션에서 로컬볼을 쓰는 방법
PDE 방법이 1차원 상태변수에 적합하다면, 몬테카를로(MC)는 고차원 또는 복잡한 경로의존 구조에 더 유연하다. 로컬볼 MC의 핵심은 각 시간 스텝에서 현재 가격에 해당하는 로컬볼 값을 동적으로 조회하는 것이다.
Step 1: 시간 격자 설정
\(0 = t_0 < t_1 < \cdots < t_N = T\)를 잡는다. 이 격자는 관찰일(observation dates), 쿠폰 지급일, 장벽 모니터링 날짜 등 상품 구조에 맞게 설정한다.
Step 2: 각 경로의 시뮬레이션
현재 상태 \(S_{t_i}\)에서 로컬볼 \(\sigma_{\text{loc}}(S_{t_i}, t_i)\)를 미리 구축된 격자에서 보간(bilinear 또는 bicubic interpolation)으로 조회한다.
오일러-마루야마(Euler-Maruyama) 스킴으로 다음 스텝을 전진한다:
$$S_{t_{i+1}} = S_{t_i}\,\exp\!\left[\left(r_d - r_f - \frac{1}{2}\sigma_{\text{loc}}^2(S_{t_i}, t_i)\right)\Delta t + \sigma_{\text{loc}}(S_{t_i}, t_i)\sqrt{\Delta t}\,Z_i\right]$$여기서 \(Z_i \sim \mathcal{N}(0,1)\) i.i.d.이며, 로그 스킴을 씀으로써 가격이 항상 양수로 유지된다.
Step 3: 페이오프 계산 및 평균
각 경로에서의 페이오프를 계산하고, \(N_{\text{sim}}\)개 경로에 대해 평균을 취한 후 할인한다:
$$V_0 \approx e^{-r_d T}\,\frac{1}{N_{\text{sim}}}\sum_{j=1}^{N_{\text{sim}}}\text{Payoff}(S^{(j)}_{\cdot})$$실무적 주의사항:
- 보간 방법: 로컬볼 격자 밖의 점(외삽, extrapolation)에서 로컬볼 값이 폭발하거나 음수가 되지 않도록 안정적인 외삽 규칙을 설계해야 한다.
- 분산 축소(Variance Reduction): MC의 통계적 오차를 줄이기 위해 대조 변수법(antithetic variates), 제어 변수법(control variates), 중요도 표본추출(importance sampling) 등을 사용한다.
- 약 수렴(Weak Convergence): 오일러 스킴은 분포 수렴 속도가 \(\mathcal{O}(\Delta t)\)이다. 더 정확한 밀레슈타인(Milshtein) 스킴이나 고차 스킴을 쓰면 수렴이 빠르지만 각 스텝에서 \(\sigma_{\text{loc}}\)의 공간 미분도 필요하다.
9. CEV 모형: 파라메트릭 로컬볼의 가장 단순한 예
9.1 CEV 모형의 정의와 로컬볼로서의 해석
CEV 모형은 가격 수준 \(S\)에 대한 변동성의 의존성을 멱함수(power function) 형태로 모형화한다:
$$dS_t = \mu S_t\,dt + \sigma\,S_t^\beta\,dW_t$$여기서 \(\beta \geq 0\)은 "탄력성 파라미터(elasticity parameter)", \(\sigma > 0\)는 스케일 파라미터다. \(\beta = 1\)이면 블랙-숄즈(상수 변동성), \(\beta < 1\)이면 낮은 가격에서 변동성이 높아지는 음의 스큐, \(\beta > 1\)이면 높은 가격에서 변동성이 높아지는 양의 스큐를 생성한다.
로컬볼로의 변환: CEV를 \(dS = \sigma_{\text{loc}}(S)S\,dW\) 형태로 쓰면:
$$\sigma_{\text{loc}}(S) = \sigma\,S^{\beta - 1}$$즉, 로컬볼이 가격의 멱함수다. \(\beta < 1\)이면 \(S\)가 작을수록 로컬볼이 커지고, \(\beta > 1\)이면 \(S\)가 클수록 로컬볼이 커진다.
9.2 CEV 모형에서의 스큐 생성 메커니즘
앞에서 논의한 "로컬볼은 내재변동성 기울기의 두 배" 관계를 CEV에 적용한다. CEV에서 ATM 근방의 내재변동성 근사:
$$\sigma_{\text{imp}}(K) \approx \sigma\,S_0^{\beta-1}\,\left[1 + \frac{(\beta-1)}{2}\cdot\frac{K - S_0}{S_0} + \cdots\right]$$따라서 스큐 기울기는:
$$\frac{\partial \sigma_{\text{imp}}}{\partial K}\bigg|_{K=S_0} \approx \frac{(\beta-1)}{2}\cdot\frac{\sigma}{S_0^{2-\beta}}$$\(\beta < 1\)이면 \(\beta - 1 < 0\)이므로 스큐 기울기가 음수다. 즉, 낮은 행사가에서 높은 IV — 음의 스큐(negative skew) / 레버리지 효과(leverage effect)가 나타난다.
스큐의 크기는 \(|1 - \beta|\)에 비례한다. \(\beta = 0\)이면 최대 스큐, \(\beta = 1\)이면 스큐 없음(블랙-숄즈), \(\beta = 2\)이면 양의 스큐가 생성된다.
\(X_t = \ln S_t\)로 바꾸면 Ito의 공식에 의해:
$$dX_t = \left(\mu - \frac{1}{2}\sigma^2 e^{2(\beta-1)X_t}\right)dt + \sigma\,e^{(\beta-1)X_t}\,dW_t$$여기서 확산계수 \(\sigma e^{(\beta-1)X_t}\)가 로그 스팟에 대해 지수적으로 의존한다. 이 비선형 의존성이 스큐를 생성하는 핵심이다.
9.3 CEV와 Dupire 로컬볼의 비교: 트레이드오프
| 비교 항목 | Dupire 비모수 로컬볼 | CEV 파라메트릭 로컬볼 |
|---|---|---|
| 표면 적합 | 완벽한 적합 (전체 표면) | 근사적 적합 (스큐 위주) |
| 파라미터 수 | 무한 (함수) | 2개 (\(\sigma, \beta\)) |
| 수치적 안정성 | 민감 (미분 필요) | 안정적 (분석적 공식) |
| 외삽 거동 | 불명확 (윙 처리 필요) | 명확 (멱함수 형태) |
| 경로의존 상품 적합성 | 높음 (전체 구조 반영) | 낮음 (단순화) |
| 캘리브레이션 복잡성 | 높음 (표면 구축 + 미분) | 낮음 (최적화 2파라미터) |
10. 수치 구현의 함정: 로컬볼이 이론과 실제에서 다른 이유
10.1 무차익 조건 검증: 표면 구축의 첫 번째 관문
로컬볼 계산의 첫 번째 관문은 입력 표면이 무차익 조건을 만족하는지 확인하는 것이다. 조건 위반이 있으면 로컬볼 공식에서 즉시 문제가 나타난다.
증상 1: 로컬분산이 음수 (\(\sigma_{\text{loc}}^2 < 0\))
원인: 콜 표면의 볼록성 조건 위반, 즉 \(\partial_{KK}C < 0\). Breeden-Litzenberger에 의해 이것은 음수 밀도에 해당한다. 물리적으로 불가능한 상황이므로 표면 구축 단계에서 반드시 수정해야 한다.
증상 2: 로컬볼이 비합리적으로 크거나 불안정
원인: \(\partial_{KK}C \approx 0\)인 구간에서 분모가 0에 가까워져 로컬볼이 폭발한다. 이는 표면의 볼록성이 거의 없는, 즉 두 옵션이 거의 같은 가격인 구간에서 나타난다.
증상 3: 캘린더 스프레드 문제
\(\partial_T C < 0\)인 구간에서 분자가 음수가 되어 로컬볼이 음수가 된다. 이는 짧은 만기 옵션이 긴 만기 옵션보다 비싼(캘린더 차익거래 가능한) 표면에서 나타난다. 보간 방법이 잘못되면 이 문제가 발생할 수 있다.
10.2 스플라인 보간의 함정: 매끄럽다고 무차익이 아니다
3차 스플라인은 주어진 점들을 통과하는 3차 다항식의 연결이다. "매끈하게(smooth) 보간된다"는 장점이 있지만, 금융 변동성 표면에 직접 적용하면 몇 가지 심각한 문제가 있다.
문제 1: 볼록성이 보장되지 않는다. 3차 스플라인은 중간 구간에서 오목(concave)해질 수 있다. 예를 들어 양 끝에 높은 값, 중간에 낮은 값이 있으면 중간 구간에서 오목한 보간이 나타날 수 있고, 이것이 \(\partial_{KK}C < 0\), 즉 음수 밀도를 초래한다.
문제 2: 날개(wing) 처리가 자연스럽지 않다. 3차 스플라인은 경계 조건이 필요하며, 이 조건이 자연스럽지 않으면 깊은 OTM 영역에서 변동성이 하락하거나 음수가 될 수 있다.
대안들:
- SVI (Stochastic Volatility Inspired) 파라메트릭화: Gatheral이 제안한 5파라미터 함수로, 분석적 미분이 가능하고 날개 거동이 자연스럽다. 무차익 SVI(SSVI) 변형도 존재한다.
- SABR 보간: SABR 모형의 IV 근사 공식(Hagan 등)을 각 만기에 적합하여 스마일을 표현한다. ATM 근방에서 정확하지만 깊은 날개에서 부정확해질 수 있다.
- 베지어 스플라인(Bezier spline): 볼록성을 유지하도록 설계된 스플라인 변형. 계수 선택에 따라 무차익 조건 만족을 보장할 수 있다.
10.3 미분의 수치 불안정성: 2차 미분은 왜 위험한가
Dupire 공식의 분모에는 \(\partial_{KK}C\)가, 분자에는 \(\partial_T C\)와 \(\partial_K C\)가 있다. 이 미분들을 수치적으로 계산할 때 발생하는 오차 증폭 문제를 이해하는 것이 실무에서 중요하다.
유한차분(Finite Difference)의 기본 원리:
$$\frac{\partial^2 C}{\partial K^2} \approx \frac{C(K+h) - 2C(K) + C(K-h)}{h^2}$$이 근사의 오차는 \(\mathcal{O}(h^2)\)이지만, 분모에 \(h^2\)이 있어 \(C\)의 작은 오차가 크게 증폭된다. 구체적으로: \(C\)에 \(\varepsilon\) 크기의 오차가 있다면, \(\partial_{KK}C\)의 오차는 \(\mathcal{O}(\varepsilon/h^2)\)이다. \(h\)가 작을수록 수치 미분이 정확해지지만 오차 증폭도 커지는 딜레마가 있다.
실무적 해결책:
가장 효과적인 해결책은 분석적 미분이 가능한 표면 표현을 쓰는 것이다. 예를 들어 SVI 파라메트릭화나 SABR 근사를 쓰면, IV가 파라미터의 함수로 표현되고, 체인룰로 \(\partial_K\sigma, \partial_{KK}\sigma, \partial_T\sigma\)를 분석적으로 계산할 수 있다. 이렇게 하면 수치 미분의 오차 증폭 문제가 완전히 제거된다.
10.4 음수 로컬분산의 처리: 클리핑의 대가와 대안
음수 로컬분산이 나왔을 때 가장 단순한 대응은 "0으로 클리핑하는 것"이다: \(\sigma_{\text{loc}}^2(K, T) = \max(\sigma_{\text{loc,computed}}^2, \epsilon)\). 그러나 이 방법은 다음의 치명적 문제를 초래한다.
문제: 유럽형 재현 실패. 로컬볼을 클리핑하면 원래 유럽형 옵션 가격을 더 이상 정확하게 재현할 수 없게 된다. Dupire 공식의 핵심 성질("주어진 표면을 정확히 재현")이 파괴된다.
올바른 접근: 음수 로컬분산이 나타나는 이유는 항상 "표면 자체에 문제가 있기 때문"이다. 따라서 올바른 해결은 클리핑이 아니라 표면을 수정하는 것이다. 구체적으로:
- 볼록성 위반 구간의 \(C(K, T)\)를 볼록한 형태로 "수정"하되, 실제 관찰 가격과의 괴리를 최소화한다.
- 또는 무차익 제약을 명시적으로 포함한 최적화 문제를 풀어 표면을 적합한다.
- 또는 파라메트릭 모형(예: SVI)을 써서 자동으로 무차익이 보장되도록 한다.
11. 연습문제 상세 해설
문제 11-1: 구간 Forward Vol 계산 (난이도: 하)
6개월(T₁ = 0.5년) 내재변동성이 10%, 1년(T₂ = 1.0년) 내재변동성이 12%이다. 6개월에서 1년 구간의 forward volatility를 계산하라.
분산은 가법적이다. 누적 분산 = 시간 × (IV)². 두 만기의 누적 분산의 차이가 중간 구간의 누적 분산이다.
$$\text{Var}[0, T_1] = T_1 \cdot \sigma_1^2 = 0.5 \times 0.10^2 = 0.5 \times 0.01 = 0.005$$ $$\text{Var}[0, T_2] = T_2 \cdot \sigma_2^2 = 1.0 \times 0.12^2 = 1.0 \times 0.0144 = 0.0144$$구간 길이: \(\Delta T = T_2 - T_1 = 0.5\)년.
답: 약 13.71%
6M IV = 10%, 1Y IV = 12%인데, 6M~1Y 구간의 Forward Vol이 13.71%로 더 높다. 이것은 수학적으로 자연스럽다: 1년 IV가 6개월 IV보다 높다는 것은, 6개월 이후 구간의 변동성이 6개월 이전 구간보다 높다는 것을 의미한다. 만기가 길수록 IV가 높아지는(normal contango) 상황에서는 항상 Forward Vol이 장기 IV보다 높다.
무차익 확인: \(\sigma_{\text{fwd}}^2 = 0.0188 > 0\)이므로 무차익 조건이 만족된다. 만약 역전(inverted term structure, 단기 IV > 장기 IV)이었다면 Forward Vol이 음수가 될 수 있으므로 주의해야 한다.
문제 11-2: Breeden–Litzenberger의 직관적 증명 (난이도: 중)
무차익 관점에서, 왜 콜 가격이 행사가에 대해 볼록(\(\partial_{KK}C \geq 0\))해야 하는지를, "밀도는 음수가 될 수 없다"는 논리와 "버터플라이 스프레드 차익거래"의 두 가지 관점에서 설명하라.
Breeden-Litzenberger에 의해 \(f_{S_T}(K) = \frac{1}{D_d}\frac{\partial^2 C}{\partial K^2}\)이다. 확률 밀도는 정의상 비음수(\(f_{S_T}(K) \geq 0\))이어야 한다. 왜냐하면 확률 밀도는 "그 구역에서 실현될 확률을 단위 폭으로 나눈 것"이므로 음수가 될 수 없기 때문이다. 할인인자 \(D_d > 0\)이므로 \(\frac{\partial^2 C}{\partial K^2} = D_d \cdot f_{S_T}(K) \geq 0\)이 된다. 즉, 콜 가격의 볼록성은 확률 밀도의 비음수성과 동치다.
행사가격 \(K - \epsilon, K, K + \epsilon\) (\(\epsilon > 0\))의 세 콜을 생각하자. 다음 버터플라이(butterfly) 포트폴리오를 구성한다:
- \(K - \epsilon\) 콜 1개 매수 (비용 \(+C(K-\epsilon)\))
- \(K\) 콜 2개 매도 (수입 \(-2C(K)\))
- \(K + \epsilon\) 콜 1개 매수 (비용 \(+C(K+\epsilon)\))
이 포트폴리오의 만기 페이오프는 항상 \(\geq 0\)이다 (삼각형 형태의 비음수 페이오프). 무차익 조건에 의해 이런 포트폴리오의 현재 비용도 \(\geq 0\)이어야 한다:
$$C(K-\epsilon) - 2C(K) + C(K+\epsilon) \geq 0$$이것을 \(\epsilon^2\)으로 나누고 \(\epsilon \to 0\) 극한을 취하면 정확히 \(\partial_{KK}C \geq 0\)이 된다.
문제 11-3: CEV 모형의 로컬볼 계산 (난이도: 중)
CEV 모형 \(dS_t = \sigma S_t^\beta dW_t\) (금리 0)에서 \(\sigma = 0.30\), \(\beta = 0.5\), 현재 스팟 \(S_0 = 100\)이다. (a) 로컬 변동성 함수 \(\sigma_{\text{loc}}(S)\)를 구하라. (b) \(S = 80, 100, 120\)에서의 로컬볼 값을 계산하라. (c) 이것이 어떤 종류의 스마일을 생성하는지 설명하라.
CEV의 확산 항: \(\sigma S_t^\beta dW_t\). 이것을 \(\sigma_{\text{loc}}(S) \cdot S \cdot dW_t\) 형태로 쓰면:
$$\sigma_{\text{loc}}(S) \cdot S = \sigma S^\beta \implies \sigma_{\text{loc}}(S) = \sigma S^{\beta - 1} = 0.30 \cdot S^{-0.5}$$로컬볼이 \(S\)가 낮을수록 높고 \(S\)가 높을수록 낮다. 이것이 낮은 행사가 옵션의 내재변동성을 높이고 높은 행사가 옵션의 내재변동성을 낮춘다. 결과적으로 음의 스큐(negative skew) / 레버리지 효과(leverage effect)가 나타난다. 주식 지수 옵션에서 관찰되는 전형적 스큐 패턴이다.
| 스팟 수준 \(S\) | 로컬볼 \(\sigma_{\text{loc}}(S)\) | 대략적 내재변동성 방향 |
|---|---|---|
| 80 (하락) | 33.54% | 높음 (깊은 OTM 풋 방향) |
| 100 (ATM) | 30.00% | 기준 (ATM) |
| 120 (상승) | 27.39% | 낮음 (깊은 OTM 콜 방향) |
문제 11-4: 로컬볼 공식의 무차익 조건 적용 (난이도: 중상)
다음 두 가지 경우에서 Dupire 로컬볼을 계산하고, 무차익 조건 위반 여부를 판단하라. 금리는 0으로 가정한다. (a) \(\partial_T C = 0.03\), \(\partial_{KK}C = 0.02\), \(K = 100\) (b) \(\partial_T C = 0.01\), \(\partial_{KK}C = -0.005\), \(K = 100\)
금리 0의 Dupire 공식: \(\sigma_{\text{loc}}^2 = \frac{2\partial_T C}{K^2\partial_{KK}C}\)
$$\sigma_{\text{loc}}^2(100) = \frac{2 \times 0.03}{100^2 \times 0.02} = \frac{0.06}{200} = 0.0003$$ $$\sigma_{\text{loc}}(100) = \sqrt{0.0003} \approx 0.01732 = 1.732\%$$분자(\(0.06 > 0\))와 분모(\(200 > 0\)) 모두 양수이므로, 로컬분산이 양수다. 무차익 조건 만족.
로컬분산이 음수! 이것은 물리적으로 불가능하다. 분모 \(\partial_{KK}C = -0.005 < 0\)이므로 콜 표면이 오목(concave)하다는 의미이며, Breeden-Litzenberger에 의해 이 구간에서 밀도가 음수임을 의미한다. 즉, 버터플라이 차익거래가 가능한 표면이다. 반드시 표면을 수정해야 한다.
12. 흔한 함정과 오해 정리
가장 흔하고 치명적인 오해다. IV는 \((K, T)\) 좌표의 양으로 "만기까지의 평균 효과"이고, 로컬볼은 \((S, t)\) 좌표의 양으로 "순간 상태별 확산 강도"다. 두 양은 Dupire 공식으로 연결되지만, 결코 같지 않다. 특히 "같은 만기의 ATM IV를 로컬볼에 직접 대입하는" 방식은 명백한 오류다.
로컬볼 모형은 유럽형 옵션 가격에서는 완벽하지만, 경로의존 옵션에서는 확률변동성 모형과 다른 가격을 줄 수 있다. 이 차이는 모형의 결함이 아니라, 로컬볼 모형이 "확률변동성의 조건부 평균"을 쓴다는 사실에서 비롯된다. 특히 vol-of-vol 효과(분산의 분산)가 중요한 클리켓, 레인지 어크루얼 등에서 차이가 크다.
현실에서는 유한한 만기와 행사가격 범위에서만 옵션이 관찰된다. Dupire 공식이 요구하는 "전체 \((K, T)\) 평면"의 표면을 구성하려면 외삽이 필수적이다. 이 외삽의 선택이 로컬볼의 날개(wing) 및 장기 거동에 결정적 영향을 미친다. 외삽 처리를 소홀히 하면 장기 경로의존 상품 가격에 큰 오차가 발생한다.
IV를 선형 보간하면 \(\partial_{KK}\sigma\)가 불연속(보간 구간 경계에서 점프)하고, 이를 통해 계산한 \(\partial_{KK}C\)가 불안정해진다. 로컬볼은 이 불안정성을 크게 증폭시켜 의미 없는 값을 줄 수 있다. 분산(\(\sigma^2 T\))을 선형 보간하는 것이 더 낫지만, 가장 안정적인 방법은 분석적 미분이 가능한 파라메트릭 표현을 쓰는 것이다.
FX 시장에서 스팟 델타, 선물 델타, PA 델타는 같은 "25델타"라도 서로 다른 스트라이크를 의미한다. 이 차이를 무시하면 스마일 표면 구축 단계에서 스트라이크가 틀려지고, 결국 로컬볼 전체가 틀려진다. 특히 1년 이상의 장기 만기에서 이 차이가 의미 있는 수준이 된다.
음수 로컬분산을 클리핑하면 "유럽형 가격을 정확히 재현"하는 로컬볼의 핵심 성질이 파괴된다. 올바른 접근은 항상 "표면 자체를 무차익으로 수정"하는 것이며, 이것이 어렵다면 파라메트릭 피팅을 통해 표면 자체에 무차익 제약을 부과하는 것이다.
13. 핵심 공식 및 개념 요약
| 개념 | 핵심 공식 / 정의 | 의미 및 주의점 |
|---|---|---|
| Dupire 로컬볼 (금리 0) | \(\sigma_{\text{loc}}^2 = \dfrac{2\partial_T C}{K^2\partial_{KK}C}\) | 분자 양수, 분모 양수가 무차익 조건 |
| Dupire 로컬볼 (FX) | \(\sigma_{\text{loc}}^2 = \dfrac{\partial_T C + (r_d-r_f)K\partial_K C + r_f C}{\frac{1}{2}K^2\partial_{KK}C}\) | 드리프트 보정 항 포함 |
| Breeden–Litzenberger | \(f_{S_T}(K) = \dfrac{1}{D_d}\dfrac{\partial^2 C}{\partial K^2}\) | 옵션 가격 → 위험중립 밀도 |
| Fokker–Planck | \(\partial_t p = -\partial_x(ap) + \frac{1}{2}\partial_{xx}(b^2 p)\) | 밀도의 시간 진화 법칙 |
| 조건부 기대값 해석 | \(\sigma_{\text{loc}}^2(K,T) = \mathbb{E}[v_T \mid S_T = K]\) | 확률변동성의 압축된 표현 |
| Forward Volatility | \(\sigma_{\text{fwd}}^2 = \dfrac{T_2\sigma_2^2 - T_1\sigma_1^2}{T_2-T_1}\) | 분산은 가법적; 분산 공간에서 선형 보간 |
| IV Term Structure | \(\sigma_{\text{imp}}(T) = \sqrt{\frac{1}{T}\int_0^T\sigma_t^2\,dt}\) | 만기까지의 순간분산의 RMS |
| CEV 로컬볼 | \(\sigma_{\text{loc}}(S) = \sigma S^{\beta-1}\) | \(\beta<1\) → 음의 스큐 생성 |
| 로그 모니니스 | \(x = \ln(K/F_T)\), \(F_T = S_0 e^{(r_d-r_f)T}\) | 수식 단순화, 수치 안정성 향상 |
| 무차익 볼록성 조건 | \(\partial_{KK}C \geq 0\) | 버터플라이 차익거래 방지 |
14. 암기 체크리스트
| 번호 | 체크 항목 | 확인 |
|---|---|---|
| 1 | 내재변동성(IV)과 로컬볼(LV)의 좌표(\((K,T)\) vs \((S,t)\))와 경제적 의미 차이를 설명할 수 있는가? | |
| 2 | Fokker–Planck 방정식을 테스트 함수를 이용해 유도하고, 각 항(드리프트·확산)의 물리적 의미를 설명할 수 있는가? | |
| 3 | Breeden–Litzenberger 공식을 유도하고, "\(\partial_{KK}C\geq 0\)이 밀도 비음수성과 동치"임을 설명할 수 있는가? | |
| 4 | 금리 0의 Dupire 공식을 Fokker–Planck + Breeden–Litzenberger 두 단계로 유도할 수 있는가? | |
| 5 | FX Dupire 공식에서 분자의 세 항(\(\partial_T C\), \((r_d-r_f)K\partial_K C\), \(r_f C\))이 각각 무엇을 보정하는지 설명할 수 있는가? | |
| 6 | 로컬분산이 "조건부 기대 분산"임을 이해하고, 이것이 경로의존 상품에서 로컬볼의 한계를 설명하는지 말할 수 있는가? | |
| 7 | Forward Volatility 공식을 "분산의 가법성"에서 유도할 수 있는가? IV가 아닌 분산 공간에서 보간해야 하는 이유를 알고 있는가? | |
| 8 | FX 옵션이 델타로 인용되는 이유와, 델타 컨벤션(스팟/선물/PA)에 따라 스트라이크가 달라진다는 것을 설명할 수 있는가? | |
| 9 | CEV 모형의 로컬볼 형태(\(\sigma S^{\beta-1}\))와 \(\beta < 1\)이 음의 스큐를 만드는 메커니즘을 설명할 수 있는가? | |
| 10 | 수치적으로 로컬볼 계산 시 음수 로컬분산이 나타나는 원인과 올바른 처리 방법(클리핑이 아닌 표면 수정)을 알고 있는가? | |
| 11 | 스플라인 보간이 무차익을 자동으로 보장하지 않으므로 SVI나 SABR 등 파라메트릭 표현이 더 안정적인 이유를 설명할 수 있는가? | |
| 12 | Ito의 공식에서 \((dW_t)^2 = dt\)가 왜 성립하고, 이것이 Ito 보정항과 Fokker–Planck 방정식 유도에 어떻게 연결되는지 추적할 수 있는가? |
15. 다음 장으로의 연결
이 장의 핵심 메시지를 한 문장으로 요약하면: "시장의 유럽형 옵션 가격표면은 이미 미래 분포를 담고 있으며, 이 분포를 1차원 마르코프 확산으로 표현하는 유일한 확산계수(로컬볼)를 Dupire 공식으로 역산할 수 있다. 이 로컬볼은 유럽형 옵션의 완벽한 캘리브레이션 도구이지만, 경로의존 상품에서는 동학의 평균화로 인한 한계를 가진다."
Chapter 5 (이 장): 로컬 변동성의 이론적 구성과 Dupire 공식. IV와 로컬볼의 관계. FX 실무 관행. 수치 구현의 함정.
다음 장 — 확률변동성 모형(Stochastic Volatility Models): 로컬볼의 근본적 한계인 "vol-of-vol을 포착하지 못함"을 해결하기 위해, 변동성 \(v_t\)가 별도의 확률과정을 따르는 모형을 도입한다. Heston 모형은 \(v_t\)가 CIR 과정을 따르며, 분석적으로 다루기 좋은 특성으로 인해 가장 널리 사용된다. SABR 모형은 베가의 동학을 명시적으로 다루며 금리 파생상품에서 표준이 되었다.
이후 장 — 로컬-확률변동성(LSV) 모형: 로컬볼과 확률변동성을 결합한 모형으로, \(dS = \sigma_{\text{loc}}(S, t)\sqrt{v_t}S\,dW^S\), \(dv_t = (\ldots)dt + \xi\sqrt{v_t}dW^v\) 형태다. 이 모형은 (1) 유럽형 가격은 로컬볼 덕분에 완벽하게 맞추고, (2) 경로의존 동학은 확률변동성 덕분에 더 현실적으로 표현한다. 단, 캘리브레이션이 더 복잡하며, 로컬볼 "leverage function"을 별도로 결정해야 한다.
변동성 파생상품(Vol Derivatives): VIX 선물, 분산 스왑, 변동성 스왑 등은 "변동성 그 자체"가 기초자산인 상품이다. 이 상품들의 가격결정에는 확률변동성 모형이 필수적이며, 로컬볼 모형만으로는 부족하다. 이것이 로컬볼을 넘어 확률변동성으로 발전하는 실질적 동기이기도 하다.
'Financial Engineering > Foreign exchange option pricing' 카테고리의 다른 글
| Chapter 7. Numerical Methods for Pricing and Calibration (0) | 2026.02.19 |
|---|---|
| Chapter6. Stochastic Volatility (0) | 2026.02.19 |
| Chapter 4. Volatility Surface Construction (0) | 2026.02.19 |
| Chapter 3. Deltas and Market Conventions (0) | 2026.02.19 |
| Chapter 2. Mathematical Preliminaries (0) | 2026.02.19 |