Algorithmic and High-Frequency Trading
Chapter 7 — Optimal Execution with Continuous Trading II
Part A — 선수지식
1. 확률공간, 여과, 적응성, 브라운 운동
정의 1.1 확률공간은 \((\Omega,\mathcal F,\mathbb P)\)이다. 여과 \((\mathcal F_t)_{t\ge 0}\)는 \(s\le t\Rightarrow \mathcal F_s\subseteq \mathcal F_t\)를 만족하는 \(\sigma\)-대수의 증가족이다. 확률과정 \(X=(X_t)\)가 적응적(adapted)이라는 말은 모든 \(t\)에서 \(X_t\)가 \(\mathcal F_t\)-가측이라는 뜻이다.
정의 1.2 표준 브라운 운동 \(W=(W_t)_{t\ge 0}\)은 다음을 만족하는 연속 확률과정이다. (i) \(W_0=0\) a.s., (ii) 증가분 \(W_t-W_s\sim N(0,t-s)\), (iii) 서로 겹치지 않는 구간의 증가분은 독립, (iv) 거의 확실하게 경로가 연속.
정리 1.3 브라운 운동은 \((\mathcal F_t^W)\)-마팅게일이다.
증명 \(s\le t\)를 고정한다. \(W_t=W_s+(W_t-W_s)\)이고, 브라운 운동의 독립 증가분 성질에 의해 \(W_t-W_s\)는 \(\mathcal F_s^W\)와 독립이며 평균이 0이다. 따라서
$$E[W_t\mid \mathcal F_s^W]=E[W_s+(W_t-W_s)\mid \mathcal F_s^W]=W_s+E[W_t-W_s\mid \mathcal F_s^W]=W_s.$$
또한 \(E|W_t|<\infty\)이므로 마팅게일의 적분가능성도 만족한다.
2. Itô 적분과 Itô 보조정리
정의 2.1 단순 예측가능 과정 \(H_t=\sum_{i=0}^{n-1}H_i 1_{(t_i,t_{i+1}]}(t)\)에 대해 Itô 적분을
$$\int_0^T H_t\,dW_t:=\sum_{i=0}^{n-1}H_i(W_{t_{i+1}}-W_{t_i})$$
로 정의한다. 일반적인 \(L^2\)-예측가능 과정은 단순 과정으로 근사하여 완비화로 정의한다.
정리 2.2 (Itô 등거리식) \(H\in L^2([0,T]\times\Omega)\)이면
$$E\left[\left(\int_0^T H_t\,dW_t\right)^2\right]=E\left[\int_0^T H_t^2\,dt\right].$$
증명 먼저 단순 과정에서 보인다. 위 정의를 쓰면
$$I:=\int_0^T H_t\,dW_t=\sum_{i=0}^{n-1}H_i\Delta W_i,\qquad \Delta W_i:=W_{t_{i+1}}-W_{t_i}.$$
따라서
$$I^2=\sum_i H_i^2(\Delta W_i)^2+2\sum_{i<j}h_ih_j\delta p="" w_i\delta="" w_j.$$<="">
기댓값을 취한다. \(H_i\)는 \(\mathcal F_{t_i}\)-가측이고 \(\Delta W_i\)는 평균 0, 분산 \(t_{i+1}-t_i\)를 가진다. 또한 \(i<j\)이면 0이고,="" 0이다.="" \(\delta="" \(\mathcal="" \(h_i\delta="" f_{t_j}\)-가측이므로="" f_{t_j}\)에="" p="" w_ih_j\)는="" w_j\)는="" 교차항의="" 기댓값은="" 대해="" 따라서<="" 평균="">
$$E[I^2]=\sum_i E[H_i^2]E[(\Delta W_i)^2]=\sum_i E[H_i^2](t_{i+1}-t_i)=E\left[\int_0^T H_t^2\,dt\right].$$
일반적인 \(L^2\)-예측가능 과정은 단순 과정 근사와 양변의 연속성으로 결론이 따라온다.
</j\)이면>
</j}h_ih_j\delta>
정리 2.3 (Itô 보조정리) \(dX_t=b(t,X_t)dt+\sigma(t,X_t)dW_t\)이고 \(f\in C^{1,2}\)이면
$$df(t,X_t)=\left(f_t+b f_x+\tfrac12\sigma^2 f_{xx}\right)dt+\sigma f_x\,dW_t.$$
3. 정지시간, 멈춘 과정, 수렴정리, 임의정지정리
아래 두 묶음은 사용자가 제공한 정리본을 그대로 살려 넣었다. Chapter 7에서는 가격제한 문제에서 hitting time, order-flow 문제에서 조건부기대 표현, Appendix 수준의 마팅게일 조작이 모두 반복적으로 등장하므로 이 부분이 빠지면 뒤의 서술이 빈다.
금융공학에서 “위험중립측도 하의 할인된 자산가격이 마팅게일”이라는 말은, 현재 정보로 본 미래의 평균(기댓값)이 현재 가격과 일치한다는 공정성(Fairness)을 뜻합니다. 그렇다면 자연스러운 질문이 생깁니다.
“우리가 임의의 시점 $\tau$에 거래/계약을 종료(정지)해도, 이 공정성은 유지되는가?”
이 질문에 답하는 핵심 도구가 임의정지정리(Optional Stopping Theorem, OST)이고, 그 논리의 심장부에는 수렴 정리(Convergence Theorems)—특히 DCT—가 있습니다. 이 글에서는 (1) 수렴정리의 역할, (2) OST의 3가지 충분조건과 “왜 필요한지”의 완전 증명, (3) “더블업(마틴게일 베팅)” 역설의 계산을 끝까지, (4) 대칭 랜덤워크 장벽도달시간 $E[\tau]=k^2$의 모든 중간단계, (5) 코사인 마팅게일로 $E[(-1)^\tau]=(-1)^k$의 모든 중간단계를 생략 없이 정리합니다.
0. 큰 그림: “극한”과 “기댓값”의 순서를 바꿔도 되는가?
OST의 표준 증명 구조는 대부분 다음 한 줄로 요약됩니다.
$$E(M_{\tau\wedge n}) = E(M_0)\quad(\forall n),\quad \text{그리고 }n\to\infty\text{로 보내 }E(M_\tau)=E(M_0).$$
그런데 여기서 핵심 난제는 바로 이것입니다.
$$\lim_{n\to\infty}E(M_{\tau\wedge n}) \overset{?}{=} E\!\left(\lim_{n\to\infty} M_{\tau\wedge n}\right)=E(M_\tau).$$
즉, 극한과 기댓값(적분)의 교환이 정당화돼야 OST가 “진짜로” 성립합니다. 그래서 수렴정리가 중요합니다.
1. 수렴 정리(Convergence Theorems) : OST 증명의 엔진
1.1 단조 수렴 정리 (MCT)
정리 (MCT)
$X_n\ge 0$이고 $X_n\uparrow X$ a.s.이면,
$$\lim_{n\to\infty}E[X_n]=E[X].$$
OST에서의 역할: $\tau\wedge n\uparrow \tau$처럼 “점점 덜 자르는” 절단(truncation)에서 자주 등장합니다.
1.2 파투의 보조정리 (Fatou)
정리 (Fatou)
$X_n\ge 0$이면,
$$E(\liminf_{n\to\infty}X_n)\le \liminf_{n\to\infty}E[X_n].$$
OST에서의 역할: 극한 교환이 “완전 동일”하지 않더라도, 최소한의 경계(하한)를 제공해 논리의 안전장치가 됩니다.
1.3 지배 수렴 정리 (DCT)
정리 (DCT)
$X_n\to X$ a.s., $|X_n|\le Y$ (모든 $n$), 그리고 $E[Y]<\infty$이면,
$$\lim_{n\to\infty}E[X_n]=E[X].$$
OST에서의 역할: $M_{\tau\wedge n}\to M_\tau$를 기대값으로 옮기는 “결정타”입니다.
2. 임의정지정리(OST)의 이론적 기초
2.1 필수 개념: 필트레이션/마팅게일/정지시간
- 확률공간: $(\Omega,\mathcal F,\mathbb P)$
- 필트레이션 $(\mathcal F_n)_{n\ge 0}$: 시간이 지날수록 정보가 증가. $\mathcal F_0\subseteq\mathcal F_1\subseteq\cdots$
- 적응(adapted): $X_n$이 $\mathcal F_n$-가측이면 “$n$시점 정보로 $X_n$을 안다”.
- 마팅게일 $(M_n)$: (i) $E|M_n|<\infty$, (ii) $M_n$은 adapted, (iii) $E(M_{n+1}\mid\mathcal F_n)=M_n$.
- 정지시간(stopping time) $\tau$: 모든 $n$에 대해 $\{\tau\le n\}\in\mathcal F_n$.
2.2 $\tau\wedge n$이 정지시간임을 먼저 확인
OST에서는 항상 $\tau_n:=\tau\wedge n$를 쓰는데, 이 자체가 정지시간인지부터 확인해야 합니다.
사실: $\tau$가 정지시간이면 $\tau\wedge n$도 정지시간
임의의 $m$에 대해
$$\{\tau\wedge n \le m\}=\big(\{\tau\le m\}\cap\{n\le m\}\big)\;\cup\;\big(\{n\le m\}\cap\{\tau>m\}\big)\;\cup\;\big(\{n>m\}\cap\{\tau\le m\}\big).$$
더 간단히는 다음이 핵심입니다.
$$\{\tau\wedge n \le m\}=\{\tau\le m\}\cup\{n\le m\}.$$
왜냐하면 $\min(\tau,n)\le m$이면 “$\tau\le m$ 또는 $n\le m$”가 반드시 성립하고, 반대로도 성립합니다. 여기서 $\{\tau\le m\}\in\mathcal F_m$, $\{n\le m\}$은 확률과 무관한 확정 사건이므로(상수), 결국 $\{\tau\wedge n \le m\}\in\mathcal F_m$입니다.
2.3 멈춘 과정(Stopped process) 정의
정지시간 $\tau$에서 멈춘(혹은 $n$에서 강제 종료한) 과정은
$$M_{\tau\wedge n} = M_n\mathbf 1_{\{\tau>n\}} + M_\tau\mathbf 1_{\{\tau\le n\}}.$$
이 항등식은 “$\tau>n$이면 아직 멈추지 않았으니 $M_n$, $\tau\le n$이면 이미 멈췄으니 $M_\tau$”를 정확히 표현한 것입니다.
2.4 $M_{\tau\wedge n}$은 마팅게일이다
많이 생략되지만, 여기서도 조건부기대값을 직접 계산해보면 가장 명확합니다.
정리: $M$이 마팅게일이면 $M_{\tau\wedge n}$도 마팅게일
$\mathcal G_n:=\mathcal F_n$에 대해 $E(M_{\tau\wedge (n+1)}\mid\mathcal F_n)=M_{\tau\wedge n}$를 보이면 됩니다. 사건 $\{\tau\le n\}$와 $\{\tau>n\}$로 나눕니다.
(1) $\{\tau\le n\}$에서
$\tau\le n$이면 $\tau\wedge(n+1)=\tau$이고 $\tau\wedge n=\tau$이므로 $M_{\tau\wedge(n+1)}=M_\tau=M_{\tau\wedge n}$. 또한 $\mathbf1_{\{\tau\le n\}}$은 $\mathcal F_n$-가측입니다(정지시간 정의). 따라서 이 사건 위에서는 조건부기대값이 그대로 유지됩니다.
(2) $\{\tau>n\}$에서
이 사건에서는 $\tau\wedge n=n$, 즉 $M_{\tau\wedge n}=M_n$입니다. 한편 $\tau\wedge(n+1)$은 두 경우:
- $\tau>n+1$이면 $M_{\tau\wedge(n+1)}=M_{n+1}$
- $\tau=n+1$이면 $M_{\tau\wedge(n+1)}=M_{n+1}$ (어차피 $\tau\wedge(n+1)=n+1$)
따라서 $\{\tau>n\}$에서는 항상 $M_{\tau\wedge(n+1)}=M_{n+1}$가 됩니다. 그러므로
$$E(M_{\tau\wedge(n+1)}\mid\mathcal F_n)=E(M_{n+1}\mid\mathcal F_n)=M_n=M_{\tau\wedge n}.$$
두 사건을 합치면 모든 $\omega$에 대해 성립하므로 $M_{\tau\wedge n}$은 마팅게일입니다.
2.5 따라서 $E(M_{\tau\wedge n})=E(M_0)$
마팅게일이면 기대값은 시간에 따라 일정합니다. 이를 “조건부기대값→전체기대값”으로 끝까지 적어보면:
$$E(M_{n+1})=E(E(M_{n+1}\mid\mathcal F_n))=E(M_n).$$
따라서 귀납적으로 $E(M_n)=E(M_0)$. 특히 $M_{\tau\wedge n}$도 마팅게일이므로
$$E(M_{\tau\wedge n})=E(M_0)\quad(\forall n).$$
2.6 이제 남은 것은 “극한 교환” (수렴정리)
항등식으로 분해하면 항상
$$E[M_{\tau\wedge n}]=E[M_\tau\mathbf1_{\{\tau\le n\}}]+E[M_n\mathbf1_{\{\tau>n\}}].$$
따라서 $n\to\infty$에서 $E[M_{\tau\wedge n}]\to E[M_\tau]$를 얻으려면, (첫 항이 $E[M_\tau]$로 가고, 둘째 항이 0으로 가야 합니다.)
2.7 OST 적용을 위한 3가지 충분 조건
OST를 $E[M_\tau]=E[M_0]$ 형태로 얻기 위한 실전형 충분조건
- (C1) $\tau<\infty$ a.s. : 거의 확실하게 유한 시간에 멈춘다.
- (C2) $M_\tau$ 적분가능 : $E[|M_\tau|]<\infty$.
- (C3) 꼬리항 소멸 : $\lim_{n\to\infty}E[M_n\mathbf 1_{\{\tau>n\}}]=0$.
(증명) (C1)(C2)로 첫 항의 극한
$X_n:=M_\tau\mathbf1_{\{\tau\le n\}}$를 두면, (C1) 때문에 $\mathbf1_{\{\tau\le n\}}\uparrow 1$ a.s.이고 따라서 $X_n\to M_\tau$ a.s. 또한 $|X_n|\le |M_\tau|$이고 (C2)로 $E|M_\tau|<\infty$. 그러므로 DCT에 의해
$$E[M_\tau\mathbf1_{\{\tau\le n\}}]=E[X_n]\longrightarrow E[M_\tau].$$
(증명) (C3)로 둘째 항의 극한
(C3)가 바로 $\lim_{n\to\infty}E[M_n\mathbf1_{\{\tau>n\}}]=0$을 의미합니다.
(결론)
따라서
$$\lim_{n\to\infty}E[M_{\tau\wedge n}]=E[M_\tau]+0=E[M_\tau].$$
그런데 좌변은 항상 $E[M_0]$였으므로 $E[M_\tau]=E[M_0]$.
금융공학적 해석
위 조건들은 “무한한 자본/레버리지” 같은 비현실적 가정 하에서 발생하는 필승 전략을 배제합니다. 즉, 현실적인 거래 범위(적분가능성/꼬리 제어) 안에서만 마팅게일의 공정성이 “정지 후에도” 유지된다는 뜻입니다.
3. 함정 사례: “더블업(마틴게일 베팅)”은 왜 OST를 깨는가?
3.1 설정: 예측가능(predictable) 베팅과 자산 과정
동전던지기 게임에서 $\eta_n\in\{+1,-1\}$ (각각 확률 $1/2$)라 하자. 정보는 $\mathcal F_n=\sigma(\eta_1,\dots,\eta_n)$. 베팅 크기를
$$\alpha_n=2^{n-1}\in \mathcal F_{n-1}$$
로 두고 자산을
$$S_n=\sum_{k=1}^n \alpha_k \eta_k$$
로 정의합니다. (즉 $S_n=S_{n-1}+\alpha_n\eta_n$)
3.2 (완전 증명) $S_n$은 마팅게일
조건부기대값을 직접 계산합니다.
$$\begin{align} E(S_n\mid\mathcal F_{n-1}) &=E(S_{n-1}+\alpha_n\eta_n\mid\mathcal F_{n-1})\\ &=S_{n-1}+\alpha_nE(\eta_n\mid\mathcal F_{n-1}). \end{align}$$
여기서 $\eta_n$은 과거와 독립이며 $E[\eta_n]=0$이므로 $E(\eta_n\mid\mathcal F_{n-1})=0$. 따라서
$$E(S_n\mid\mathcal F_{n-1})=S_{n-1}.$$
즉 $S_n$은 마팅게일입니다.
3.3 정지 규칙: 처음 이기는 순간 멈춤
$$\tau=\min\{n\ge 1:\eta_n=+1\}.$$
이때 $\tau$는 정지시간입니다. 왜냐하면 $\{\tau\le n\}=\{\eta_1=+1\}\cup\cdots\cup\{\eta_n=+1\}\in\mathcal F_n$.
3.4 $S_\tau=1$이 항상 성립
$\tau=n$이면 $\eta_1=\cdots=\eta_{n-1}=-1$, $\eta_n=+1$입니다. 따라서
$$\begin{align} S_\tau=S_n &=\sum_{k=1}^{n-1}2^{k-1}(-1)+2^{n-1}(+1)\\ &=-(2^{n-1}-1)+2^{n-1}=1. \end{align}$$
즉 어떤 $n$에서 이기든 최종 자산은 항상 $1$입니다. 따라서 $E|S_\tau|=1<\infty$.
3.5 그런데 왜 $E(S_\tau)=E(S_0)$가 깨질까? (C3가 깨짐을 “식으로” 확인)
먼저 $\{\tau>n\}$은 “$n$번 연속 패배”이므로
$$P(\tau>n)=P(\eta_1=-1,\dots,\eta_n=-1)=\left(\frac12\right)^n.$$
그리고 그 사건 위에서 자산은
$$\begin{align} S_n &=\sum_{k=1}^{n}2^{k-1}(-1)=-(2^n-1)=1-2^n. \end{align}$$
따라서 꼬리항은
$$\begin{align} E[S_n\mathbf1_{\{\tau>n\}}] &=(1-2^n)\cdot P(\tau>n)\\ &=(1-2^n)\left(\frac12\right)^n\\ &=\frac1{2^n}-1\;\longrightarrow\;-1\ne 0. \end{align}$$
3.6 $E(S_{\tau\wedge n})=0$인데, $n\to\infty$ 극한에서 $E(S_\tau)=1$로 “점프”하는 구조
$S_{\tau\wedge n}=S_\tau\mathbf1_{\{\tau\le n\}}+S_n\mathbf1_{\{\tau>n\}}$이므로
$$E[S_{\tau\wedge n}]=E[S_\tau\mathbf1_{\{\tau\le n\}}]+E[S_n\mathbf1_{\{\tau>n\}}].$$
각 항을 정확히 계산하면
- $S_\tau=1$이므로 $E[S_\tau\mathbf1_{\{\tau\le n\}}]=P(\tau\le n)=1-(1/2)^n$
- 위에서 $E[S_n\mathbf1_{\{\tau>n\}}]=2^{-n}-1$
따라서 합은
$$(1-2^{-n})+(2^{-n}-1)=0.$$
즉 모든 $n$에서 $E[S_{\tau\wedge n}]=0=E[S_0]$로 “공정성”이 유지됩니다. 그러나 $n\to\infty$에서
- $E[S_\tau\mathbf1_{\{\tau\le n\}}]\to 1$
- $E[S_n\mathbf1_{\{\tau>n\}}]\to -1$
둘째 항이 0으로 사라지지 않기 때문에(=C3 실패), $E[S_{\tau\wedge n}]\to E[S_\tau]$가 불가능해집니다.
결론
$\tau<\infty$이고 $S_\tau$가 적분가능해도, 꼬리항이 0으로 사라지지 않으면 OST는 실패합니다. 더블업 전략은 “이길 때는 항상 +1”이지만, 지기만 하면 자산이 기하급수적으로 폭발(음의 방향)하여 꼬리가 절대 사라지지 않습니다.
4. 예제 1: 대칭 랜덤워크가 $\pm k$에 닿는 평균시간 $E[\tau]=k^2$
4.1 설정
대칭 랜덤워크
$$S_0=0,\qquad S_n=\eta_1+\cdots+\eta_n,\quad P(\eta_i=\pm1)=\frac12.$$
장벽 도달시간(정지시간)
$$\tau=\min\{n\ge 0:|S_n|=k\},\quad k\in\mathbb Z^+.$$
4.2 (1) $\tau$가 정지시간임을 확인
$\{\tau\le n\}$은 “$0$부터 $n$ 사이 어딘가에서 $|S_m|=k$를 만족하는 $m$이 존재”라는 사건이므로
$$\{\tau\le n\}=\bigcup_{m=0}^n\{|S_m|=k\}.$$
각 사건 $\{|S_m|=k\}$는 $S_m$이 $\mathcal F_m$-가측이고 $\mathcal F_m\subseteq\mathcal F_n$이므로 $\mathcal F_n$에 속합니다. 유한 합집합이므로 $\{\tau\le n\}\in\mathcal F_n$. 따라서 $\tau$는 정지시간입니다.
4.3 (2) $\tau<\infty$ a.s.
길이 $2k$짜리 블록을 생각합니다. 한 블록 안에서 “전부 +1”이면 부분합이 $0,1,2,\dots,2k$로 증가하므로 중간에 반드시 $k$를 지나며(따라서 $|S|=k$ 도달), “전부 -1”이어도 마찬가지로 $-k$를 지나게 됩니다.
이제 $n$개의 블록(총 $2kn$번 던지기)을 봅시다. 사건
$$A_j=\{\text{$j$번째 블록(길이 $2k$)이 모두 +1}\}$$
를 두면 $P(A_j)=(1/2)^{2k}$. 그리고
$$\{\tau>2kn\}\subseteq \bigcap_{j=1}^n A_j^c.$$
왜냐하면 $\tau>2kn$이면, 처음 $2kn$번 동안 한 번도 $\pm k$에 닿지 않았다는 뜻인데, 어떤 블록이 전부 +1이면 그 블록 중간에 반드시 $+k$를 지나므로 모순입니다. 따라서 모든 블록에서 $A_j$가 일어나면 안 됩니다.
블록들은 서로 독립이므로
$$\begin{align} P(\tau>2kn) &\le P\!\left(\bigcap_{j=1}^n A_j^c\right) =\prod_{j=1}^n (1-P(A_j)) =\left(1-\left(\frac12\right)^{2k}\right)^n \longrightarrow 0. \end{align}$$
따라서
$$P(\tau=\infty)=P\Big(\bigcap_{n\ge 1}\{\tau>2kn\}\Big)=\lim_{n\to\infty}P(\tau>2kn)=0.$$
즉 $\tau<\infty$ a.s.
4.4 (3) $S_n$과 $M_n=S_n^2-n$이 마팅게일
사실 1: $S_n$은 마팅게일
$S_{n+1}=S_n+\eta_{n+1}$이고 $E(\eta_{n+1}\mid\mathcal F_n)=0$이므로
$$E(S_{n+1}\mid\mathcal F_n)=S_n.$$
사실 2: $M_n=S_n^2-n$은 마팅게일
먼저 전개:
$$S_{n+1}^2=(S_n+\eta_{n+1})^2=S_n^2+2S_n\eta_{n+1}+\eta_{n+1}^2=S_n^2+2S_n\eta_{n+1}+1.$$
조건부기대값:
$$\begin{align} E(S_{n+1}^2\mid\mathcal F_n) &=S_n^2+2S_nE(\eta_{n+1}\mid\mathcal F_n)+1 =S_n^2+1. \end{align}$$
따라서
$$E(M_{n+1}\mid\mathcal F_n)=E(S_{n+1}^2-(n+1)\mid\mathcal F_n)=(S_n^2+1)-(n+1)=S_n^2-n=M_n.$$
4.5 (4) “가장 안전한 루트”: $\tau_n=\tau\wedge n$에 OST 적용
$\tau_n:=\tau\wedge n$은 유계 정지시간이므로(항상 $\le n$), 마팅게일 $M_n$에 대해 다음이 성립합니다.
$$E[M_{\tau_n}]=E[M_0].$$
여기서 $M_0=S_0^2-0=0$. 따라서
$$E[S_{\tau_n}^2-\tau_n]=0\quad\Rightarrow\quad E[\tau_n]=E[S_{\tau_n}^2].$$
4.6 (5) $E[\tau]<\infty$를 보이는 두 가지 방법
방법 A (가장 깔끔, 논리순환 없음): $\tau_n$에서 바로 유계성
$\tau_n$ 시점은 장벽을 넘지 않았으므로 항상 $|S_{\tau_n}|\le k$. 따라서 $S_{\tau_n}^2\le k^2$이고
$$E[\tau_n]=E[S_{\tau_n}^2]\le k^2.$$
$\tau_n\uparrow \tau$이므로 MCT(또는 단조수렴)로
$$E[\tau]=\lim_{n\to\infty}E[\tau_n]\le k^2<\infty.$$
방법 B (블록 꼬리확률로 급수 상계 + 수렴 판정법)
앞에서 $P(\tau>2kn)\le r^n$ ($r:=1-(1/2)^{2k}\in(0,1)$)를 얻었습니다. 기댓값의 tail-sum 공식(항상 성립):
$$E[\tau]=\sum_{m=0}^\infty P(\tau>m).$$
이를 블록으로 묶으면
$$\begin{align} E[\tau] &=\sum_{m=0}^\infty P(\tau>m) =\sum_{n=0}^\infty\sum_{m=2kn}^{2k(n+1)-1}P(\tau>m)\\ &\le \sum_{n=0}^\infty\sum_{m=2kn}^{2k(n+1)-1}P(\tau>2kn) \le \sum_{n=0}^\infty 2k\cdot r^n =\frac{2k}{1-r}<\infty. \end{align}$$
즉 $E[\tau]<\infty$입니다. (원하면 여기서 $\sum (n+1)r^n$ 형태로도 유도 가능하며, ratio test로 수렴함을 확인할 수 있습니다.)
4.7 (6) 꼬리항 소멸 조건 확인: $E[(S_n^2-n)\mathbf1_{\{\tau>n\}}]\to 0$
우리는 $M_n=S_n^2-n$에 대해 (C3) 형태의 꼬리항을 확인해야 합니다:
$$E[M_n\mathbf1_{\{\tau>n\}}]=E[S_n^2\mathbf1_{\{\tau>n\}}]-E[n\mathbf1_{\{\tau>n\}}]\;\longrightarrow\;0.$$
(i) $E[S_n^2\mathbf1_{\{\tau>n\}}]\to 0$
$\{\tau>n\}$에서는 아직 장벽에 닿지 않았으므로 $|S_n|<k$, 따라서 $S_n^2\le k^2$이고
$$0\le E[S_n^2\mathbf1_{\{\tau>n\}}]\le k^2P(\tau>n)\to 0.$$
(ii) $E[n\mathbf1_{\{\tau>n\}}]=nP(\tau>n)\to 0$
$E[\tau]<\infty$이면 다음이 성립합니다:
$$nP(\tau>n)\le E[\tau\mathbf1_{\{\tau>n\}}]\to 0.$$
이 부등식은 $\tau\mathbf1_{\{\tau>n\}}\ge n\mathbf1_{\{\tau>n\}}$에서 바로 나오며, 우변의 수렴은 $\tau\mathbf1_{\{\tau>n\}}\downarrow 0$이고 $\tau$가 적분가능이므로 DCT로 $E[\tau\mathbf1_{\{\tau>n\}}]\to 0$가 됩니다.
따라서 (i)(ii)로부터
$$E[(S_n^2-n)\mathbf1_{\{\tau>n\}}]\to 0.$$
4.8 (7) 결론: $E[\tau]=k^2$
$E[M_{\tau_n}]=0$에서 $E[\tau_n]=E[S_{\tau_n}^2]$였고, 이제 $n\to\infty$에서 $E[S_{\tau_n}^2]\to k^2$를 보이면 됩니다.
항등식:
$$E[S_{\tau_n}^2]=E[S_\tau^2\mathbf1_{\{\tau\le n\}}]+E[S_n^2\mathbf1_{\{\tau>n\}}].$$
- $\tau\le n$이면 $S_\tau=\pm k$이므로 $S_\tau^2=k^2$. 따라서 $E[S_\tau^2\mathbf1_{\{\tau\le n\}}]=k^2P(\tau\le n)\to k^2$.
- 두 번째 항은 위에서 이미 $E[S_n^2\mathbf1_{\{\tau>n\}}]\to 0$.
따라서 $E[S_{\tau_n}^2]\to k^2$. 그리고 $E[\tau_n]=E[S_{\tau_n}^2]$이므로
$$E[\tau]=\lim_{n\to\infty}E[\tau_n]=\lim_{n\to\infty}E[S_{\tau_n}^2]=k^2.$$
타임라인 직관 (k=3 예시)
n: 0 1 2 3 4 5 6 ... S_n: 0 1 0 1 2 3 ... -> 여기서 τ=5 (|S_5|=3)장벽 옵션(Barrier)에서 “장벽을 언제 치는가?”에 해당하는 가장 기본적인 hitting time 계산의 원형입니다.
4.9 비대칭 장벽 $-a$ 또는 $+b$일 때: $P(S_\tau=+b)$와 $E[\tau]$ 계산
$\tau=\min\{n\ge 0: S_n\in\{-a,+b\}\}$ ($a,b>0$)라고 하자.
(1) 도달확률 $q=P(S_\tau=+b)$
$S_n$이 마팅게일이므로 유계 정지시간 $\tau_n=\tau\wedge n$에 대해 $E[S_{\tau_n}]=E[S_0]=0$. 적절한 수렴(여기서는 $E|S_{\tau_n}|$이 유계인 것을 이용)로 $n\to\infty$를 보내면 $E[S_\tau]=0$. 그런데 $S_\tau\in\{-a,+b\}$이므로
$$\begin{align} 0=E[S_\tau]&=(-a)\cdot P(S_\tau=-a)+b\cdot P(S_\tau=+b)\\ &=(-a)(1-q)+bq \end{align}$$
따라서
$$q=\frac{a}{a+b}.$$
(2) 기대 도달시간 $E[\tau]$
이번에는 $M_n=S_n^2-n$에 대해 동일하게 $\tau_n=\tau\wedge n$에 OST를 적용하면
$$0=E[M_{\tau_n}]=E[S_{\tau_n}^2]-E[\tau_n].$$
따라서 $E[\tau_n]=E[S_{\tau_n}^2]$. $n\to\infty$를 보내면 $E[\tau]=E[S_\tau^2]$. 이제
$$\begin{align} E[S_\tau^2] &=a^2\cdot P(S_\tau=-a)+b^2\cdot P(S_\tau=+b)\\ &=a^2(1-q)+b^2q\\ &=a^2\left(1-\frac{a}{a+b}\right)+b^2\left(\frac{a}{a+b}\right)\\ &=\frac{a^2b}{a+b}+\frac{ab^2}{a+b}=ab. \end{align}$$
즉
$$E[\tau]=ab.$$
5. 예제 2: 코사인 마팅게일로 $E[(-1)^\tau]=(-1)^k$
5.1 설정
앞의 대칭 랜덤워크 $(S_n)$, 정지시간 $\tau=\min\{n:|S_n|=k\}$는 그대로 두고, 다음 과정을 정의합니다.
$$Y_n = (-1)^n\cos\bigl(\pi(S_n+k)\bigr).$$
5.2 (1) $Y_n$이 마팅게일
핵심 항등식
$$\cos(\pi(x\pm1+k))=\cos(\pi(x+k)\pm\pi)=-\cos(\pi(x+k)).$$
조건부로 $S_{n+1}=S_n+\eta_{n+1}$이며 $\eta_{n+1}=\pm1$ (확률 $1/2$씩). 따라서
$$\begin{align} E[\cos(\pi(S_{n+1}+k))\mid\mathcal F_n] &=\frac12\cos(\pi(S_n+1+k))+\frac12\cos(\pi(S_n-1+k))\\ &=\frac12(-\cos(\pi(S_n+k)))+\frac12(-\cos(\pi(S_n+k)))\\ &=-\cos(\pi(S_n+k)). \end{align}$$
이제 $Y_{n+1}=(-1)^{n+1}\cos(\pi(S_{n+1}+k))$이므로
$$\begin{align} E[Y_{n+1}\mid\mathcal F_n] &=(-1)^{n+1}E[\cos(\pi(S_{n+1}+k))\mid\mathcal F_n]\\ &=(-1)^{n+1}\cdot\bigl(-\cos(\pi(S_n+k))\bigr)\\ &=(-1)^n\cos(\pi(S_n+k))=Y_n. \end{align}$$
5.3 (2) OST 적용 준비: 적분가능성과 극한 정당화
항상 $|\cos(\cdot)|\le 1$이고 $|(-1)^n|=1$이므로
$$|Y_n|\le 1\quad(\forall n).$$
따라서 모든 $n$에서 $E|Y_n|\le 1$로 적분가능합니다. 또한 $\tau_n=\tau\wedge n$은 유계 정지시간이므로 OST를 적용할 수 있습니다:
$$E[Y_{\tau_n}]=E[Y_0].$$
그리고 $\tau<\infty$ a.s.이므로, 어떤 $\omega$에서는 결국 $n\ge\tau(\omega)$부터 $\tau_n(\omega)=\tau(\omega)$가 되어
$$Y_{\tau_n}\to Y_\tau\quad \text{a.s.}$$
또 $|Y_{\tau_n}|\le 1$이므로 DCT로
$$E[Y_{\tau_n}]\to E[Y_\tau].$$
5.4 (3) $Y_0$ 계산
$S_0=0$이므로
$$Y_0=(-1)^0\cos(\pi(S_0+k))=\cos(\pi k)=(-1)^k.$$
5.5 (4) $Y_\tau$ 계산
$\tau$에서 $S_\tau=\pm k$이므로 $S_\tau+k\in\{0,2k\}$ (짝수). 따라서
$$\cos(\pi(S_\tau+k))=\cos(0)=1\quad\text{또는}\quad \cos(2k\pi)=1.$$
즉 항상 $\cos(\pi(S_\tau+k))=1$이고
$$Y_\tau=(-1)^\tau\cdot 1 = (-1)^\tau.$$
5.6 결론: $E[(-1)^\tau]=(-1)^k$
이제
$$\begin{align} E[(-1)^\tau] &=E[Y_\tau] =\lim_{n\to\infty}E[Y_{\tau_n}] =\lim_{n\to\infty}E[Y_0] =E[Y_0] =(-1)^k. \end{align}$$
더 강한 해석: 사실상 $\tau\equiv k \pmod 2$
대칭 랜덤워크는 한 번에 $\pm 1$만 이동하므로 $S_n\equiv n\pmod2$. $|S_\tau|=k$가 되려면 결국 $\tau$의 짝/홀은 $k$와 같을 수밖에 없습니다. 위 결과 $E[(-1)^\tau]=(-1)^k$는 그 사실을 “마팅게일 한 방”으로 보여준 것입니다.
6. 왜 금융공학에서 중요할까?
6.1 Barrier Options(장벽 옵션)
장벽 옵션은 “기초자산이 어떤 레벨에 처음 도달하는 시간”에 따라 계약이 시작/종료됩니다. 이때 $\tau$는 전형적인 정지시간이고, 위험중립측도 $\mathbb Q$에서 가격은 보통
$$\text{Price}_0 = E^{\mathbb Q}\!\left[e^{-r(\tau\wedge T)}\,\text{Payoff at }(\tau\wedge T)\right]$$
꼴의 기대값으로 나타납니다. (연속시간에선 $t$로 쓰고, 이산시간에선 $n$으로 쓰는 차이만 있습니다.) 여기서 “정지 후에도 공정성이 유지되는 조건”이 바로 OST가 다루는 핵심입니다.
6.2 American Options(미국식 옵션)과 Optimal Stopping
미국식 옵션은 행사 시점이 자유롭기 때문에, 가치가 “모든 정지시간 중 최댓값”으로 표현됩니다.
$$V_0 = \sup_{\tau\in\mathcal T} E^{\mathbb Q}\!\left[e^{-r\tau}g(S_\tau)\right].$$
이때 OST/옵셔널 샘플링, 그리고 이를 정교하게 다듬은 스넬 엔벨로프(Snell envelope)가 최적행사(Optimal stopping)의 핵심 논리 기반입니다.
6.3 리스크 관리 관점: “꼬리항”은 현실의 레버리지/마진 리스크
더블업 예시에서 OST가 깨진 이유는 사실상 희박하지만 치명적인 경로(꼬리)가 기대값을 지배했기 때문입니다. 실무적으로는 “마진콜/자본제약/유동성”이 이 꼬리를 잘라내며, 모델링에서는 그 역할을 (C2)(C3) 같은 적분가능성/꼬리 제어 가정이 담당합니다.
7. 흔한 함정/오해 정리
- $\tau<\infty$ a.s.만으로는 부족: $M_\tau$가 비적분이면 $E[M_\tau]$ 자체가 정의되지 않거나 극한 교환이 실패합니다.
- 바로 $\tau$에 OST를 쓰지 말자: 가장 안전한 습관은 항상 $\tau_n=\tau\wedge n$에 먼저 적용하고, 그 다음 $n\to\infty$를 수렴정리로 정당화하는 것입니다.
- 짝/홀(parity)을 “확률”로 착각: 격자성 때문에 $\tau\equiv k\pmod2$는 구조적 필연입니다(코사인 마팅게일은 이를 깔끔히 드러냄).
- 더블업 역설의 핵심: $S_\tau$가 적분가능해도 “꼬리항”이 0으로 사라지지 않으면 OST는 실패합니다.
8. 연습문제 + 모범답안
연습문제
- (Easy) $S_n\equiv n\pmod2$를 증명하고, $\tau=\min\{n:|S_n|=k\}$에 대해 $\tau\equiv k\pmod2$를 보여라.
- (Medium) $\tau=\min\{n:S_n\in\{-a,+b\}\}$에서 $P(S_\tau=+b)$를 구하라. (대칭 랜덤워크)
- (Hard) 편향 랜덤워크 $P(\eta_i=+1)=p\ne 1/2$에서 $\tau=\min\{n:S_n\in\{-a,+b\}\}$에 대해 $P(S_\tau=+b)$를 구하라. (지수 마팅게일을 직접 구성해 완성)
모범답안/해설
(1) Easy
$S_0=0$이고 매 스텝 $S_{n+1}-S_n=\eta_{n+1}\in\{\pm1\}$은 항상 홀수입니다. 따라서 $S_n$의 짝/홀은 매 단계마다 뒤집힙니다. 즉 $S_n\equiv n\pmod2$. 한편 $\tau$에서 $|S_\tau|=k$이므로 $S_\tau\equiv k\pmod2$. 그런데 $S_\tau\equiv \tau\pmod2$이므로 $\tau\equiv k\pmod2$.
(2) Medium (대칭)
대칭이면 $S_n$은 마팅게일. 유계 정지시간 $\tau_n=\tau\wedge n$에 대해 $E[S_{\tau_n}]=0$. 적절한 수렴으로 $E[S_\tau]=0$. $q=P(S_\tau=+b)$라 두면 $P(S_\tau=-a)=1-q$이고
$$0=E[S_\tau]=(-a)(1-q)+bq\Rightarrow q=\frac{a}{a+b}.$$
(3) Hard (편향) — 완전 풀이
이제 $P(\eta=+1)=p$, $P(\eta=-1)=1-p$로 바꾸면 $S_n$은 더 이상 마팅게일이 아닙니다. 대신 지수형 마팅게일 $Z_n=\lambda^{S_n}$을 만들겠습니다.
조건부기대값:
$$\begin{align} E[Z_{n+1}\mid\mathcal F_n] &=E[\lambda^{S_{n+1}}\mid\mathcal F_n] =E[\lambda^{S_n+\eta_{n+1}}\mid\mathcal F_n] =\lambda^{S_n}E[\lambda^{\eta_{n+1}}]. \end{align}$$
따라서 $Z_n$이 마팅게일이 되려면 $E[\lambda^{\eta}]=1$이 필요합니다. 즉
$$p\lambda+(1-p)\lambda^{-1}=1.$$
양변에 $\lambda$를 곱하면
$$p\lambda^2-\lambda+(1-p)=0.$$
이 이차방정식은 해가 $\lambda=1$과 $\lambda=\frac{1-p}{p}$입니다. 편향($p\ne 1/2$)이면 $\lambda:=\frac{1-p}{p}\ne 1$을 선택합니다. 그러면 $Z_n=\lambda^{S_n}$은 마팅게일.
이제 $\tau=\min\{n:S_n\in\{-a,+b\}\}$에 대해 유계 정지시간 $\tau_n=\tau\wedge n$에 OST를 적용하고 수렴을 보내면
$$E[\lambda^{S_\tau}]=E[\lambda^{S_0}]=\lambda^0=1.$$
그런데 $S_\tau\in\{-a,+b\}$이고 $q:=P(S_\tau=+b)$라 두면
$$1=E[\lambda^{S_\tau}]=\lambda^{b}q+\lambda^{-a}(1-q).$$
이를 $q$에 대해 풀면
$$\begin{align} 1&=\lambda^b q+\lambda^{-a}-\lambda^{-a}q =\lambda^{-a}+q(\lambda^b-\lambda^{-a})\\ \Rightarrow\quad q&=\frac{1-\lambda^{-a}}{\lambda^b-\lambda^{-a}} =\frac{\lambda^a-1}{\lambda^{a+b}-1}. \end{align}$$
최종적으로 $\lambda=\frac{1-p}{p}$를 대입하면
$$P(S_\tau=+b)=\frac{\left(\frac{1-p}{p}\right)^a-1}{\left(\frac{1-p}{p}\right)^{a+b}-1}.$$
9. 마무리: OST를 안전하게 쓰는 습관
정리하면, OST에서 가장 중요한 습관은 다음입니다.
- 1) 무조건 먼저 $\tau_n=\tau\wedge n$로 자른다(유계 정지시간).
- 2) $M_{\tau_n}$이 마팅게일임을 확인하고 $E[M_{\tau_n}]=E[M_0]$를 확보한다.
- 3) $n\to\infty$는 수렴정리(DCT/MCT 등)로 정당화한다.
- 4) 특히 꼬리항 $E[M_n\mathbf1_{\{\tau>n\}}]\to0$를 반드시 체크한다(더블업 같은 함정 방지).
이 프레임만 제대로 잡히면, 장벽 옵션/미국식 옵션/최적정지/위험중립 평가로 자연스럽게 연결됩니다.
금융수학, 특히 확률과정론에서 균등적분가능성(Uniform Integrability)은 확률변수들의 집합이 "꼬리(tail)" 부분에서 가지는 질량이 균일하게 작다는 것을 의미하는 매우 중요한 개념입니다. 어떤 확률변수열 ${f_n}$이 L1 공간에서 수렴하는지, 즉 $E[|f_n - f|] \to 0$ 인지를 판별하는 핵심적인 조건이 됩니다.
단순히 확률적으로 수렴($f_n \xrightarrow{P} f$)하는 것만으로는 기댓값의 수렴($E[f_n] \to E[f]$)을 보장할 수 없습니다. 이는 르벡의 지배수렴정리(Lebesgue's Dominated Convergence Theorem)에서 수렴을 보장하기 위해 필요한 '지배 함수(dominating function)' $g \in L^1$가 존재하지 않는 경우에 발생할 수 있는 문제입니다. 확률분포의 '질량(mass)'이 $n \to \infty$ 과정에서 무한대로 '새어 나가는(escape to infinity)' 현상이 발생할 수 있기 때문입니다. 균등적분가능성은 바로 이러한 질량의 유실을 방지하고, 지배 함수가 존재하지 않더라도 $L^1$ 수렴을 보장해주는 '가교' 역할을 합니다.
정의 (Uniformly Integrable)
확률변수들의 집합 ${f_n}$이 다음 두 가지 동치 조건 중 하나를 만족할 때, 균등적분가능(uniformly integrable)하다고 합니다.
- $\lim_{M \to \infty} \sup_n \int_{{|f_n| > M}} |f_n| dP = 0$
- 임의의 $\epsilon > 0$에 대해, 어떤 $M > 0$이 존재하여 모든 $n$에 대해 $\int_{{|f_n| > M}} |f_n| dP < \epsilon$ 을 만족한다.
직관적으로, $M$을 충분히 크게 잡으면, $|f_n|$의 값이 $M$을 초과하는 "아주 드문 사건"이 발생하더라도, 그 사건에서의 $f_n$의 기댓값(적분값)이 모든 $n$에 대해 균일하게 0으로 수렴한다는 의미입니다. 이는 개별 $f_n$이 적분 가능하다는 조건($E[|f_n|] < \infty$)보다 훨씬 강력한 조건입니다. 여기서 핵심은 $M$의 선택이 특정 $n$에 의존하지 않고, 전체 수열 $\{f_n\}$에 대해 일괄적으로 적용된다는 점입니다.
보조정리 (Lemma): 적분 가능한 함수의 기본 성질
먼저 모든 논증의 기초가 되는 중요한 보조정리를 살펴보겠습니다.
보조정리: 확률변수 $f$가 적분 가능하다면 ($f \in L^1$, 즉 $E[|f|] < \infty$), 임의의 $\epsilon > 0$에 대해 적절한 $\delta > 0$가 존재하여, $P(A) < \delta$인 모든 사건 $A$에 대해 다음이 성립한다. $$ \int_A |f| dP < \epsilon $$ 이를 측도 $v(A) = \int_A |f| dP$가 확률측도 $P$에 대해 절대 연속(absolutely continuous)이라고도 부릅니다. 즉, $P(A)=0$이면 $v(A)=0$이 성립함을 의미하며, 더 나아가 $P(A)$가 아주 작은 값을 가지면 $v(A)$도 아주 작은 값을 가짐을 보장합니다.
증명
- 적분 영역 분할: 우리의 목표는 $\int_A |f| dP$ 값을 통제하는 것입니다. 이를 위해 적분 영역 $A$를 $f$의 값이 큰 부분과 작은 부분으로 나눕니다. $$ \int_A |f| dP = \int_{A \cap \{|f| > M\}} |f| dP + \int_{A \cap \{|f| \le M\}} |f| dP $$ 여기서 $M$은 우리가 조절할 수 있는 양수입니다.
- 첫 번째 항 통제: $f$는 적분 가능하므로, 단조수렴정리(Monotone Convergence Theorem)에 의해 $\lim_{M \to \infty} E[|f| \cdot 1_{\{|f| \le M\}}] = E[|f|]$ 이고, 따라서 $\lim_{M \to \infty} E[|f| \cdot 1_{\{|f| > M\}}] = 0$ 입니다. 여기서 $1_B$는 사건 $B$가 일어나면 1, 아니면 0인 지시함수(indicator function)입니다. 따라서, 주어진 $\epsilon > 0$에 대해, $M$을 충분히 크게 선택하여 다음을 만족시킬 수 있습니다. $$ \int_{\{|f| > M\}} |f| dP < \frac{\epsilon}{2} $$ 적분 영역이 $A \cap \{|f| > M\}$로 더 작아지므로, 다음 부등식은 자명하게 성립합니다. $$ \int_{A \cap \{|f| > M\}} |f| dP \le \int_{\{|f| > M\}} |f| dP < \frac{\epsilon}{2} $$
- 두 번째 항 통제: 두 번째 항에서는 $|f| \le M$ 이므로, 적분값은 다음과 같이 제한됩니다. $$ \int_{A \cap \{|f| \le M\}} |f| dP \le \int_{A \cap \{|f| \le M\}} M dP = M \cdot P(A \cap \{|f| \le M\}) \le M \cdot P(A) $$
- 델타(δ) 설정 및 결론: 이제 두 항을 합치면 다음과 같습니다. $$ \int_A |f| dP < \frac{\epsilon}{2} + M \cdot P(A) $$ 우리는 이 전체 값이 $\epsilon$보다 작아지기를 원합니다. 이를 위해 $\delta = \frac{\epsilon}{2M}$ 으로 설정합시다. 만약 $P(A) < \delta$ 라면, $$ M \cdot P(A) < M \cdot \delta = M \cdot \frac{\epsilon}{2M} = \frac{\epsilon}{2} $$ 가 되어, 최종적으로 다음 결론을 얻습니다. $$ \int_A |f| dP < \frac{\epsilon}{2} + \frac{\epsilon}{2} = \epsilon $$ 이로써 증명이 완료됩니다.
균등적분가능성을 위한 동치 조건: de la Vallée Poussin Theorem
균등적분가능성을 정의에 따라 직접 확인하는 것은 종종 까다롭습니다. 이때 유용하게 사용되는 것이 de la Vallée Poussin의 정리입니다.
정리 (de la Vallée Poussin): 확률변수 집합 $\{f_n\}$이 균등적분가능하기 위한 필요충분조건은, 다음을 만족하는 non-negative, non-decreasing, convex 함수 $G: [0, \infty) \to [0, \infty)$가 존재하는 것이다: $$ \lim_{x \to \infty} \frac{G(x)}{x} = \infty \quad \text{and} \quad \sup_n E[G(|f_n|)] < \infty $$
이 정리는 균등적분가능성이라는 '꼬리'에 대한 조건을, 모든 수열에 대해 $G(|f_n|)$의 기댓값이 유계(bounded)가 되게 하는 '볼록 함수' $G$의 존재성 문제로 바꾸어 줍니다. 직관적으로 $G$는 $x$가 커짐에 따라 $x$보다 훨씬 빠르게 증가해야 하며($\lim_{x \to \infty} G(x)/x = \infty$), 이러한 $G$를 적용했음에도 불구하고 기댓값이 발산하지 않는다는 것은 $|f_n|$의 꼬리 부분이 충분히 빠르게 감소함을 의미합니다. 예를 들어, 만약 $\sup_n E[|f_n|^{1+\epsilon}] < \infty$ for some $\epsilon > 0$ 이라면, $G(x) = x^{1+\epsilon}$ 으로 잡을 수 있으므로 $\{f_n\}$은 균등적분가능합니다. 즉, $L^p$ ($p>1$) 공간에서 유계인 수열은 항상 균등적분가능합니다.
명제: L1 수렴과 균등적분가능성의 관계
명제: 확률변수열 $\{f_n\}$이 $L^1$ 공간에서 $f$로 수렴한다면 ($f_n \xrightarrow{L^1} f$), $\{f_n\}$은 균등적분가능(uniformly integrable)하다.
이는 균등적분가능성이 $L^1$ 수렴을 위한 필요조건(necessary condition)임을 의미합니다.
증명
$f_n \xrightarrow{L^1} f$ 라는 것은 $\lim_{n \to \infty} E[|f_n - f|] = 0$ 을 의미합니다.
- L1 수렴 조건 활용: $L^1$ 수렴 가정에 따라, 임의의 $\epsilon > 0$ 에 대해, 충분히 큰 $N$을 찾을 수 있어서 모든 $n \ge N$ 에 대해 다음이 성립합니다. $$ E[|f_n - f|] = \int_{\Omega} |f_n - f| dP < \frac{\epsilon}{2} $$
- 보조정리(Lemma) 적용: $f_n \xrightarrow{L^1} f$ 이면 $f$ 또한 $L^1$에 속합니다 (삼각부등식 $|f| \le |f_n| + |f_n - f|$를 이용해 증명 가능). 따라서 앞서 증명한 보조정리에 의해, 어떤 $\delta > 0$가 존재하여 $P(A) < \delta$ 이면 다음을 만족합니다. $$ \int_A |f| dP < \frac{\epsilon}{2} $$
- 균등한 확률 경계 설정 (Claim): 이제 모든 $n$에 대해 $P(\{|f_n| > M\}) < \delta$ 를 만족하는 $M$을 찾을 수 있음을 보여야 합니다. 이는 마르코프 부등식(Markov's Inequality)을 통해 보일 수 있습니다. $$ P(\{|f_n| > M\}) \le \frac{E[|f_n|]}{M} $$ $f_n$이 $L^1$에서 수렴하므로, 기댓값의 수열 $E[|f_n|]$은 유계(bounded)입니다. 즉, $\sup_n E[|f_n|] < C$ 인 상수 $C$가 존재합니다. 이제 $M$을 $M > C/\delta$ 가 되도록 충분히 크게 잡으면, 모든 $n$에 대해, $$ P(\{|f_n| > M\}) \le \frac{E[|f_n|]}{M} \le \frac{C}{M} < \delta $$ 가 성립합니다.
- 적분값 분해 및 결론 ($n \ge N$인 경우): 이제 균등적분가능성의 정의를 확인해 봅시다. $$ \int_{\{|f_n| > M\}} |f_n| dP $$ 삼각부등식 $|f_n| \le |f_n - f| + |f|$ 를 이용해 적분을 분해합니다. $$ \int_{\{|f_n| > M\}} |f_n| dP \le \int_{\{|f_n| > M\}} |f_n - f| dP + \int_{\{|f_n| > M\}} |f| dP $$ 첫 번째 항: 적분 영역을 전체 $\Omega$로 확장해도 값은 커지므로, $$ \int_{\{|f_n| > M\}} |f_n - f| dP \le \int_{\Omega} |f_n - f| dP = E[|f_n - f|] < \frac{\epsilon}{2} \quad (\text{for } n \ge N) $$ 두 번째 항: 3단계에서 $P(\{|f_n| > M\}) < \delta$ 임을 보였고, 2단계에서 $P(A) < \delta$ 이면 $\int_A |f| dP < \epsilon/2$ 임을 알았으므로, $A = \{|f_n| > M\}$ 으로 두면 $$ \int_{\{|f_n| > M\}} |f| dP < \frac{\epsilon}{2} $$ 두 결과를 합치면, 모든 $n \ge N$에 대해 $\int_{\{|f_n| > M\}} |f_n| dP < \frac{\epsilon}{2} + \frac{\epsilon}{2} = \epsilon$ 을 얻습니다.
- 유한 개의 항 처리 ($n < N$인 경우): $n = 1, 2, \ldots, N-1$ 에 대해서는 유한 개의 적분 가능한 함수 $\{f_1, \ldots, f_{N-1}\}$만 고려하면 됩니다. 각각의 $f_i$에 대해 $\lim_{M \to \infty} \int_{\{|f_i| > M\}} |f_i| dP = 0$ 이므로, 우리는 충분히 큰 $M'$을 선택하여 모든 $i \in \{1, \ldots, N-1\}$ 에 대해 $\int_{\{|f_i| > M'\}} |f_i| dP < \epsilon$ 이 되게 할 수 있습니다. 따라서, 4단계에서 찾은 $M$과 여기서 찾은 $M'$ 중에서 더 큰 값, 즉 $M_{\text{final}} = \max(M, M')$ 을 선택하면, 모든 $n \in \mathbb{N}$에 대해 $$ \int_{\{|f_n| > M_{\text{final}}\}} |f_n| dP < \epsilon $$ 이 성립합니다. 이는 $\{f_n\}$이 균등적분가능함의 정의와 정확히 일치합니다.
핵심 정리: 비탈리 수렴 정리 (Vitali Convergence Theorem)
균등적분가능성의 중요성을 가장 잘 보여주는 정리는 바로 비탈리 수렴 정리입니다. 이 정리는 $L^1$ 수렴과 확률 수렴 사이의 관계를 명확하게 규명합니다.
정리 (Vitali): $L^1$에 속하는 확률변수열 $\{f_n\}$과 확률변수 $f$에 대하여, 다음은 동치이다.
$f_n \xrightarrow{L^1} f$ (즉, $\lim_{n \to \infty} E[|f_n - f|] = 0$)
$\iff$
(i) $f_n \xrightarrow{P} f$ (확률 수렴) 그리고 (ii) 확률변수열 $\{f_n\}$은 균등적분가능하다.
증명 ((i), (ii) $\implies L^1$ 수렴):
$L^1$ 수렴이 균등적분가능성을 함의한다는 것은 위에서 증명했습니다. 반대 방향의 증명은 다음과 같은 단계로 이루어집니다.
- 목표 설정: $E[|f_n - f|] \to 0$ 임을 보여야 합니다.
- 적분 분해: 임의의 $M>0$에 대해 적분을 두 부분으로 나눕니다. $$ E[|f_n - f|] = \int_{\{|f_n-f| \le M\}} |f_n - f| dP + \int_{\{|f_n-f| > M\}} |f_n - f| dP $$
- 첫 번째 항 통제: 적분 영역 안에서는 $|f_n - f| \le M$ 이므로, 이 항은 $M \cdot P(\Omega) = M$ 보다 작습니다. 하지만 더 타이트한 바운드가 필요합니다. $f_n \xrightarrow{P} f$ 이므로, $n$을 충분히 크게 하면 $|f_n - f|$가 아주 작은 $\delta$보다 작을 확률이 1에 가까워집니다. 이 사실과 Egorov's Theorem을 이용하여 이 항이 0으로 감을 보일 수 있습니다. 더 간단하게는, $g_n(M) = \min(|f_n-f|, M)$ 으로 정의하면 $g_n(M) \xrightarrow{P} 0$ 이고 $g_n(M) \le M$ 이므로 지배수렴정리에 의해 $E[g_n(M)] \to 0$ 입니다.
- 두 번째 항(꼬리) 통제: 삼각부등식에 의해 $\int_{\{|f_n-f| > M\}} |f_n - f| dP \le \int_{\{|f_n-f| > M\}} |f_n| dP + \int_{\{|f_n-f| > M\}} |f| dP$ 입니다. $\{f_n\}$이 균등적분가능하고 $f$도 $L^1$에 속하므로 (이는 UI 조건과 확률수렴으로 증명 가능), 충분히 큰 $M$에 대해 이 두 항을 임의의 $\epsilon$보다 작게 만들 수 있습니다. $\{f_n\}$의 균등적분가능성이 $\{|f_n-f|\}$의 균등적분가능성을 함의함을 보이는 과정이 필요하며, 이를 통해 $M$을 크게 잡으면 $n$에 무관하게 이 항을 작게 만들 수 있습니다.
- 결론: 임의의 $\epsilon>0$에 대해, 먼저 $M$을 충분히 크게 잡아 두 번째 꼬리 부분을 $\epsilon/2$보다 작게 만들고, 그 $M$에 대해 $n$을 충분히 크게 하여 첫 번째 부분을 $\epsilon/2$보다 작게 만들 수 있으므로 $E[|f_n-f|] \to 0$을 보일 수 있습니다.
예제 분석
예제 1: 조건부 기댓값과 마틴게일
$f$가 적분 가능한 확률변수이고, $\mathcal{F}_n$이 여과(filtration)일 때, $f_n = E[f | \mathcal{F}_n]$으로 정의된 확률변수열은 균등적분가능한 마틴게일(uniformly integrable martingale)임을 보이시오.
풀이:
마틴게일 성질:
$f_n = E[f | \mathcal{F}_n]$은 마틴게일의 정의를 만족합니다. 여과 $\mathcal{F}_n$은 $\mathcal{F}_{n+1}$에 포함되므로($\mathcal{F}_n \subseteq \mathcal{F}_{n+1}$), Tower Property (첩의 법칙)에 의해 다음이 성립합니다. $$ E[f_{n+1} | \mathcal{F}_n] = E[E[f | \mathcal{F}_{n+1}] | \mathcal{F}_n] = E[f | \mathcal{F}_n] = f_n $$ 또한, 젠센 부등식(Jensen's inequality)에 의해 $|f_n| = |E[f | \mathcal{F}_n]| \le E[|f| | \mathcal{F}_n]$ 이고, $E[|f_n|] \le E[E[|f| | \mathcal{F}_n]] = E[|f|] < \infty$ 이므로 $f_n$은 적분 가능합니다. 따라서 $\{f_n\}$은 마틴게일입니다.
균등적분가능성 증명:
이 부분이 핵심입니다. 우리는 $\lim_{M \to \infty} \sup_n \int_{\{|f_n| > M\}} |f_n| dP = 0$ 임을 보여야 합니다. 젠센 부등식을 다시 사용하면, $|f_n| \le E[|f| | \mathcal{F}_n]$ 입니다. 조건부 기댓값의 성질 중 하나인 Partial Averaging을 이용합니다: 사건 $A \in \mathcal{F}_n$에 대해, $\int_A E[X | \mathcal{F}_n] dP = \int_A X dP$ 가 성립합니다. 사건 $A_n = \{|f_n| > M\}$ 은 $f_n$에 의해 결정되므로 $\mathcal{F}_n$에 속하는 가측 사건($A_n \in \mathcal{F}_n$)입니다. 이제 증명을 진행해 봅시다. $$ \int_{\{|f_n| > M\}} |f_n| dP \le \int_{\{|f_n| > M\}} E[|f| | \mathcal{F}_n] dP $$ 여기서 $A_n = \{|f_n| > M\}$ 에 Partial Averaging 성질을 적용하면, $$ = \int_{\{|f_n| > M\}} |f| dP $$ 이제 우변의 적분은 $n$에 직접적으로 의존하지 않고, 오직 사건 $\{|f_n|>M\}$을 통해서만 $n$과 관련됩니다. 모든 $n$에 대해 $P(\{|f_n|>M\}) \le \frac{E[|f_n|]}{M} \le \frac{E[|f|]}{M}$ 이므로, $M \to \infty$ 이면 $P(\{|f_n|>M\}) \to 0$ 이 균일하게 성립합니다. 적분 가능한 함수 $f$에 대한 적분은 (위의 보조정리에 의해) 측도가 0으로 갈 때 0으로 가므로, $\sup_n \int_{\{|f_n| > M\}} |f| dP \to 0$ 이 성립합니다. 따라서 $\{f_n\}$은 균등적분가능합니다.
예제 2: 균등적분가능성과 L1 유계(Boundedness)
균등적분가능한 확률변수열 $\{f_n\}$은 $L^1$에서 유계임을 보이시오. (즉, $\sup_n E[|f_n|] < \infty$)
풀이:
- 균등적분가능성 정의 활용: $\{f_n\}$이 균등적분가능하므로, $\epsilon=1$ 로 설정했을 때, 어떤 $M>0$ 이 존재하여 모든 $n$에 대해 다음을 만족합니다. $$ \int_{\{|f_n| > M\}} |f_n| dP < 1 $$
- 기댓값 분해: $E[|f_n|]$을 두 부분으로 나눕니다. $$ E[|f_n|] = \int_{\Omega} |f_n| dP = \int_{\{|f_n| > M\}} |f_n| dP + \int_{\{|f_n| \le M\}} |f_n| dP $$
- 각 항의 경계 설정: 첫 번째 항은 1보다 작습니다: $\int_{\{|f_n| > M\}} |f_n| dP < 1$ 두 번째 항에서는 $|f_n| \le M$ 이므로, $$ \int_{\{|f_n| \le M\}} |f_n| dP \le \int_{\{|f_n| \le M\}} M dP = M \cdot P(\{|f_n| \le M\}) \le M \cdot 1 = M $$
- 결론: 두 결과를 합치면, 모든 $n$에 대해 $$ E[|f_n|] < 1 + M $$ $1+M$은 $n$에 의존하지 않는 상수입니다. 따라서 $E[|f_n|]$의 상한(supremum)은 유한하며, 이는 $\{f_n\}$이 $L^1$에서 유계임을 의미합니다.
주의: 역은 성립하지 않습니다. 즉, $L^1$에서 유계인 수열이라고 해서 항상 균등적분가능한 것은 아닙니다. 아래의 반례가 이를 잘 보여줍니다.
반례: 균등적분가능하지 않은 경우
균등적분가능성의 필요성을 이해하기 위해 대표적인 반례를 살펴보겠습니다. 확률공간을 $[0, 1]$ 구간과 르벡 측도로 설정합시다. 다음과 같은 확률변수열 $f_n$을 정의합니다. $$ f_n(\omega) = \begin{cases} n & \text{if } 0 \le \omega < 1/n \\ 0 & \text{otherwise} \end{cases} $$
- 확률 수렴: 임의의 $\epsilon > 0$에 대해, $P(\{|f_n| > \epsilon\}) = P(\{f_n=n\}) = 1/n$ 입니다. 따라서 $n \to \infty$ 일 때, $P(\{|f_n| > \epsilon\}) \to 0$ 이므로, $f_n$은 0으로 확률 수렴합니다 ($f_n \xrightarrow{P} 0$).
- $L^1$ 유계 및 수렴 실패: 기댓값을 계산해보면, $E[|f_n|] = \int_0^{1/n} n \, d\omega = n \cdot (1/n) = 1$ 입니다. 따라서 모든 $n$에 대해 $E[|f_n|]=1$ 이므로 수열은 $L^1$에서 유계입니다. 하지만 $\lim_{n \to \infty} E[|f_n - 0|] = 1 \ne 0$ 이므로 $L^1$ 수렴은 하지 않습니다.
- 균등적분가능성 실패: $M$을 아무리 크게 잡아도, $M$보다 큰 $n$에 대해서는 $\{|f_n|>M\} = \{f_n=n\} = [0, 1/n]$ 입니다. 따라서, $$ \int_{\{|f_n| > M\}} |f_n| dP = \int_0^{1/n} n \, d\omega = 1 $$ 이 값은 $M \to \infty$ 일 때 0으로 수렴하지 않습니다. 즉, $\{f_n\}$은 균등적분가능하지 않습니다. 이 예제는 $L^1$-유계임에도 불구하고 균등적분가능하지 않을 수 있으며, 이 '도망가는 질량' 때문에 $L^1$ 수렴이 실패함을 명확히 보여줍니다.
금융공학적 의의 및 최종 정리
- $L^1$ 수렴 $\iff$ 확률 수렴 + 균등적분가능성: 이것이 핵심입니다. $L^1$ 수렴은 금융공학에서 매우 중요한데, 이는 기댓값(가격)의 수렴을 의미하기 때문입니다.
- 마틴게일 수렴 정리 (Doob's Martingale Convergence Theorem): 모든 균등적분가능한 마틴게일 $M_n$은 Almost Surely (거의 확실히) 그리고 $L^1$에서도 어떤 극한 확률변수 $M_\infty$로 수렴합니다. ($M_n \to M_\infty$ a.s. and in $L^1$). 더 나아가, 이 경우 $M_n = E[M_\infty | \mathcal{F}_n]$ 의 형태로 표현할 수 있습니다. 이는 금융 파생상품 가격 이론에서 위험중립측도 하의 할인된 자산 가격 과정이 마틴게일이라는 점과 결부되어, 자산 가격의 수렴성을 보장하는 핵심적인 이론적 기반이 됩니다.
- 자산 가격 결정 이론의 근간: 파생상품의 가격은 위험중립측도 $Q$ 하에서 미래 페이오프 $X_T$의 할인된 기댓값, 즉 $X_t = E_Q[e^{-r(T-t)}X_T | \mathcal{F}_t]$로 표현됩니다. 이는 예제 1에서 본 $f_n = E[f | \mathcal{F}_n]$ 형태의 마틴게일입니다. 이 마틴게일이 균등적분가능하다는 사실(Shreve, Stochastic Calculus for Finance II의 Theorem 3.4.8)은, 시간 흐름에 따른 정보가 아무리 많아져도 ($t \to T$) 가격이 발산하지 않고 안정적으로 최종 페이오프의 기댓값으로 수렴함을 수학적으로 보장합니다. 만약 균등적분가능성이 없다면, 가격 과정이 수렴하더라도 그 기댓값이 수렴하지 않는 현상(즉, $E[X_t] \ne E[X_T]$)이 발생할 수 있으며, 이는 차익거래 기회가 발생할 수 있는 불안정한 가격 모델로 이어질 수 있습니다. 균등적분가능성은 제1기본정리(차익거래 부재 $\iff$ 등가 마틴게일 측도 존재)와 제2기본정리(시장 완비성 $\iff$ 등가 마틴게일 측도 유일성)가 실제 가격결정에 일관성 있게 적용되도록 하는 필수적인 조건입니다.
4. 라돈–니코딤 정리와 절대연속인 측도변환
정의 4.1 측도 \(\nu\)가 측도 \(\mu\)에 대해 절대연속이라는 말은 \(\mu(A)=0\Rightarrow \nu(A)=0\)를 뜻하며 \(\nu\ll\mu\)로 쓴다.
정의 4.2 \(\nu\ll\mu\)이고 가측함수 \(f\ge0\)가 모든 가측집합 \(A\)에 대해 \(\nu(A)=\int_A f\,d\mu\)를 만족하면, \(f\)를 라돈–니코딤 derivative라고 하며 \(f=\frac{d\nu}{d\mu}\)로 쓴다.
정리 4.3 (Radon–Nikodym) \(\sigma\)-유한 측도 \(\mu,\nu\)에 대해 \(\nu\ll\mu\)이면 어떤 가측함수 \(f\ge0\)가 존재하여 \(\nu(A)=\int_A f\,d\mu\)가 모든 가측집합 \(A\)에 대해 성립한다. 이런 \(f\)는 \(\mu\)-a.e. 유일하다.
증명 \(\lambda:=\mu+\nu\)를 두자. \(\mu,\nu\ll\lambda\)이다. 힐베르트 공간 \(L^2(\lambda)\)에서 선형범함수
$$T(g):=\int g\,d\nu$$
를 \(L^2(\lambda)\cap L^\infty(\lambda)\)에서 먼저 생각한다. 코시–슈바르츠로 \(T\)는 연속이다. Riesz 표현정리에 의해 어떤 \(h\in L^2(\lambda)\)가 존재하여 \(T(g)=\int gh\,d\lambda\)이다. 이제 지시함수 \(g=1_A\)를 넣으면
$$\nu(A)=\int_A h\,d\lambda.$$
같은 방식으로 \(\mu(A)=\int_A k\,d\lambda\)인 \(k\ge0\)도 존재한다. \(\nu\ll\mu\)이므로 \(k=0\)인 곳에서 \(h=0\)이어야 한다. 따라서 \(f:=h/k\)를 \(\{k>0\}\)에서 정의하고 \(\{k=0\}\)에서는 0으로 두면
$$\nu(A)=\int_A h\,d\lambda=\int_A \frac{h}{k}k\,d\lambda=\int_A f\,d\mu.$$
유일성은 \(\int_A(f-g)d\mu=0\)가 모든 \(A\)에 대해 성립하면 \(\{f>g\},\{g>f\}\)를 대입하여 \(f=g\) \(\mu\)-a.e.를 얻으면 된다.
정의 4.4 확률측도 \(\mathbb Q\ll\mathbb P\)에 대해
$$Z:=\frac{d\mathbb Q}{d\mathbb P}$$
를 전체 기간의 밀도라 하고, 여과 \((\mathcal F_t)\)에 대해
$$Z_t:=E_{\mathbb P}[Z\mid \mathcal F_t]$$
를 밀도과정(density process)이라 한다. \((Z_t)\)는 \(\mathbb P\)-마팅게일이다.
정리 4.5 (Bayes 공식을 포함한 측도변환) \(\mathbb Q\ll\mathbb P\), \(Z_t=E_{\mathbb P}[Z\mid\mathcal F_t]\)라고 하자. 그러면 임의의 적분가능한 \(X\)에 대해
$$E_{\mathbb Q}[X\mid\mathcal F_t]=\frac{1}{Z_t}E_{\mathbb P}[ZX\mid\mathcal F_t]\quad \text{on }\{Z_t>0\}.$$
증명 \(A\in\mathcal F_t\)에 대해
$$E_{\mathbb Q}[1_A X]=E_{\mathbb P}[Z1_A X]=E_{\mathbb P}\left[1_A E_{\mathbb P}[ZX\mid\mathcal F_t]\right].$$
한편 \(d\mathbb Q=Z d\mathbb P\)이므로
$$E_{\mathbb Q}\left[1_A \frac{1}{Z_t}E_{\mathbb P}[ZX\mid\mathcal F_t]\right]=E_{\mathbb P}\left[Z1_A \frac{1}{Z_t}E_{\mathbb P}[ZX\mid\mathcal F_t]\right].$$
여기서 \(A\in\mathcal F_t\)이고 \(Z_t=E_{\mathbb P}[Z\mid\mathcal F_t]\)이므로 안쪽에서 \(Z\)를 \(Z_t\)로 바꿀 수 있어 위 식은 바로 \(E_{\mathbb P}[1_AE_{\mathbb P}[ZX\mid\mathcal F_t]]\)가 된다. 조건부기댓값의 특성으로 결론이 성립한다.
5. 뉴메레르 derivative와 Girsanov 정리
정의 5.1 양의 뉴메레르 과정 \(N_t>0\)를 기준 자산으로 잡으면 임의의 가격과정 \(V_t\)의 뉴메레르 정규화 가격은 \(\widetilde V_t:=V_t/N_t\)이다. 뉴메레르 derivative는 다른 뉴메레르로 바꿀 때 생기는 밀도과정을 뜻한다.
정의 5.2 예측가능 과정 \(\theta\)에 대해 Doléans 지수는
$$\mathcal E_t\left(-\int_0^\cdot \theta_u\,dW_u\right):=\exp\left(-\int_0^t\theta_u dW_u-\frac12\int_0^t\theta_u^2 du\right).$$
정리 5.3 (지수 마팅게일) \(M_t=\int_0^t\theta_u dW_u\)라 두면 \(Z_t=\mathcal E_t(-M)\)는 국소 마팅게일이고, Novikov 조건
$$E\left[\exp\left(\frac12\int_0^T\theta_u^2du\right)\right]<\infty$$
가 성립하면 \((Z_t)_{0\le t\le T}\)는 참마팅게일이며 \(E[Z_T]=1\)이다.
증명 \(X_t:=-\int_0^t\theta_u dW_u-\frac12\int_0^t\theta_u^2du\)라고 두면 Itô 보조정리로 \(d(e^{X_t})=e^{X_t}dX_t+\frac12e^{X_t}d\langle X\rangle_t\)이다. 여기서 \(dX_t=-\theta_t dW_t-\frac12\theta_t^2dt\), \(d\langle X\rangle_t=\theta_t^2dt\)이므로
$$dZ_t=d(e^{X_t})=-\theta_t Z_t dW_t.$$
따라서 \(Z\)는 양의 국소 마팅게일이다. 양의 국소 마팅게일은 슈퍼마팅게일이므로 \(E[Z_t]\le1\). Novikov 조건 하에서는 표준 절단논법과 Hölder 부등식을 써서 \((Z_{t\wedge \tau_n})\)의 균등적분성을 확보할 수 있고, 그 결과 \(E[Z_T]=1\)이 되어 참마팅게일이 된다.
정리 5.4 (Girsanov) 위의 \(Z_T\)로 \(d\mathbb Q=Z_T d\mathbb P\)를 정의하자. 그러면
$$W_t^{\mathbb Q}:=W_t+\int_0^t\theta_u du$$
는 \(\mathbb Q\) 하에서 브라운 운동이다.
증명 브라운 운동임을 보이려면 연속성, \(\mathcal F_t\)-적응성, 그리고 \(\mathbb Q\) 하에서의 마팅게일 성질과 이차변동 \(\langle W^{\mathbb Q}\rangle_t=t\)를 보이면 된다. 연속성과 적응성은 자명하다. \(s<t\)와 \(a\in\mathcal="" bounded="" f_s\)를="" p="" 잡아<="">
$$E_{\mathbb Q}[1_A(W_t^{\mathbb Q}-W_s^{\mathbb Q})]=E_{\mathbb P}[Z_T1_A((W_t-W_s)+\int_s^t\theta_u du)].$$
Bayes 공식 때문에 \(Z_T\) 대신 \(Z_t\)를 써도 된다. 그런데 \(dZ_t=-\theta_tZ_t dW_t\)이므로 Itô 곱공식을 \(Z_tW_t\)에 적용하면
$$d(Z_tW_t)=Z_t dW_t+W_t dZ_t+d\langle Z,W\rangle_t=Z_t dW_t-W_t\theta_t Z_t dW_t-\theta_t Z_t dt.$$
따라서 보정항 \(\int_s^t\theta_u du\)가 정확히 drift를 상쇄한다. 더 직접적으로는 임의의 \(u\)에 대해
$$E_{\mathbb P}[Z_t(W_t-W_s)\mid\mathcal F_s]=-E_{\mathbb P}\left[\int_s^t Z_u\theta_u du\mid\mathcal F_s\right],$$
가 되어 두 항이 상쇄되므로 \(E_{\mathbb Q}[W_t^{\mathbb Q}-W_s^{\mathbb Q}\mid\mathcal F_s]=0\)이다. 또한 유한변동항을 더해도 이차변동은 바뀌지 않으므로 \(\langle W^{\mathbb Q}\rangle_t=t\). Levy 특성정리에 의해 \(W^{\mathbb Q}\)는 \(\mathbb Q\)-브라운 운동이다.
</t\)와>
뉴메레르 변경의 핵심 식 두 양의 자산 \(N,B\)가 각각 뉴메레르라면 만기 \(T\)에서의 밀도는
$$\frac{d\mathbb Q^{N}}{d\mathbb Q^{B}}\Bigg|_{\mathcal F_T}=\frac{B_TN_0}{N_TB_0}.$$
이 식이 바로 fixed-income에서 money-market measure, spot measure, forward measure를 넘나들 때 쓰는 numeraire derivative다.
Part B — Chapter 7 Optimal Execution with Continuous Trading II
이 파트는 Chapter 7의 본문을 원문 순서를 따라 문장 단위로 풀어 쓴 뒤, 책에서 생략한 계산이나 묵시적으로 넘어간 전개는 바로 아래에 증명으로 붙여 재구성한 버전이다. 본문 설명을 따로 요약본으로 바꾸지 않고, 원문 서술을 살리면서 계산과 논리를 더 두껍게 붙였다.
7.1 서론
이전 장에서는 투자자가 평균 일거래량(ADV)의 상당 부분에 해당하는 물량을 청산하거나 취득하려 할 때의 최적 실행 문제를 다루었다. 그 장에서 드러난 핵심은 단순하다. 너무 빨리 거래하면 자신의 거래가 가격을 심하게 움직이고, 너무 천천히 거래하면 결국 받거나 지불하게 되는 가격의 불확실성이 커진다. 그래서 최적 전략은 보통 초기에 비교적 빠르게 거래한 뒤, 시간이 지나면서 서서히 속도를 낮추는 형태로 나타난다. 초기에 빠른 이유는 도착 가격에 가까운 가격을 확보하기 위해서이고, 후반에 느려지는 이유는 총 일시충격을 줄이기 위해서다.
흥미로운 것은, 그렇게 얻어지는 고전적 Almgren–Chriss형 전략이 결정론적이라는 점이다. 다시 말해 거래를 얼마나 급히 끝내야 하는지와 관계없이, 최적 속도는 중간가격의 실제 실현 경로에 의존하지 않는다. Chapter 7은 바로 이 고전적 구조가 어떤 현실 요소들 앞에서 깨지거나 변형되는지를 분석한다.
책은 세 가지 확장을 차례로 도입한다. 첫째, 매수자가 허용 가능한 상단 가격을 갖는 경우다. 이때는 가격이 상단에 가까워질수록 더 공격적으로 매수해야 하므로, 최적 속도는 더 이상 midprice와 무관하지 않다. 둘째, 시장 전체의 순주문흐름이 가격의 단기 드리프트를 만든다고 보는 경우다. 이 경우 실행자는 자신의 재고뿐 아니라 현재의 order-flow 상태에도 반응해야 한다. 셋째, lit market과 dark pool을 동시에 사용할 수 있는 경우다. dark pool은 일시적 가격충격을 줄여 주지만, 대신 체결위험을 도입한다.
- 상한가격 제약이 있는 최적 매수 : Section 7.2에서는 대규모 포지션을 취득하려는 투자자가 자신이 지불할 최대가격 \(\bar S\)를 갖는 경우를 분석한다. 이 경우 단순히 \(\bar S\)를 넘으면 거래를 멈춘다는 수준을 넘어, 그 이전 구간에서도 최적 매수속도 자체가 가격경로에 의존하게 된다.
- 정보를 담는 주문흐름 : Section 7.3에서는 다른 시장참가자들의 순주문흐름이 midprice에 영향을 준다고 가정한다. 그러면 실행자는 순매수세가 강할 때는 청산을 늦추고, 순매도세가 강할 때는 청산을 앞당긴다. 즉 자신의 매도만이 아니라 시장 전체의 흐름을 함께 본다.
- 다크풀 접근 : Section 7.4에서는 lit market과 dark pool을 동시에 사용할 수 있는 청산 문제를 다룬다. 초기에는 공개시장에서 AC보다 느리게 거래하면서 남은 전량을 dark pool에 올려 두고, 시간이 지나도 체결이 일어나지 않으면 후반에 공개시장 거래속도를 끌어올리는 구조가 나타난다.
이 장 전체에서는 Chapter 6의 기호를 그대로 사용한다.
7.2 가격 제한이 있는 최적 매수
이 절에서는 거래기간 \[0,T\] 안에 총 \(\mathfrak Q\)주를 취득하려는 투자자를 생각한다. 다만 그녀는 자신이 지불할 수 있는 최대가격 \(\bar S\)를 정해 두었고, 만약 midprice가 그 상한가격 \(\bar S\)에 먼저 도달하면 남은 물량은 즉시 매수되고 프로그램은 종료된다. midprice 동학은 Chapter 6의 연속거래 모형을 유지하되, 영구충격은 \(g(v_t)=b v_t\), 일시충격은 \(f(v_t)=k v_t\)로 둔다.
거래는 다음 세 사건 중 하나가 일어나면 멈춘다. 첫째, 목표 재고 \(\mathfrak Q\)를 모두 취득한 경우. 둘째, 종단시각 \(T\)에 도달한 경우. 셋째, midprice가 상한가격 \(\bar S\)에 도달한 경우다. 따라서 정지시간은
\[ \tau = T\wedge \inf\{t\ge 0:S_t=\bar S\}\wedge \inf\{t\ge 0:Q_t=\mathfrak Q\} \]
로 놓인다. 남은 미취득 물량을 \(Y_t=\mathfrak Q-Q_t\)라 두면
\[ dY_t=-v_t\,dt \]
를 만족한다. 여기서 \(v_t\)는 양의 매수속도다.
이제 성능함수는
\[ H^v(t,S,y)=\mathbb E_{t,S,y}\Bigg[\int_t^\tau (S_u+k v_u)v_u\,du + Y_\tau(S_\tau+aY_\tau)+\phi\int_t^\tau Y_u^2\,du\Bigg],\tag{7.1} \]
가 되고, 가치함수는
\[ H(t,S,y)=\inf_{v\in\mathcal A} H^v(t,S,y) \]
이다. admissible class \(\mathcal A\)는 비음이 아닌, 그리고 위에서 일양유계인 속도전략들의 집합이다.
동적계획원리(DPP)를 적용하면 가치함수는 DPE
\[ \partial_tH+\tfrac12\sigma^2\partial_{SS}H+\phi y^2+\min_v\{-v\partial_yH+bv\partial_SH+(S+kv)v\}=0,\tag{7.2a} \]
를 만족해야 하고, 경계조건은
\[ H(T,S,y)=(S+ay)y,\tag{7.2b} \]
\[ H(t,\bar S,y)=(\bar S+ay)y,\tag{7.2c} \]
\[ H(t,S,0)=0.\tag{7.2d} \]
를 갖는다. 마지막 조건은 이미 목표재고를 다 취득했으면 추가 패널티가 전혀 없음을 뜻한다.
\(t\) 시점에서 길이 \(\Delta t\)의 짧은 구간을 보고 DPP를 적용하면, 현재의 최소 기대비용은 짧은 구간의 즉시비용과 그 다음 시점의 continuation value의 합을 최소화한 값이 되어야 한다. 즉
\[ H(t,S,y)=\inf_v\,\mathbb E\left[(S+kv)v\,\Delta t+\phi y^2\Delta t + H(t+\Delta t,S+\Delta S, y-v\Delta t)\right]+o(\Delta t). \]
여기서 \(\Delta S=bv\Delta t+\sigma\Delta W\)이며 \(\mathbb E[\Delta W]=0\), \(\mathbb E[(\Delta W)^2]=\Delta t\)이므로 Taylor 전개를 취하면
\[ 0=\inf_v\Big\{(S+kv)v-v\partial_yH+bv\partial_SH+\partial_tH+\tfrac12\sigma^2\partial_{SS}H+\phi y^2\Big\} \]
를 얻는다. 이것이 (7.2a)다. 종단시각과 상한가격 도달시점에서는 남은 물량 \(y\)를 한 번에 매수해야 하므로 단위당 가격이 각각 \(S+ay\), \(\bar S+ay\)가 되어 (7.2b)–(7.2c)가 나온다. \(y=0\)이면 더 이상 살 물량이 없으므로 (7.2d)가 성립한다.
일차조건을 취하면 최적 매수속도는
\[ v^*(t,S,y)=-\frac{1}{2k}\bigl(b\partial_SH-\partial_yH+S\bigr) \]
가 된다. 이를 다시 DPE에 대입하면
\[ \partial_tH+\tfrac12\sigma^2\partial_{SS}H+\phi y^2-\frac{1}{4k}\bigl(b\partial_SH-\partial_yH+S\bigr)^2=0,\tag{7.3} \]
라는 비선형 PDE를 얻는다.
최소화해야 할 \(v\)-항은 \(kv^2+(S+b\partial_SH-\partial_yH)v\)이다. 이를 완전제곱하면
\[ k\left(v+\frac{S+b\partial_SH-\partial_yH}{2k}\right)^2-\frac{(S+b\partial_SH-\partial_yH)^2}{4k} \]
가 되므로, 최소값은 제곱항이 0일 때 달성되고 그 값은 음의 상수항이다. 따라서 최적 속도와 (7.3)이 곧바로 도출된다.
영구충격이 없을 때의 차원축소
실무적으로는 영구충격이 일시충격보다 훨씬 약한 경우가 많으므로 책은 차원축소를 위해 \(b=0\)을 둔다. 그러면 DPE와 경계조건의 형태를 보고
\[ H(t,S,y)=yS+y^2 h(t,S) \]
라는 ansatz를 둘 수 있다. 대입하면 \(h\)는 Fisher형 PDE
\[ \partial_t h+\tfrac12\sigma^2\partial_{SS}h-\frac{1}{k}h^2+\phi=0, \qquad (t,S)\in [0,T)\times(-\infty,\bar S),\tag{7.4a} \]
\[ h(T,S)=a,\qquad S\le \bar S,\tag{7.4b} \]
\[ h(t,\bar S)=a,\qquad t\le T,\tag{7.4c} \]
를 만족하고, 최적 매수속도는
\[ v^*(t,S,y)=\frac{1}{2k}y h(t,S).\tag{7.5} \]
가 된다. 따라서 같은 시각과 같은 가격에서 보면 남은 물량이 많을수록 더 빨리 사게 되고, 같은 남은 물량에서도 상한가격에 가까울수록 \(h\)가 커져 매수속도가 증가한다.
\(H=yS+y^2h\)이면 \(\partial_yH=S+2yh\), \(\partial_tH=y^2\partial_th\), \(\partial_SH=y+y^2\partial_Sh\), \(\partial_{SS}H=y^2\partial_{SS}h\)이다. \(b=0\)이므로 (7.3)에 대입하면
\[ y^2\partial_th+\tfrac12\sigma^2 y^2\partial_{SS}h+\phi y^2-\frac{1}{4k}(S-(S+2yh))^2=0. \]
마지막 제곱항은 \( (-2yh)^2 = 4y^2 h^2 \)이므로
\[ y^2\Bigl(\partial_th+\tfrac12\sigma^2\partial_{SS}h-\frac{1}{k}h^2+\phi\Bigr)=0 \]
가 된다. \(y\ge 0\)에서 항등적으로 성립해야 하므로 괄호 안이 0이어야 하며, 이것이 (7.4a)다. 경계조건도 \(H(T,S,y)=(S+ay)y\), \(H(t,\bar S,y)=(\bar S+ay)y\)를 ansatz에 대입하면 즉시 (7.4b)–(7.4c)를 준다. 최적속도는 \(v^*=-(1/2k)(-2yh)=(1/2k)yh\)이므로 (7.5)가 나온다.
Numerical Solution I: Crank–Nicolson
(7.4)는 \((1+1)\)-차원 terminal boundary value problem이므로 Crank–Nicolson 스킴으로 효율적으로 풀 수 있다. 영역 \[0,T]\\times[\underline S,\bar S]에 격자를 놓고 비선형항 \(h^2\)는 explicit하게 취급한다. 그런데 이렇게 하면 아래쪽 인공경계 \(S=\underline S\)에 경계조건이 추가로 필요하다. 책은 보통
\[ \partial_{SS}h(t,\underline S)=0 \]
를 둔다. 이 조건이 실제로 어떤 전략적 의미를 갖는지를 보기 위해 \(x(t)=h(t,\underline S)\)라 놓으면, \(x\)는
\[ \partial_t x-\frac{1}{k}x^2+\phi=0,\qquad x(T)=a \]
를 만족한다. 이는 Riccati 방정식이고 해는
\[ x(t)=\begin{cases} \sqrt{k\phi}\,\dfrac{1+\zeta e^{2\gamma(T-t)}}{1-\zeta e^{2\gamma(T-t)}}, & \phi>0,\[1.0ex] \left(\dfrac{T-t}{k}+\dfrac{1}{a}\right)^{-1}, & \phi=0, \end{cases}\tag{7.6} \]
\[ \gamma=\sqrt{\phi/k},\qquad \zeta=\frac{a-\sqrt{k\phi}}{a+\sqrt{k\phi}}. \]
이 된다. \(x(t)\)는 \(0\le x(t)\le a\)이고 \(t\)에 대해 증가한다. 그리고 \(qS+q^2x(t)\)는 바로 상한가격이 없는 문제의 가치함수다. 따라서 \(\partial_{SS}h(t,\underline S)=0\)는 하단경계에서 상한가격이 없는 AC형 전략을 붙인 것과 같은 효과를 가진다.
Riccati 방정식 \(x_t=x^2/k-\phi\)를 푼다. \(\phi>0\)라 두고 \(s=\sqrt{k\phi}\)라 놓으면 \(x_t=(x^2-s^2)/k\)다. 분리변수법으로
\[ \int_{x(t)}^a \frac{k\,dz}{z^2-s^2}=T-t. \]
부분분수 적분을 하면
\[ \frac{k}{2s}\log\left|\frac{a-s}{a+s}\cdot\frac{x(t)+s}{x(t)-s}\right|=T-t. \]
여기서 \(\gamma=s/k=\sqrt{\phi/k}\), \(\zeta=(a-s)/(a+s)\)를 쓰면
\[ \frac{x(t)+s}{x(t)-s}=\zeta^{-1}e^{2\gamma(T-t)} \]
가 되고, 이를 \(x(t)\)에 대해 풀면 (7.6)의 첫 식이 나온다. \(\phi=0\)이면 \(x_t=x^2/k\)이므로 \(d(1/x)/dt=-1/k\)가 되어 \(1/x(t)=1/a+(T-t)/k\)를 얻는다.
정리 7.1 (최대원리) \(D\subset\mathbb R\)가 bounded connected set이고 \(u:D\times[0,\infty)\to\mathbb R\)가
\[ \partial_tu+\partial_{xx}u=0,\qquad x\in D,\ t>0, \]
\[ u(t,x)=p(t),\qquad x\in\partial D,\ t>0, \]
\[ u(0,x)=q(x),\qquad x\in D \]
를 만족하면
\[ \max_{D\times[0,T]}u\le \max\Bigl(\max_{[0,T]}p(t),\max_D q\Bigr), \]
\[ \min_{D\times[0,T]}u\ge \min\Bigl(\min_{[0,T]}p(t),\min_D q\Bigr) \]
가 성립한다.
최대값 부등식만 보이면 최소값 부등식은 \(-u\)에 적용하여 얻어진다. \(M=\max(\max_{[0,T]}p,\max_D q)\)라 두고 \(w=u-M\)를 생각하자. 그러면 \(w\)는 같은 열방정식을 만족하고, 경계 및 초기면에서는 \(w\le 0\)이다. 이제 \(\varepsilon>0\)에 대해 \(w_\varepsilon(t,x)=w(t,x)-\varepsilon t\)를 두면
\[ \partial_t w_\varepsilon+\partial_{xx}w_\varepsilon=-\varepsilon<0. \]
만약 \(w_\varepsilon\)가 내부점에서 양의 최대를 가진다면, 그 점에서 \(\partial_t w_\varepsilon\ge 0\), \(\partial_{xx}w_\varepsilon\le 0\)여야 하므로 좌변은 0 이상이 된다. 그러나 PDE는 좌변이 \(-\varepsilon\)이라고 말하므로 모순이다. 따라서 양의 최대는 내부에서 생길 수 없고 경계 또는 초기면에만 있을 수 있다. 그런데 그곳에서는 이미 \(w_\varepsilon\le 0\)이므로 전체 영역에서 \(w_\varepsilon\le 0\)이다. 마지막으로 \(\varepsilon\downarrow 0\)를 보내면 \(u\le M\)이 된다.
이 정리를 \(h\)에 적용하면
\[ x(t)\le h(t,S)\le a.\tag{7.7} \]
가 성립한다. 따라서 제한가격 제약이 있으면 같은 재고수준에서 항상 no-limit 전략보다 적어도 빠르게 매수한다.
상계는 \(v=a-h\), 하계는 \(u=h-x\)를 놓고 보이면 된다. 먼저 \(v\)에 대해 \(h\)의 PDE와 \(a\)가 상수라는 점을 이용하면 \(v\)는 적절한 선형 포물형 PDE를 만족하고, 종단 및 상한경계에서 0이거나 양수다. 따라서 최대원리로 \(v\ge 0\), 즉 \(h\le a\)다. 하계도 마찬가지다. \(x\)는 시간만의 함수이므로 \(u=h-x\)는 같은 형태의 선형 포물형 PDE를 만족하며, 종단과 하단경계에서 0 이상이다. 따라서 최대원리로 \(u\ge 0\), 즉 \(h\ge x\)가 된다.
마지막으로 재고경로는
\[ dY_t^*=-v_t^*dt=-\frac{1}{2k}Y_t^*h(t,S_t)dt, \]
\[ Q_t=\Bigl(1-\exp\{-\tfrac{1}{2k}\int_0^t h(u,S_u)du\}\Bigr)\mathfrak Q,\qquad t\le \tau, \]
로 쓸 수 있다. no-limit 문제와 형식은 같지만, 여기서는 \(S_t\)의 실제 경로가 \(h(t,S_t)\)를 통해 재고를 직접 바꾸므로 전략이 경로의존적이 된다.
Numerical Solution II: Iterative Scheme
책은 유한차분 대신 정확 반복법도 제안한다. \((m-1)\)번째 근사해 \(h^{(m-1)}(t,S)\)를 고정하면, 비선형항 \(h^2\)를 \(h^{(m-1)}h^{(m)}\)로 선형화하여
\[ \left(\partial_t+\tfrac12\sigma^2\partial_{SS}-\frac{1}{k}h^{(m-1)}(t,S)\right)h^{(m)}(t,S)+\phi=0,\tag{7.8a} \]
\[ h^{(m)}(t,\underline S)=x(t),\qquad h^{(m)}(t,\bar S)=a,\tag{7.8b} \]
\[ h^{(m)}(T,S)=a.\tag{7.8c} \]
를 푼다. 적분인자 \(\mathcal E^{(m-1)}(t,S)=\exp\{\frac1k\int_t^T h^{(m-1)}(u,S)du\}\)를 도입하여 \(h^{(m)}=\mathcal E^{(m-1)}g^{(m)}\)로 두면 \(g^{(m)}\)는 선형 heat equation형 PDE
\[ (\partial_t+\tfrac12\sigma^2\partial_{SS})g^{(m)}(t,S)+\phi\,\mathcal E^{(m-1)}(t,S)=0\tag{7.9a} \]
를 만족한다. 초기 guess로는 \(x(t)\)와 \(a\)를 잇는 선형보간
\[ h^{(0)}(t,S)=\frac{\bar S-S}{\bar S-\underline S}x(t)+\frac{S-\underline S}{\bar S-\underline S}a \]
를 사용할 수 있다.
The Perpetual Case
만약 종단시각을 \(T\to\infty\)로 보내면 \(h\)는 시간에 의존하지 않고
\[ \tfrac12\sigma^2 h''(S)-\frac{1}{k}h(S)^2+\phi=0,\tag{7.10a} \]
\[ h(\bar S)=a,\qquad h(\underline S)=\sqrt{k\phi}.\tag{7.10b} \]
를 만족하는 경계값문제로 바뀐다. 책은 \(\phi>0\)일 때 Weierstrass elliptic function으로 닫힌형을 줄 수 있다고 말하고, \(\phi=0\), \(\underline S\to-\infty\)일 때는 원시함수 수준의 해로 단순화된다고 설명한다. 핵심 경제적 결론은 변하지 않는다. 상한가격 \(\bar S\)에 가까워질수록 같은 남은 재고 \(y\)에 대해서도 최적 매수속도 \(v^*=(1/2k)yh(S)\)가 상승한다는 점이다.
이제 책은 시뮬레이션을 통해 전략의 동적 성질을 확인한다. 기본 파라미터는 \(T=1\text{ day}\), \(a=100k\), \(k=10^{-4}\), \(b=0\), \(\phi=10^{-3}\), \(\sigma=0.1\)이다. 목표 취득물량은 \(\mathfrak Q=1\)로 정규화하고, 초당 한 번씩 거래한다고 가정한다. \(a/k\)가 최대 거래속도를 결정하므로 \(a\)의 선택은 사실상 공격성의 상한을 정한다.
그림 7.1의 왼쪽 패널에서 만기에 가까워질수록, 그리고 가격이 상한 \(\bar S\)에 가까워질수록 잔여재고 대비 매수속도 \(v^*/y\)가 증가하는 것을 볼 수 있다. 이는 (7.7)이 강제하는 구조와 정확히 맞닿아 있다. 상한가격이 없는 경우에는 최적전략이 자산변동성에 무관했지만, 가격제약이 들어오면 변동성이 커질수록 가격이 상한에 닿을 확률이 커지기 때문에 더 빨리 매수해야 한다.
그림 7.2는 세 개의 경로를 비교한다. 빨간 경로는 대부분 상한에서 멀리 떨어져 있으므로 AC 전략에 매우 가깝다. 파란 경로는 도착가격 근방을 맴돌다가 \(t\approx 0.2\)와 \(t\approx 0.6\) 부근에서 상한에 가까워져 매수속도가 순간적으로 치솟는다. 초록 경로는 초기에 상한에 닿아 프로그램이 빠르게 종결되는 경우다. 오른쪽 아래의 주당비용 패널에서는 상한을 빨리 건드린 초록 경로가 가장 비싸다. 이는 midprice가 전반적으로 더 높았고, 동시에 가격상승 추세 때문에 더 빠른 매수를 유도해 일시충격도 크게 발생했기 때문이다.
그림 7.3의 평균 재고경로는 AC 전략 위에 놓인다. 같은 재고수준에서는 제한가격 전략이 AC보다 적어도 빠르게 거래해야 하기 때문이다. 다만 평균 거래속도는 항상 AC 위에 있지 않다. 초반에는 더 공격적이어서 평균속도가 AC보다 높지만, 그 결과 재고가 빨리 줄어 후반에는 오히려 평균속도가 AC보다 아래로 내려간다.
7.3 주문흐름(order flow)을 반영한 최적 청산
이전 장과 직전 절에서는, 투자자의 거래가 없으면 midprice가 마팅게일이라고 가정했다. 또한 투자자가 매도(또는 매수)를 시작하면 그 행위가 midprice에 하방(또는 상방) 드리프트를 만든다고 가정했다. 그런데 동시에 다른 시장참가자들의 거래는 모두 평균적으로 상쇄된다고 보고 있었다. 장기 평균에서는 이 가정이 크게 무리 없을 수 있지만, 짧은 시간구간에서는 order-flow imbalance가 가격을 유의미하게 한쪽으로 밀 수 있다. 이 절은 바로 그 효과를 모델 안으로 넣는다.
모형 설정
매수 및 매도 주문흐름률을 각각 \(\mu_t^+\), \(\mu_t^-\)라 하고, 이들이
\[ d\mu_t^+=-\kappa\mu_t^+dt+\eta\,dL_t^+, \qquad d\mu_t^-=-\kappa\mu_t^-dt+\eta\,dL_t^-,\tag{7.13} \]
를 만족한다고 하자. 여기서 \(L_t^\pm\)는 같은 강도 \(\lambda\)를 갖는 독립 포아송과정이다. 이 가정은 주문흐름률이 포아송 시점마다 \(\eta\)만큼 점프하고 이후 속도 \(\kappa\)로 감쇠하는 구조를 뜻한다. 순주문흐름 \(\mu_t=\mu_t^+-\mu_t^-\)를 정의하고 영구충격함수 \(g(x)=bx\)를 가정하면
\[ d\mu_t=-\kappa\mu_tdt+\eta(dL_t^+-dL_t^-), \qquad dS_t=\sigma dW_t+b(\mu_t-v_t)dt \]
로 요약된다. 따라서 이제 실행자는 자신의 거래속도뿐 아니라 현재 order-flow 상태 \(\mu_t\)에도 반응해야 한다.
현금과 재고는
\[ dQ_t^v=-v_tdt, \qquad dX_t^v=(S_t-kv_t)v_tdt, \]
를 만족하고, 성능함수는
\[ H^v(t,x,S,\mu,q)=\mathbb E_{t,x,S,\mu,q}\left[X_T^v+Q_T^v(S_T-aQ_T^v)-\phi\int_t^T(Q_u^v)^2du\right].\tag{7.14} \]
이다.
DPE와 생성자
DPP에 따르면 가치함수는
\[ 0=(\partial_t+\tfrac12\sigma^2\partial_{SS})H+\mathcal L^\mu H-\phi q^2+ \sup_v\{v(S-kv)\partial_xH+b(\mu-v)\partial_SH-v\partial_qH\}, \]
\[ H(T,x,S,\mu,q)=x+qS-aq^2, \]
\[ \mathcal L^\mu H=-\kappa\mu\partial_\mu H+\lambda\bigl(H(t,x,S,\mu+\eta,q)-H(t,x,S,\mu,q)\bigr)+\lambda\bigl(H(t,x,S,\mu-\eta,q)-H(t,x,S,\mu,q)\bigr).\tag{7.15} \]
를 만족한다.
브라운 운동 부분은 표준 diffusion generator \(\partial_t+\frac12\sigma^2\partial_{SS}\)를 준다. 순주문흐름은 평균회귀 drift \(-\kappa\mu\)와 두 방향의 점프 \(\pm\eta\)를 가지므로, 그 생성자는 drift 미분항과 두 개의 jump difference 항의 합으로 나타난다. 제어항에서는 현금 증가율 \((S-kv)v\), 영구충격에 따른 가격 drift \(b(\mu-v)\), 그리고 재고 drift \(-v\)가 각각 \(\partial_xH\), \(\partial_SH\), \(\partial_qH\)에 결합한다. 이를 모두 더하면 위 식이 나온다.
이제 책가치 ansatz
\[ H(t,x,S,\mu,q)=x+qS+h(t,\mu,q) \]
를 넣으면 excess book value function \(h\)는
\[ \partial_t h+\mathcal L^\mu h+b\mu q-\phi q^2+ \sup_v\{-kv^2-(bq+\partial_q h)v\}=0, \qquad h(T,\mu,q)=-aq^2.\tag{7.16} \]
를 만족한다. 일차조건은
\[ v^*=-\frac{1}{2k}(bq+\partial_q h) \]
이고, \(h\)를
\[ h(t,\mu,q)=h_0(t,\mu)+q h_1(t,\mu)+q^2 h_2(t,\mu) \]
라는 이차형으로 두면 차수별로 다음 연립계가 나온다.
\[ \partial_t h_0+\mathcal L^\mu h_0+\frac{1}{4k}h_1^2=0,\tag{7.17a} \]
\[ \partial_t h_1+\mathcal L^\mu h_1+\frac{1}{2k}(b+2h_2)h_1+b\mu=0,\tag{7.17b} \]
\[ \partial_t h_2-\phi+\frac{1}{4k}(b+2h_2)^2=0,\tag{7.17c} \]
\[ h_0(T,\mu)=0,\qquad h_1(T,\mu)=0,\qquad h_2(T,\mu)=-a. \]
\(\partial_q h=h_1+2qh_2\)이고
\[ \frac{1}{4k}(bq+\partial_q h)^2=\frac{1}{4k}\bigl(h_1+q(b+2h_2)\bigr)^2 =\frac{1}{4k}h_1^2+q\frac{1}{2k}(b+2h_2)h_1+q^2\frac{1}{4k}(b+2h_2)^2. \]
여기에 \(\partial_t h\), \(\mathcal L^\mu h\), \(b\mu q\), \(-\phi q^2\)를 더한 뒤 \(1,q,q^2\)의 계수를 각각 0으로 두면 (7.17a)–(7.17c)가 얻어진다.
\(h_2\)는 \(\mu\)에 대한 source term이 없고 종단조건도 \(\mu\)와 무관하므로 시간의 함수만 된다. 이를 풀면 AC 문제의 Riccati 해와 같은 형태가 된다. 결과적으로
\[ v_t^*=\frac{1}{k}\chi(t)Q_t^v-\frac{b}{2k}\ell_1(t)\mu_t.\tag{7.20} \]
라는 구조가 나온다. 첫 번째 항은 고전적 AC 항이고, 두 번째 항이 order-flow correction이다. \(\mu_t>0\)이면 순매수세가 강하므로 앞으로 가격이 오를 가능성이 높아 청산자는 속도를 늦춘다. \(\mu_t<0\)이면 순매도세가 강하므로 더 빨리 판다. 즉 실행자는 시장 전체의 흐름이 자기 방향과 같은지 반대인지를 보고 자신의 속도를 국소적으로 조정한다.
그림 7.4는 세 가지 표본경로를 보여 준다. 초록 경로처럼 양의 주문흐름이 강하면 청산자는 초반에 속도를 늦춘다. 반대로 파란 경로처럼 음의 주문흐름이 지속되면 가격이 더 내려가기 전에 빨리 팔기 위해 AC보다 빠르게 청산한다. 빨간 경로처럼 흐름이 거의 0 주위에서 진동하면 전략은 AC 경로에 매우 가깝되, 국소적으로만 조정된다.
그림 7.5는 \(\eta\)의 분산이 더 큰 경우 청산속도 heat-map의 폭이 훨씬 커짐을 보여 준다. 흥미롭게도 최적속도 공식 자체에는 \(\eta\)가 명시적으로 들어가지 않지만, 실제 경로 \(\mu_t\)가 더 요동치므로 결과적인 전략의 산포가 커진다.
7.3.1 확률론적 표현(Feynman–Kac 해석)
이제 \(\mu\)의 구체적 동학을 고정하지 않고, 생성자 \(\mathcal L^\mu\)만 주어진 일반적 경우를 생각하자. 이때도 핵심은 \(h_1\)이 선형 PIDE를 만족한다는 점이다. 구체적으로
\[ \partial_t h_1+\mathcal L^\mu h_1-\frac{1}{k}\left(h_2+\frac{b}{2}\right)h_1+b\mu=0 \]
는 할인율 \((h_2+b/2)/k\)와 source term \(b\mu\)를 갖는 선형 방정식이고, 따라서 Feynman–Kac 정리로
\[ h_1(t,\mu)=b\,\mathbb E_{t,\mu}\!\left[\int_t^T \exp\!\left\{\frac{1}{2k}\int_t^u\left(h_2(s)+\frac{b}{2}\right)ds\right\}\mu_u\,du\right] \]
로 표현된다. Chapter 6의 적분항을 정리하면
\[ h_1(t,\mu)=b\,\mathbb E_{t,\mu}\!\left[\int_t^T \frac{\sinh(\gamma(T-u))}{\sinh(\gamma(T-t))}\mu_u\,du\right].\tag{7.22} \]
따라서 최적 거래속도는
\[ v_t^*=\gamma\frac{\cosh(\gamma(T-t))}{\sinh(\gamma(T-t))}Q_t^v- \frac{1}{2k}\frac{1}{\sinh(\gamma(T-t))} \mathbb E\!\left[\int_t^T\sinh(\gamma(T-u))\mu_u\,du\ \middle|\ \mathcal F_t^\mu\right].\tag{7.23} \]
즉 order-flow correction은 미래 기대 순주문흐름의 가중평균이다. 만기가 가까워질수록 \(\sinh(\gamma(T-u))\)가 지탱하는 유효구간이 짧아지므로, 시장흐름 정보의 중요성은 빠르게 감소한다.
\(h_1\) 방정식은 선형이며 종단조건은 0이다. 일반적인 선형 방정식 \(u_t+\mathcal Lu-r(t)u+f=0\)는 Feynman–Kac에 의해 \(u(t)=\mathbb E[\int_t^T e^{-\int_t^s r}f(s)ds]\) 형태를 갖는다. 여기서는 \(r=-(h_2+b/2)/(2k)\), \(f=b\mu\)이므로 위 표현이 성립한다. 이후 Chapter 6의 Riccati 적분을 이용해 지수인자를 hyperbolic weight로 바꾸면 (7.22)와 (7.23)이 얻어진다.
7.4 공개시장과 다크시장을 동시에 사용하는 최적 청산
이제 투자자는 transparent한 공개시장(lit market)뿐 아니라 dark pool에도 접근할 수 있다고 하자. 공개시장에서는 시장가 주문 \(v_tdt\)를 내면 단위당 체결가격이 \(S_t-kv_t\)가 되어 일시충격을 부담한다. 반면 dark pool에서는 가격이 lit market의 midprice에 pegged되므로 추가 일시충격은 없지만, 언제 체결될지, 그리고 얼마나 체결될지 알 수 없다. 즉 비용 감소와 체결위험 사이의 전형적 교환관계가 생긴다.
투자자는 공개시장에서 연속적으로 거래하는 동시에 dark pool에 \(Y_t\le q_t\)만큼의 재고를 게시할 수 있다. 반대편 dark-pool 주문은 강도 \(\lambda\)의 포아송과정 \(N_t\)의 도착시점에 들어오고, 각 도착 주문량은 i.i.d. 확률변수 \(\xi_i\)로 표현한다. 따라서 재고동학은
\[ dQ_t^{v,Y}=-v_tdt-\min(Y_t,\xi_{N_t})dN_t \]
가 되고, 현금과정은
\[ dX_t^{v,Y}=(S_t-kv_t)v_tdt+S_t\min(Y_t,\xi_{N_t})dN_t. \]
성과기준은
\[ H^{v,Y}(t,x,S,q)=\mathbb E_{t,x,S,q}\left[X_T^{v,Y}+Q_T^{v,Y}(S_T-aQ_T^{v,Y})-\phi\int_t^T (Q_u^{v,Y})^2du\right] \]
이며, 가치함수는 \(H(t,x,S,q)=\sup_{v,Y\in\mathcal A}H^{v,Y}(t,x,S,q)\)다.
DPP를 적용하면
\[ \partial_tH+\tfrac12\sigma^2\partial_{SS}H-\phi q^2+\sup_v\{(S-kv)v\partial_xH-v\partial_qH\} +\sup_{y\le q}\left\{\lambda\,\mathbb E\bigl[H(t,x+S\min(y,\xi),S,q-\min(y,\xi))-H(t,x,S,q)\bigr]\right\}=0, \]
\[ H(T,x,S,q)=x+q(S-aq). \]
책가치 ansatz \(H=x+qS+h(t,q)\)를 넣으면 더 단순한 방정식
\[ \partial_t h-\phi q^2+\sup_v\{-kv^2-v\partial_q h\}+ \lambda\sup_{y\le q}\mathbb E\bigl[h(t,q-\min(y,\xi))-h(t,q)\bigr]=0,\tag{7.24} \]
\[ h(T,q)=-aq^2, \qquad v^*=-\frac{1}{2k}\partial_q h.\tag{7.25} \]
를 얻는다. 일반적으로 \(y\)에 대한 최적화는 수치해석이 필요하다.
dark pool의 jump는 도착강도 \(\lambda\)를 가진 점프항이므로, infinitesimal 시간 \(dt\) 동안 확률 \(\lambda dt\)로 발생한다. jump가 발생하면 재고는 \(q\mapsto q-\min(y,\xi)\), 현금은 \(x\mapsto x+S\min(y,\xi)\)로 이동한다. 따라서 continuation value 차이가 \(\lambda\mathbb E[\cdot]\) 형태로 DPE에 들어간다. 이 항이 바로 lit-only 문제와 dark-pool 문제를 갈라놓는 핵심이다.
7.4.1 들어오는 dark-pool 주문이 항상 전량 체결시키는 경우
책은 명시해를 얻기 위해 \(\xi_i\ge \mathfrak Q\)를 가정한다. 즉 dark pool에 반대편 주문이 한 번 도착하기만 하면, 투자자가 올려 둔 주문은 언제나 전량 체결된다. 이 경우 \(\min(y,\xi)=y\)가 되어 DPE는 크게 단순화된다.
이제
\[ h(t,q)=h_0(t)+h_1(t)q+h_2(t)q^2, \qquad h_0(T)=h_1(T)=0,\ h_2(T)=-a \]
라는 ansatz를 두면
\[ \sup_{y\le q}\mathbb E[h(t,q-\min(y,\xi))-h(t,q)] =\sup_{y\le q}[h(t,q-y)-h(t,q)] \]
이고, 이를 대입하면
\[ \sup_{y\le q}[-yh_1+(y^2-2qy)h_2]=- \frac{(h_1-2qh_2)^2}{4h_2}. \]
따라서 dark pool의 최적 게시물량은
\[ y^*=q+\frac{h_1}{2h_2}, \qquad v^*=-\frac{1}{2k}(h_1+2qh_2) \]
가 된다. 이를 (7.24)에 대입하면 계수 비교로
\[ \partial_t h_2-\phi-\lambda h_2+\frac{1}{k}h_2^2=0,\tag{7.26a} \]
\[ \partial_t h_1+\left(\lambda+\frac{1}{k}h_2\right)h_1=0,\tag{7.26b} \]
\[ \partial_t h_0+\frac{1}{4k}h_1^2-\frac{\lambda}{4h_2}h_1^2=0.\tag{7.26c} \]
를 얻는다. 종단에서 \(h_1(T)=0\)이므로 선형 ODE의 유일해성에 의해 \(h_1\equiv 0\), 이어서 \(h_0\equiv 0\)가 된다. 결국 남는 것은 \(h_2\)에 대한 수정된 Riccati ODE 하나뿐이다.
\(h(t,q-y)-h(t,q)=-yh_1+(y^2-2qy)h_2\)는 \(y\)에 대한 이차식이다. \(h_2<0\)이므로 아래로 오목한 함수이고, 내부 극댓값은 도함수 \(-h_1+2yh_2-2qh_2=0\)에서
\[ y^*=q+\frac{h_1}{2h_2} \]
로 주어진다. 이 값을 대입하면 supremum 값이 위 식이 된다. 다시 \(v\)-최적화는 완전제곱으로 처리할 수 있으므로 계수별 비교를 하면 (7.26a)–(7.26c)가 따라온다. \(h_1\)의 ODE는 종단값 0을 갖는 선형 동차 ODE이므로 영해밖에 없고, 따라서 \(h_0\)도 0이다.
Riccati 방정식 \(\partial_t h_2-\phi-\lambda h_2+\frac1k h_2^2=0\)의 해를 위해, 다항식 \(\phi+\lambda p-\frac1k p^2=0\)의 근 \(c_\pm\)를 정의하자.
\[ c_\pm=\frac{k\lambda}{2}\pm \sqrt{\frac{k^2\lambda^2}{4}+k\phi}. \]
그러면 (7.26a)는
\[ \partial_t h_2=-\frac{1}{k}(h_2-c_+)(h_2-c_-) \]
로 쓸 수 있고, 적분하면
\[ \log\left(\frac{h_2-c_-}{h_2-c_+}\right)-\log\left(\frac{-a-c_-}{-a-c_+}\right)= -\frac{c_+-c_-}{k}(T-t) \]
를 얻는다. 이를 정리하면
\[ v_t^{*,y^*}=-\frac{1}{k}h_2(t)Q_t^{*,y^*}, \qquad Y_t^*=Q_t^{*,y^*}.\tag{7.27} \]
\[ dQ_t^{*,y^*}=\frac{1}{k}h_2(t)Q_t^{*,y^*}dt, \qquad Q_t^{*,y^*}=Q_0\exp\left\{\frac1k\int_0^t h_2(u)du\right\}.\tag{7.28} \]
dark pool에는 항상 남은 전량을 올리는 것이 최적이라는 결론은 매우 직관적이다. dark pool 체결에는 일시충격이 없으므로, 체결되기만 하면 가장 좋은 가격을 받을 수 있기 때문이다. 그 대신 lit market 속도 \(v_t^*\)는 AC보다 초기에 느려지고 후반에 빨라질 수 있다. 이것이 inventory leakage 효과다.
그림 7.6은 \(\lambda=0\)이면 AC 문제로 되돌아가고, \(\lambda>0\)이면 초기에 AC보다 느리게 거래하다가 시간이 지나도 dark-pool 체결이 없으면 나중에 더 공격적으로 거래하는 구조가 나타남을 보여 준다. 특히 거래속도 곡선은 더 이상 단조감소형이 아니며, 곡률의 부호가 중간에 바뀔 수 있다. \(\lambda\to\infty\)이면 dark pool 체결이 사실상 보장되므로 공개시장에서는 거의 거래하지 않게 된다.
Chapter 7의 세 확장은 모두 Chapter 6의 AC 기준모형을 유지한 채, 상태변수를 하나씩 더 붙이는 방식으로 이해할 수 있다. 가격제약은 \(S_t\)를, 정보성 주문흐름은 \(\mu_t\)를, 다크풀은 점프형 체결위험을 상태공간에 추가한다. 그 결과 DPE/HJB의 구조는 유지되지만, 전략은 더 이상 순수한 시간함수에 머무르지 않고 가격경로, 주문흐름 경로, 체결사건에 의해 수정된다.
'Financial Engineering > ALGORITHMIC AND HIGH-FREQUENCY TRADING' 카테고리의 다른 글
| 9 (1) | 2026.03.22 |
|---|---|
| 8 (0) | 2026.03.22 |
| Chapter 6. Optimal Execution with Continuous Trading I (0) | 2026.03.22 |
| Chapter 5. Stochastic Optimal Control and Stopping (0) | 2026.03.22 |
| Chapter 4. Empirical and Statistical Evidence: Activity and Market Quality (0) | 2026.03.22 |