본문 바로가기

Financial Engineering/ALGORITHMIC AND HIGH-FREQUENCY TRADING

Chapter 11. Pairs Trading and Statistical Arbitrage Strategies

 

Algorithmic and High-Frequency Trading - Chapter 11
Pairs Trading and Statistical Arbitrage Strategie


Part A - 선수지식

1. 확률공간, 여과, 적응과정, 마팅게일

정의 1.1 (\(\sigma\)-대수). 집합 \(\Omega\)의 부분집합족 \(\mathcal F\subset 2^\Omega\)가 다음 세 조건을 만족하면 \(\sigma\)-대수라고 한다.

  • \(\Omega\in\mathcal F\).
  • \(A\in\mathcal F\)이면 \(A^c\in\mathcal F\).
  • \(A_1,A_2,\dots\in\mathcal F\)이면 \(\bigcup_{n=1}^\infty A_n\in\mathcal F\).

정의 1.2 (확률공간). 확률공간은 삼중쌍 \((\Omega,\mathcal F,\mathbb P)\)이다. 여기서 \(\mathbb P\)는 \(\mathcal F\) 위의 확률측도이다.

정의 1.3 (여과). \(\mathbb F=(\mathcal F_t)_{t\ge 0}\)가 \(s\le t\Rightarrow \mathcal F_s\subseteq\mathcal F_t\)를 만족하면 여과라고 한다.

정의 1.4 (적응과정). 확률과정 \(X=(X_t)_{t\ge 0}\)가 모든 \(t\ge 0\)에 대해 \(X_t\)가 \(\mathcal F_t\)-가측이면 \(\mathbb F\)-적응과정이라고 한다.

정의 1.5 (정지시간). 확률변수 \(\tau:\Omega\to[0,\infty]\)가 모든 \(t\ge0\)에 대해 \(\{\tau\le t\}\in\mathcal F_t\)를 만족하면 \(\mathbb F\)-정지시간이라고 한다.

정의 1.6 (마팅게일). 적응과정 \(M=(M_t)_{t\ge0}\)가 각 \(t\)에 대해 \(M_t\in L^1\)이고, 모든 \(0\le s\le t\)에 대해

$$\mathbb E[M_t\mid \mathcal F_s]=M_s \quad \text{a.s.}$$

를 만족하면 \(\mathbb F\)-마팅게일이라고 한다.

정의 1.7 (브라운 운동). 연속 적응과정 \(W=(W_t)_{t\ge0}\)가 \(W_0=0\)이고, 독립증분을 가지며, 각 증분 \(W_t-W_s\)가 평균 \(0\), 분산 \(t-s\)인 정규분포를 따르면 브라운 운동이라고 한다.

Chapter 11과의 연결. Pairs trading 장에서 상태변수는 단일 가격이 아니라 공적분 요인 \(C_t\), 혹은 \(X_t-\beta Y_t\) 같은 선형결합이다. 최적진입·최적청산은 정지시간 문제이고, 가치함수는 조건부기대와 마팅게일 성질 위에서 정의된다. 따라서 여과, 적응성, 정지시간, 마팅게일은 장식이 아니라 본문 전체의 문법이다.

2. Radon-Nikodym 정리와 조건부기대

정의 2.1 (절대연속). 두 측도 \(\nu,\mu\)에 대해 \(\mu(A)=0\Rightarrow \nu(A)=0\)가 모든 가측집합 \(A\)에 대해 성립하면 \(\nu\ll\mu\)라 쓰고, \(\nu\)가 \(\mu\)에 대해 절대연속이라고 한다.

정의 2.2 (Radon-Nikodym derivative). \(\nu\ll\mu\)일 때 가측함수 \(f\)가 모든 가측집합 \(A\)에 대해

$$\nu(A)=\int_A f\,d\mu$$

를 만족하면 \(f\)를 \(\frac{d\nu}{d\mu}\)라 쓴다.

정리 2.3 (Radon-Nikodym 정리). \((\Omega,\mathcal F)\) 위의 \(\sigma\)-유한 측도 \(\mu\)와 \(\nu\)가 주어져 있고 \(\nu\ll\mu\)라고 하자. 그러면 어떤 \(\mathcal F\)-가측 함수 \(f\ge0\)가 존재하여 모든 \(A\in\mathcal F\)에 대해

$$\nu(A)=\int_A f\,d\mu$$

가 성립한다. 또한 이러한 \(f\)는 \(\mu\)-a.e. 유일하다.

증명. 확률론 문맥에서는 대부분 \(\mu(\Omega)<\infty\)인 경우를 쓰므로 먼저 유한측도 경우를 적고, \(\sigma\)-유한 경우는 분할 뒤 이어 붙이면 된다.

집합

$$\mathcal C:=\left\{g\in L^1(\mu): g\ge0,\ \int_A g\,d\mu\le \nu(A)\ \text{for all }A\in\mathcal F\right\}$$

를 정의한다. \(g=0\)은 \(\mathcal C\)에 들어가므로 \(\mathcal C\neq\varnothing\)이다. 이제

$$\alpha:=\sup_{g\in\mathcal C}\int_\Omega g\,d\mu$$

를 둔다. \(\alpha\)의 정의에 의해 \(\int g_n\,d\mu\uparrow \alpha\)가 되도록 \(g_n\in\mathcal C\)를 잡을 수 있다. 각 \(n\)에 대해

$$f_n:=\max\{g_1,\dots,g_n\}$$

라고 두면 \(f_n\ge0\), \(f_n\uparrow f\)이고, 임의의 \(A\in\mathcal F\)에 대해 \(f_n\le g_1+\cdots+g_n\)이므로 적분가능하다. 또한 \(\max(g,h)\in\mathcal C\)임을 보이자. \(B:=\{g\ge h\}\in\mathcal F\)라 두면

$$\int_A \max(g,h)\,d\mu=\int_{A\cap B}g\,d\mu+\int_{A\cap B^c}h\,d\mu\le \nu(A\cap B)+\nu(A\cap B^c)=\nu(A).$$

따라서 \(f_n\in\mathcal C\)이다. 단조수렴정리를 적용하면 모든 \(A\in\mathcal F\)에 대해

$$\int_A f\,d\mu=\lim_{n\to\infty}\int_A f_n\,d\mu\le \nu(A),$$

즉 \(f\in\mathcal C\)이고 \(\int f\,d\mu=\alpha\)이다.

이제 남는 차측도

$$\eta(A):=\nu(A)-\int_A f\,d\mu,\qquad A\in\mathcal F$$

를 정의한다. \(\eta\)는 음이 아닌 측도이다. 만약 \(\eta\not\equiv0\)이면 어떤 \(B\in\mathcal F\)가 존재하여 \(\eta(B)>0\)이다. 그러면 \(\eta_B(A):=\eta(A\cap B)\) 역시 \(\mu\)에 대해 절대연속인 유한측도이다. 여기서 다시 동일한 극대화 논리를 \(\eta_B\)에 적용하면 \(h\ge0\), \(h\not\equiv0\), 그리고 모든 \(A\)에 대해

$$\int_A h\,d\mu\le \eta_B(A)\le \eta(A)$$

인 가측함수를 얻는다. 그러면 \(f+h\)에 대해

$$\int_A (f+h)\,d\mu\le \int_A f\,d\mu+\eta(A)=\nu(A),$$

즉 \(f+h\in\mathcal C\)이다. 그러나 \(h\not\equiv0\)이므로 \(\int h\,d\mu>0\)이고, 따라서

$$\int_\Omega(f+h)\,d\mu=\int_\Omega f\,d\mu+\int_\Omega h\,d\mu>\alpha,$$

이는 \(\alpha\)의 정의에 모순이다. 따라서 \(\eta\equiv0\)이어야 하고, 즉 모든 \(A\in\mathcal F\)에 대해

$$\nu(A)=\int_A f\,d\mu$$

가 성립한다.

유일성은 간단하다. 만약 \(f,g\)가 둘 다 위 성질을 만족한다면 집합 \(A=\{f>g\}\)에 대해

$$\int_A f\,d\mu=\nu(A)=\int_A g\,d\mu,$$

이므로

$$\int_A (f-g)\,d\mu=0.$$

적분함수는 \(A\) 위에서 음이 아니므로 \(\mu(A)=0\)이어야 한다. 같은 방식으로 \(\{g>f\}\)도 \(\mu\)-영집합이다. 따라서 \(f=g\) \(\mu\)-a.e.이다. \(\sigma\)-유한 경우는 \(\Omega=\bigcup_n \Omega_n\), \(\mu(\Omega_n),\nu(\Omega_n)<\infty\)인 분할에서 각 조각에 대해 위 결과를 적용하면 된다.

정의 2.4 (부분 \(\sigma\)-대수에 대한 제한측도). \(\mathcal G\subseteq\mathcal F\)가 부분 \(\sigma\)-대수이면 \(\mathbb P|_{\mathcal G}\)는 \(\mathcal G\) 위의 제한측도이다.

정의 2.5 (조건부기대). \(X\in L^1(\Omega,\mathcal F,\mathbb P)\), \(\mathcal G\subseteq\mathcal F\)라 하자. \(\mathcal G\)-가측 확률변수 \(Y\)가 모든 \(A\in\mathcal G\)에 대해

$$\int_A Y\,d\mathbb P=\int_A X\,d\mathbb P$$

를 만족하면 \(Y\)를 \(\mathbb E[X\mid\mathcal G]\)라 한다.

정리 2.6 (조건부기대의 존재와 유일성). \(X\in L^1(\Omega,\mathcal F,\mathbb P)\), \(\mathcal G\subseteq\mathcal F\)이면 \(\mathbb E[X\mid\mathcal G]\)가 존재하며, \(\mathbb P\)-a.s. 유일하다.

증명. 먼저 \(X\ge0\)인 경우를 보자. \(\mathcal G\) 위의 측도 \(\nu\)를

$$\nu(A):=\int_A X\,d\mathbb P,\qquad A\in\mathcal G$$

로 정의한다. \(X\in L^1\)이므로 \(\nu\)는 유한측도이다. 또한 \(A\in\mathcal G\)이고 \(\mathbb P(A)=0\)이면 \(\nu(A)=0\)이므로 \(\nu\ll \mathbb P|_{\mathcal G}\)이다. Radon-Nikodym 정리에 의해 어떤 \(\mathcal G\)-가측 함수 \(Y\ge0\)가 존재하여

$$\nu(A)=\int_A Y\,d\mathbb P,\qquad A\in\mathcal G.$$

즉 \(Y=\mathbb E[X\mid\mathcal G]\)이다.

이제 일반적인 \(X\in L^1\)에 대해 \(X=X^+-X^-\)로 나눈다. \(X^+,X^-\ge0\)이고 둘 다 적분가능하므로 위에서 각각 \(\mathbb E[X^+\mid\mathcal G]\), \(\mathbb E[X^-\mid\mathcal G]\)가 존재한다. 따라서

$$Y:=\mathbb E[X^+\mid\mathcal G]-\mathbb E[X^-\mid\mathcal G]$$

는 \(\mathcal G\)-가측이며 \(L^1\)에 속한다. 임의의 \(A\in\mathcal G\)에 대해

$$\int_A Y\,d\mathbb P =\int_A X^+\,d\mathbb P-\int_A X^-\,d\mathbb P =\int_A X\,d\mathbb P,$$

따라서 \(Y=\mathbb E[X\mid\mathcal G]\)이다.

유일성은 \(Y_1,Y_2\)가 둘 다 조건부기대라고 할 때 \(A=\{Y_1>Y_2\}\in\mathcal G\)를 대입하면

$$\int_A (Y_1-Y_2)\,d\mathbb P=0$$

를 얻는다는 사실에서 나온다. integrand가 \(A\)에서 음이 아니므로 \(\mathbb P(A)=0\), 즉 \(\mathbb P(Y_1>Y_2)=0\)이다. 대칭적으로 \(\mathbb P(Y_2>Y_1)=0\). 따라서 \(Y_1=Y_2\) a.s.이다.

정리 2.7 (Tower property). \(\mathcal H\subseteq \mathcal G\subseteq \mathcal F\), \(X\in L^1\)이면

$$\mathbb E[\mathbb E[X\mid\mathcal G]\mid\mathcal H]=\mathbb E[X\mid\mathcal H]\quad \text{a.s.}$$

증명. \(Y:=\mathbb E[X\mid\mathcal G]\)라 두자. \(Y\)는 \(\mathcal G\)-가측이고 적분가능하다. \(\mathbb E[Y\mid\mathcal H]\) 역시 \(\mathcal H\)-가측이다. 임의의 \(A\in\mathcal H\)에 대해 \(\mathcal H\subseteq\mathcal G\)이므로 \(A\in\mathcal G\)이다. 따라서

$$\int_A \mathbb E[Y\mid\mathcal H]\,d\mathbb P =\int_A Y\,d\mathbb P =\int_A X\,d\mathbb P.$$

즉 \(\mathbb E[Y\mid\mathcal H]\)는 \(\mathcal H\)-가측이고 모든 \(A\in\mathcal H\)에 대해 \(X\)와 적분을 일치시킨다. 조건부기대의 유일성으로부터 결론이 성립한다.

정리 2.8 (Pull-out property). \(X\in L^1\), \(Z\)가 \(\mathcal G\)-가측이며 \(XZ\in L^1\)라고 하자. 그러면

$$\mathbb E[XZ\mid\mathcal G]=Z\,\mathbb E[X\mid\mathcal G]\quad \text{a.s.}$$

증명. 오른쪽 항은 \(\mathcal G\)-가측이다. 따라서 적분 동일성만 확인하면 된다. 임의의 \(A\in\mathcal G\)에 대해 \(1_AZ\)도 \(\mathcal G\)-가측이므로

$$\int_A Z\,\mathbb E[X\mid\mathcal G]\,d\mathbb P =\int_\Omega 1_AZ\,\mathbb E[X\mid\mathcal G]\,d\mathbb P =\int_\Omega 1_AZX\,d\mathbb P =\int_A ZX\,d\mathbb P.$$

정의와 유일성에 의해 결론이 따른다.

3. 균등적분가능성, 정지시간, stopped process

정의 3.1 (stopped process). 과정 \(X=(X_t)_{t\ge0}\)와 정지시간 \(\tau\)에 대해 \(X^\tau_t:=X_{t\wedge\tau}\)를 stopped process라 한다.

정의 3.2 (균등적분가능성). 적분가능 확률변수족 \(\mathcal X\subset L^1\)가

$$\lim_{K\to\infty}\sup_{X\in\mathcal X}\mathbb E\big[|X|\,1_{\{|X|>K\}\big]=0$$

를 만족하면 균등적분가능하다고 한다.

정리 3.3 (균등적분가능성과 \(L^1\) 수렴). \(X_n\to X\) a.s.이고 \(\{X_n\}_{n\ge1}\)가 균등적분가능하다고 하자. 그러면 \(X\in L^1\)이고

$$\mathbb E|X_n-X|\longrightarrow 0.$$

증명. 먼저 Fatou 정리에 의해

$$\mathbb E|X|\le \liminf_{n\to\infty}\mathbb E|X_n|.$$

균등적분가능성은 \(\sup_n\mathbb E|X_n|<\infty\)를 함의하므로 \(X\in L^1\)이다. 다음으로 임의의 \(K>0\)에 대해

$$|X_n-X|\le |X_n|1_{\{|X_n|>K\}+|X|1_{\{|X|>K\}+|X_n-X|1_{\{|X_n|\le K,\ |X|\le K\}.$$

기댓값을 취하면

$$\mathbb E|X_n-X| \le \mathbb E\!\left[|X_n|1_{\{|X_n|>K\}\right] +\mathbb E\!\left[|X|1_{\{|X|>K\}\right] +\mathbb E\!\left[|X_n-X|1_{\{|X_n|\le K,\ |X|\le K\}\right].$$

세 번째 항은 \(|X_n-X|\le 2K\)로 지배되고 거의 확실히 0으로 가므로 dominated convergence 정리에 의해 \(n\to\infty\)에서 0으로 간다. 첫 번째 항은 균등적분가능성 때문에 \(K\)를 크게 잡으면 \(n\)에 균일하게 작다. 두 번째 항은 \(X\in L^1\)이므로 \(K\to\infty\)에서 0이 된다. 따라서 먼저 \(K\)를 크게 고른 뒤 \(n\to\infty\)를 보내면 \(\mathbb E|X_n-X|\to0\)이다.

정리 3.4 (bounded stopping time에 대한 stopped martingale). \(M\)이 적분가능한 \(\mathbb F\)-마팅게일이고 \(\tau\)가 bounded stopping time이라고 하자. 그러면 \(M^\tau_t:=M_{t\wedge\tau}\) 역시 적분가능한 \(\mathbb F\)-마팅게일이다.

증명. 적응성부터 본다. \(t\wedge\tau\le t\)이고 \(\tau\)는 정지시간이므로 \(M_{t\wedge\tau}\)는 \(\mathcal F_t\)-가측이다. 적분가능성은 \(\tau\le T\) a.s.인 어떤 상수 \(T\)가 존재하고, 따라서 \(M_{t\wedge\tau}\)는 \(\{M_s:0\le s\le T\}\) 범위의 변수이므로 따라온다.

이제 \(0\le s\le t\)에 대해 마팅게일 성질을 보이자. 사건 \(\{\tau\le s\}\)에서는 \(t\wedge\tau=s\wedge\tau=\tau\)이므로

$$M_{t\wedge\tau}=M_{s\wedge\tau}\qquad\text{on }\{\tau\le s\}.$$

사건 \(\{\tau>s\}\)에서는 \(s\wedge\tau=s\)이다. \(\tau\wedge t\)를 dyadic simple stopping time들로 근사하면 각 단순정지시간 \(\sigma_n\)에 대해 \(M_{\sigma_n}\)는 유한합

$$M_{\sigma_n}=\sum_{k=1}^{N_n} M_{t_k^{(n)}1_{\{\sigma_n=t_k^{(n)}\}$$

로 표현된다. 여기서 \(\{\sigma_n=t_k^{(n)}\}\in\mathcal F_{t_k^{(n)}\)이고 \(t_k^{(n)}\ge s\)인 경우 마팅게일 성질을 각 조각에 적용하면

$$\mathbb E[M_{\sigma_n}\mid\mathcal F_s]=M_{s\wedge\tau_n}.$$

\(\sigma_n\downarrow t\wedge\tau\)로 택하면 \(M_{\sigma_n}\to M_{t\wedge\tau}\) a.s.이고, bounded stopping time 가정 때문에 dominated convergence를 써서 극한을 통과시킬 수 있다. 따라서

$$\mathbb E[M_{t\wedge\tau}\mid\mathcal F_s]=M_{s\wedge\tau}.$$

즉 \(M^\tau\)는 마팅게일이다.

Chapter 11과의 연결. Pairs trading의 진입 시점, 청산 시점, 스위칭 시점은 모두 정지시간이다. 가치함수를 쓸 때는 “지금 멈출지, 계속할지”를 비교해야 하고, 이 비교는 stopped process와 조건부기대의 언어로만 엄밀하게 서술된다.

4. 측도변환, Bayes 공식, numeraire derivative

정의 4.1 (동등한 측도). 두 확률측도 \(\mathbb P,\mathbb Q\)가 서로 절대연속이면 \(\mathbb P\sim\mathbb Q\)라 쓰고 동등하다고 한다.

정의 4.2 (밀도과정). \(\mathbb Q\sim\mathbb P\)이고 어떤 고정된 만기 \(T\) 위에서

$$\Lambda:=\frac{d\mathbb Q}{d\mathbb P}\Big|_{\mathcal F_T}$$

가 존재하면 \(Z_t:=\mathbb E^\mathbb P[\Lambda\mid\mathcal F_t]\)를 밀도과정이라 한다.

정의 4.3 (numeraire). 거의 surely 양수인 거래가능 자산 \(N=(N_t)_{0\le t\le T}\)를 numeraire라고 한다.

정의 4.4 (numeraire derivative). 만기 지급액이 \(X_T\)인 파생상품을 numeraire \(N\)로 가격표시하여

$$V_t=N_t\,\mathbb E^{\mathbb Q^N}\!\left[\frac{X_T}{N_T}\Bigm|\mathcal F_t\right]$$

로 쓰는 표현을 말한다.

정리 4.5 (밀도과정의 마팅게일 성질). \(Z_t=\mathbb E^\mathbb P[\Lambda\mid\mathcal F_t]\)는 \(\mathbb P\)-마팅게일이고 \(\mathbb E^\mathbb P[Z_t]=1\)이다.

증명. \(0\le s\le t\le T\)에 대해 tower property를 적용하면

$$\mathbb E^\mathbb P[Z_t\mid\mathcal F_s] =\mathbb E^\mathbb P\!\big[\mathbb E^\mathbb P[\Lambda\mid\mathcal F_t]\bigm|\mathcal F_s\big] =\mathbb E^\mathbb P[\Lambda\mid\mathcal F_s] =Z_s.$$

따라서 \(Z\)는 \(\mathbb P\)-마팅게일이다. 또한

$$\mathbb E^\mathbb P[Z_t] =\mathbb E^\mathbb P\big[\mathbb E^\mathbb P[\Lambda\mid\mathcal F_t]\big] =\mathbb E^\mathbb P[\Lambda] =1.$$

정리 4.6 (Bayes 공식). \(X\in L^1(\mathbb Q)\)이면

$$\mathbb E^\mathbb Q[X\mid\mathcal F_t] =\frac{\mathbb E^\mathbb P[\Lambda X\mid\mathcal F_t]}{Z_t}\qquad \text{a.s.}$$

증명. 우변을 \(Y_t\)라고 두자. \(Y_t\)는 \(\mathcal F_t\)-가측이다. 이제 임의의 \(A\in\mathcal F_t\)에 대해

$$\mathbb E^\mathbb Q[1_A Y_t] =\mathbb E^\mathbb P[\Lambda 1_A Y_t].$$

그런데 \(1_A/Z_t\)는 \(\mathcal F_t\)-가측이므로

$$\mathbb E^\mathbb P[\Lambda 1_A Y_t] =\mathbb E^\mathbb P\!\left[\frac{1_A}{Z_t}\,\mathbb E^\mathbb P[\Lambda X\mid\mathcal F_t]\,\Lambda\right] =\mathbb E^\mathbb P\!\left[1_A\,\mathbb E^\mathbb P[\Lambda X\mid\mathcal F_t]\right] =\mathbb E^\mathbb P[1_A\Lambda X] =\mathbb E^\mathbb Q[1_A X].$$

즉 \(Y_t\)는 \(\mathbb Q\) 아래에서 \(X\)의 조건부기대의 정의를 만족한다. 따라서 결론이 성립한다.

정리 4.7 (numeraire 변경 공식). money-market account를 \(B\), 그에 대한 위험중립측도를 \(\mathbb Q^B\)라 하자. 양의 거래가능 자산 \(N\)에 대해

$$L_t:=\frac{N_t/B_t}{N_0/B_0},\qquad \frac{d\mathbb Q^N}{d\mathbb Q^B}\Big|_{\mathcal F_t}=L_t$$

로 정의하면, 임의의 거래가능 자산 \(S\)에 대해 \(S_t/N_t\)는 \(\mathbb Q^N\)-마팅게일이다. 따라서 만기 \(T\) 지급액 \(X_T\)의 가격은

$$V_t=N_t\,\mathbb E^{\mathbb Q^N}\!\left[\frac{X_T}{N_T}\Bigm|\mathcal F_t\right]$$

로 표현된다.

증명. \(\mathbb Q^B\) 아래에서 모든 거래가능 자산의 \(B\)-할인가격은 마팅게일이다. 따라서 \(N_t/B_t\)도 \(\mathbb Q^B\)-마팅게일이므로 \(L_t\)는 평균 1의 양의 마팅게일이다. 이로부터 \(\mathbb Q^N\)를 정의할 수 있다.

이제 Bayes 공식을 \(X=\frac{S_T}{N_T}\)에 적용하면

$$\mathbb E^{\mathbb Q^N}\!\left[\frac{S_T}{N_T}\Bigm|\mathcal F_t\right] =\frac{\mathbb E^{\mathbb Q^B}\!\left[L_T\frac{S_T}{N_T}\Bigm|\mathcal F_t\right]}{L_t}.$$

그런데 \(L_T=\frac{N_T/B_T}{N_0/B_0}\)이므로

$$L_T\frac{S_T}{N_T}=\frac{S_T/B_T}{N_0/B_0}.$$

따라서

$$\mathbb E^{\mathbb Q^N}\!\left[\frac{S_T}{N_T}\Bigm|\mathcal F_t\right] =\frac{1}{L_t}\frac{1}{N_0/B_0}\mathbb E^{\mathbb Q^B}\!\left[\frac{S_T}{B_T}\Bigm|\mathcal F_t\right].$$

\(\mathbb Q^B\) 아래에서 \(S_t/B_t\)가 마팅게일이므로 오른쪽은

$$\frac{1}{L_t}\frac{1}{N_0/B_0}\frac{S_t}{B_t} =\frac{S_t/B_t}{N_t/B_t} =\frac{S_t}{N_t}.$$

즉 \(S_t/N_t\)는 \(\mathbb Q^N\)-마팅게일이다. 마지막 가격식은 \(S=V\), \(V_T=X_T\)를 대입하면 얻는다.

5. 지수형 밀도과정, Novikov 조건, Girsanov 정리

정의 5.1 (stochastic exponential). 연속 국소마팅게일 \(M\)에 대하여

$$\mathcal E(M)_t:=\exp\!\left(M_t-\frac12\langle M\rangle_t\right)$$

를 \(M\)의 stochastic exponential이라 한다.

정의 5.2 (시장위험가격과 밀도과정). 예측가능 과정 \(\lambda\)와 \(d\)-차원 브라운 운동 \(W\)에 대해

$$M_t:=-\int_0^t \lambda_s^\top dW_s,\qquad Z_t:=\mathcal E(M)_t =\exp\!\left(-\int_0^t \lambda_s^\top dW_s-\frac12\int_0^t\|\lambda_s\|^2ds\right)$$

를 정의한다.

정의 5.3 (Novikov 조건).

$$\mathbb E^\mathbb P\!\left[\exp\!\left(\frac12\int_0^T\|\lambda_s\|^2ds\right)\right]<\infty.$$

정리 5.4 (Novikov 조건의 귀결). Novikov 조건이 성립하면 \(Z=(Z_t)_{0\le t\le T}\)는 평균 1의 uniformly integrable \(\mathbb P\)-마팅게일이다. 따라서

$$\frac{d\mathbb Q}{d\mathbb P}\Big|_{\mathcal F_T}=Z_T$$

로 새로운 확률측도 \(\mathbb Q\)를 정의할 수 있다.

증명. \(Z\)는 양의 국소마팅게일이므로 우선 \(\mathbb P\)-슈퍼마팅게일이다. 따라서 모든 stopping time \(\tau\le T\)에 대해 \(\mathbb E^\mathbb P[Z_\tau]\le1\)이다.

이제 \(M_t=-\int_0^t\lambda_s^\top dW_s\)라 쓰면 \(\langle M\rangle_t=\int_0^t\|\lambda_s\|^2ds\)이고 \(Z_t=\mathcal E(M)_t\)이다. 각 stopping time \(\tau\le T\)에 대해

$$e^{\frac12 M_\tau} = \exp\!\left(\frac12M_\tau-\frac14\langle M\rangle_\tau\right)\exp\!\left(\frac14\langle M\rangle_\tau\right) = Z_\tau^{1/2}\exp\!\left(\frac14\langle M\rangle_\tau\right).$$

Cauchy-Schwarz 부등식을 적용하면

$$\mathbb E^\mathbb P\!\left[e^{\frac12 M_\tau}\right] \le \left(\mathbb E^\mathbb P[Z_\tau]\right)^{1/2} \left(\mathbb E^\mathbb P\!\left[e^{\frac12\langle M\rangle_\tau}\right]\right)^{1/2} \le \left(\mathbb E^\mathbb P\!\left[e^{\frac12\langle M\rangle_T}\right]\right)^{1/2}<\infty.$$

따라서 \(\sup_{\tau\le T}\mathbb E[e^{M_\tau/2}]<\infty\)가 성립한다. 연속 국소마팅게일에 대한 Kazamaki 기준에 의해 \(\mathcal E(M)=Z\)는 uniformly integrable 마팅게일이 된다. 그러므로 \(\mathbb E^\mathbb P[Z_T]=1\), \(Z_T\ge0\)이고 \(Z_T\)를 밀도로 하여 \(\mathbb Q\)를 정의할 수 있다.

정리 5.5 (Girsanov 정리, 유한구간형). 정리 5.4의 가정 아래 \(\mathbb Q\)를 \(d\mathbb Q=Z_T\,d\mathbb P\)로 정의하자. 그러면

$$W_t^{\mathbb Q}:=W_t+\int_0^t \lambda_s\,ds,\qquad 0\le t\le T$$

는 \(\mathbb Q\) 아래의 \(d\)-차원 브라운 운동이다.

증명. \(W^{\mathbb Q}\)는 연속과정이다. 유한변동과정을 더해도 이차변동은 바뀌지 않으므로

$$\langle W^{\mathbb Q,i},W^{\mathbb Q,j}\rangle_t =\langle W^{i},W^{j}\rangle_t =\delta_{ij}t.$$

따라서 Lévy의 특성정리에 의해 \(W^{\mathbb Q}\)가 \(\mathbb Q\)-국소마팅게일임만 보이면 충분하다.

각 성분 \(i\)에 대해

$$L_t^i:=Z_t\left(W_t^i+\int_0^t\lambda_s^i\,ds\right)$$

를 정의한다. Itô 곱공식을 적용하면

$$dL_t^i =Z_t\,dW_t^i+\left(W_t^i+\int_0^t\lambda_u^i\,du\right)dZ_t+d[Z,W^i]_t+Z_t\lambda_t^i\,dt.$$

한편 \(dZ_t=-Z_t\lambda_t^\top dW_t\), 그리고 공변동 항은

$$d[Z,W^i]_t=-Z_t\lambda_t^i\,dt$$

이므로 drift 항이 정확히 상쇄되어

$$dL_t^i =Z_t\,dW_t^i-\left(W_t^i+\int_0^t\lambda_u^i\,du\right)Z_t\lambda_t^\top dW_t.$$

오른쪽은 \(dW_t\)에 대한 확률적분뿐이므로 \(L^i\)는 \(\mathbb P\)-국소마팅게일이다.

이제 \(0\le s\le t\le T\), \(A\in\mathcal F_s\)에 대해

$$\mathbb E^\mathbb Q\!\left[1_A\big(W_t^{\mathbb Q,i}-W_s^{\mathbb Q,i}\big)\right] =\mathbb E^\mathbb P\!\left[1_A Z_T\big(W_t^{\mathbb Q,i}-W_s^{\mathbb Q,i}\big)\right].$$

tower property에 의해 \(1_A Z_T\)를 \(1_A Z_t\)로 바꿀 수 있으므로 오른쪽은

$$\mathbb E^\mathbb P[1_A L_t^i]-\mathbb E^\mathbb P[1_A L_s^i] =\mathbb E^\mathbb P[1_A(L_t^i-L_s^i)] =0.$$

따라서 각 성분 \(W^{\mathbb Q,i}\)는 \(\mathbb Q\)-국소마팅게일이다. 연속성과 이차공변동 구조를 합치면 \(W^{\mathbb Q}\)는 \(\mathbb Q\)-브라운 운동이다.

Chapter 11과의 연결. Chapter 11 후반부에서 가격가능한 자산의 drift를 제거하고 spread 요인만 남긴 뒤 선형 PDE나 기대값 표현으로 값을 계산하는 장면은 모두 이 절 위에 서 있다. “드리프트를 없앤다”는 말은 정확히는 density process를 써서 측도를 바꾸고, 그 아래에서 브라운 운동의 drift를 옮긴다는 뜻이다.

6. OU 과정, 생성자, Dynkin 공식, Feynman-Kac

정의 6.1 (Ornstein-Uhlenbeck 과정). \(\kappa>0\), \(\theta\in\mathbb R\), \(\sigma>0\)에 대해

$$dC_t=\kappa(\theta-C_t)\,dt+\sigma\,dW_t$$

를 만족하는 확산과정을 OU 과정이라 한다.

정의 6.2 (생성자). \(f\in C^2(\mathbb R)\)에 대해 OU 과정의 생성자는

$$\mathcal L f(c)=\kappa(\theta-c)f'(c)+\frac12\sigma^2 f''(c)$$

로 정의된다.

정리 6.3 (OU 과정의 명시적 해). \(C_0=c\)라 하자. 그러면 위 SDE의 해는

$$C_t=\theta+(c-\theta)e^{-\kappa t}+\sigma\int_0^t e^{-\kappa(t-s)}\,dW_s$$

로 주어진다.

증명. 식을 \(C_t-\theta\)에 대해 쓰면

$$d(C_t-\theta)=-\kappa(C_t-\theta)\,dt+\sigma\,dW_t.$$

적분인자 \(e^{\kappa t}\)를 곱한다. Itô 곱공식에 의해

$$d\!\big(e^{\kappa t}(C_t-\theta)\big) =e^{\kappa t}\,d(C_t-\theta)+\kappa e^{\kappa t}(C_t-\theta)\,dt.$$

위의 \(d(C_t-\theta)\)를 대입하면 drift가 상쇄되어

$$d\!\big(e^{\kappa t}(C_t-\theta)\big)=\sigma e^{\kappa t}\,dW_t.$$

이를 \(0\)부터 \(t\)까지 적분하면

$$e^{\kappa t}(C_t-\theta)-(c-\theta)=\sigma\int_0^t e^{\kappa s}\,dW_s.$$

양변에 \(e^{-\kappa t}\)를 곱하면 바로 결론이 나온다.

정리 6.4 (Dynkin 공식). \(f\in C^2(\mathbb R)\)이고 \(\tau\)가 적절한 적분가능성을 만족하는 정지시간이라고 하자. 그러면

$$\mathbb E_c[f(C_\tau)] =f(c)+\mathbb E_c\!\left[\int_0^\tau \mathcal L f(C_s)\,ds\right].$$

증명. Itô 공식을 \(f(C_t)\)에 적용하면

$$df(C_t)=f'(C_t)\,dC_t+\frac12 f''(C_t)\,d\langle C\rangle_t.$$

OU 과정에서는 \(dC_t=\kappa(\theta-C_t)\,dt+\sigma\,dW_t\), \(d\langle C\rangle_t=\sigma^2dt\)이므로

$$df(C_t)=\mathcal L f(C_t)\,dt+\sigma f'(C_t)\,dW_t.$$

이를 \(0\)부터 \(\tau\wedge n\)까지 적분하면

$$f(C_{\tau\wedge n})-f(c) =\int_0^{\tau\wedge n}\mathcal L f(C_s)\,ds +\int_0^{\tau\wedge n}\sigma f'(C_s)\,dW_s.$$

마지막 항은 기대값이 0이므로

$$\mathbb E_c[f(C_{\tau\wedge n})] =f(c)+\mathbb E_c\!\left[\int_0^{\tau\wedge n}\mathcal L f(C_s)\,ds\right].$$

이제 \(n\to\infty\)를 보낸다. \(\tau\wedge n\uparrow\tau\)이고 적분가능성 가정 때문에 극한을 기대값 안으로 통과시킬 수 있다. 따라서 원하는 결론이 나온다.

정의 6.5 (Feynman-Kac형 후진 PDE).

$$\partial_t u+\mathcal L u-r u+f=0,\qquad u(T,\cdot)=g$$

형태의 후진 PDE를 말한다.

정리 6.6 (Feynman-Kac 표현). \(u\in C^{1,2}\)가

$$\partial_t u+\mathcal L u-r u+f=0,\qquad u(T,x)=g(x)$$

를 만족한다고 하자. 그러면

$$u(t,c)=\mathbb E_{t,c}\!\left[ e^{-\int_t^T r(C_s)\,ds}g(C_T) +\int_t^T e^{-\int_t^s r(C_u)\,du}f(C_s)\,ds \right].$$

증명. \(A_s:=\int_t^s r(C_u)\,du\), \(Y_s:=e^{-A_s}u(s,C_s)\)로 두자. Itô 곱공식을 적용하면

$$dY_s=e^{-A_s}\,d(u(s,C_s))+u(s,C_s)\,d(e^{-A_s}).$$

여기서 \(d(e^{-A_s})=-r(C_s)e^{-A_s}ds\)이고, \(u(s,C_s)\)에 Itô 공식을 쓰면

$$d(u(s,C_s)) =\big(\partial_s u+\mathcal L u\big)(s,C_s)\,ds+\sigma\,\partial_cu(s,C_s)\,dW_s.$$

따라서

$$dY_s =e^{-A_s}\big(\partial_su+\mathcal Lu-r u\big)(s,C_s)\,ds +e^{-A_s}\sigma\,\partial_cu(s,C_s)\,dW_s.$$

PDE에 의해 괄호 안은 \(-f(C_s)\)이므로

$$dY_s =-e^{-A_s}f(C_s)\,ds+e^{-A_s}\sigma\,\partial_cu(s,C_s)\,dW_s.$$

이를 \(t\)부터 \(T\)까지 적분하면

$$Y_T-Y_t =-\int_t^T e^{-\int_t^s r(C_u)\,du}f(C_s)\,ds +\int_t^T e^{-\int_t^s r(C_u)\,du}\sigma\,\partial_cu(s,C_s)\,dW_s.$$

정리하면

$$u(t,c) =e^{-\int_t^T r(C_u)\,du}g(C_T) +\int_t^T e^{-\int_t^s r(C_u)\,du}f(C_s)\,ds -\int_t^T e^{-\int_t^s r(C_u)\,du}\sigma\,\partial_cu(s,C_s)\,dW_s.$$

양변의 조건부기댓값을 취하면 확률적분의 기대값은 0이므로 결론이 나온다.

Chapter 11과의 연결. Chapter 11의 핵심 spread는 평균회귀형 OU 동학으로 모델링된다. 최적진입 대역, 최적청산 대역, continuation region 안의 가치함수는 모두 생성자 \(\mathcal L\), 정지시간, Dynkin 공식, Feynman-Kac 표현으로 연결된다. 즉 장 본문에서 band가 등장하는 순간부터 이미 이 절의 수학이 전면에 나와 있다.


Part B - AHFT Chapter 11 본문

Part B 재구성 원칙. 아래 본문은 기존 v3의 상세 증명부를 유지하되, Chapter 11 원문의 서술 흐름과 설명 문장을 다시 채워 넣어 원문 본문 내용이 비지 않도록 재구성한 버전이다. 즉, 그림 11.1부터 11.8까지 모두 포함하고, 원문이 각 절에서 말하는 직관·가정·트레이드오프·수치실험 설정을 빠뜨리지 않으면서, 수학적 부분은 앞선 상세 증명들과 자연스럽게 연결되도록 다시 배열하였다.

11.1 서론

Pairs trading의 핵심 아이디어는 단일 종목의 절대가격 자체보다, 서로 연관된 두 자산의 상대적 가치가 더 안정적이고 더 예측 가능할 수 있다는 데 있다. 원문은 먼저 2013년 11월 1일의 Intel Inc. (INTC)와 Market Vectors Semiconductor ETF (SMH)를 예시로 든다. 왼쪽 그림에서는 두 자산의 중간가격을 각자의 평균 중간가격으로 나누어 그려 놓았고, 두 가격이 같은 방향으로 함께 움직이는 경향이 강하다는 점이 보인다. 이런 상황에서는 한 자산을 매수하고 다른 자산을 매도한 포트폴리오의 가치가 개별 자산가격보다 덜 변동적이고 더 예측 가능해진다.

Figure 11.1
Figure 11.1.
2013년 11월 1일 장중 INTC와 SMH의 상대 중간가격과 공적분 요인. 왼쪽은 평균 중간가격으로 나눈 가격 경로, 오른쪽은 공적분 요인이다.

원문이 강조하는 더 정교한 접근은 단순 가격차가 아니라 공적분 요인을 상태변수로 삼는 것이다. 책의 표기대로 포트폴리오의 상태를

$$C_t = A\,S_t^{\rm INTC} + B\,S_t^{\rm SMH}$$

와 같은 선형결합으로 두고, 장중 데이터로부터 계수를 추정하면 당일에는 대략 \(A\approx 0.95\), \(B\approx -0.63\)이 얻어진다. 따라서 \(0.95\)주 만큼 INTC를 매수하고 \(0.63\)주 만큼 SMH를 공매도한 포트폴리오의 가치가 평균인 \(0\) 부근으로 되돌아간다면, 이 평균회귀를 이용해 거래신호를 만들 수 있다.

이 장 전체의 흐름은 명확하다. 11.2에서는 평균 부근에 임의의 밴드를 두고 진입·청산하는 ad hoc band 전략을 먼저 보여 준다. 11.3에서는 이 임의적 규칙을 버리고, 진입과 청산을 최적정지 문제로 재정식화하여 밴드를 내생적으로 결정한다. 11.4에서는 더 나아가 가격수준 자체가 아니라 드리프트가 공적분된다고 보고, 지수효용 투자문제로 pairs trading을 재구성한다. 즉 이 장은 단순한 규칙기반 평균회귀 거래에서 출발해, 자유경계 문제와 HJB 방정식까지 나아가는 장이다.

11.2 Ad Hoc Bands

가장 단순한 평균회귀 전략은 평균회귀 수준 \(0\)의 위아래에 바깥 밴드와 안쪽 밴드를 놓는 것이다. 예를 들어 공적분 요인이 평균보다 한 표준편차만큼 낮아지면 포트폴리오가 싸다고 보고 롱 포지션에 들어가고, 평균보다 한 표준편차만큼 높아지면 비싸다고 보고 숏 포지션에 들어간다. 포지션을 보유한 뒤에는 요인이 평균 근처의 작은 구간, 예컨대 평균에서 \(0.1\) 표준편차 이내로 되돌아오면 청산한다. 원문은 먼저 이렇게 단순한 밴드 규칙이 실제로 어떤 모양의 거래를 만들어 내는지 시각적으로 보여 준다.

Figure 11.2
Figure 11.2.
공적분 요인, 포지션, 장부가치의 경로. 외부 밴드에서 진입하고 내부 밴드에서 청산하는 단순 전략의 작동을 보여 준다.

그림 11.2의 세 패널은 각각 공적분 요인 경로, 전략의 포지션 경로, 그리고 전략의 장부가치를 나타낸다. 공적분 요인의 경로가 외부 하단 밴드에 닿는 순간 투자자는 포트폴리오를 매수하고, 이후 요인이 내부 밴드까지 올라오면 청산한다. 이 전략의 장부가치는

$$V_t = X_t + \beta_t C_t$$

로 쓸 수 있다. 여기서 \(X_t\)는 누적 현금보유, \(\beta_t\in\{-1,0,1\}\)는 포지션 단위다. 원문이 설명하듯이 예시 경로에서는 \(t\approx0.3\) 부근에서 하단 외부 밴드에 닿아 롱 포지션을 취하고, \(t\approx0.4\) 부근에서 내부 밴드에 도달하면서 청산해 이익을 확정한다. 이어서 \(t\approx0.51\) 부근에서 숏 포지션을 잡고 \(t\approx0.55\) 부근에서 청산하며, 마지막으로 \(t\approx0.73\) 부근에서 다시 롱 포지션에 진입해 \(t\approx0.83\) 부근에서 청산한다.

하지만 이 단순 전략에는 근본적인 문제가 있다. 거래기간 말에 포지션이 반드시 \(0\)이 된다는 보장이 없다는 점이다. 외부 밴드에서 진입한 뒤 내부 밴드까지 되돌아오기 전에 거래가 끝나면 강제청산이 발생하고, 이때 기대했던 밴드 스프레드만큼의 이익을 얻지 못할 수도 있고, 심지어 손실이 날 수도 있다. 또한 밴드가 넓을수록 한 번 청산할 때의 이익은 커지지만, 평균회귀 요인이 외부 밴드에서 내부 밴드로 이동하는 횟수 자체는 줄어든다. 즉 거래빈도와 거래당 기대이익 사이의 상충관계가 이미 여기서 드러난다.

Figure 11.3
Figure 11.3.
서로 다른 트리거 밴드에 대한 10,000회 시뮬레이션 P&L 히스토그램.

그림 11.3은 추정된 모형에서 10,000개의 경로를 생성하고, 각 경로에 같은 밴드 규칙을 적용해 얻은 P&L 분포를 보여 준다. 원문은 특히 두 가지 사실을 짚는다. 첫째, Sharpe ratio는 밴드를 넓힌다고 단조롭게 좋아지지 않는다. 너무 좁으면 노이즈 거래가 많고, 너무 넓으면 거래 횟수가 줄면서 분산구조가 다시 나빠진다. 둘째, 밴드가 충분히 넓어지면 P&L 분포가 다봉형(multimodal)이 된다. 그 이유는 한 번의 왕복거래가 가져오는 이익이 대략 밴드폭과 같아서, 전체 P&L이 밴드폭의 정수배 주변에 집중되기 때문이다. 다만 거래 종료 직전에 아직 평균으로 되돌아오지 못한 포지션이 남아 있으면 강제청산 손익이 섞이므로, 정확한 질량점이 아니라 여러 봉우리를 가진 연속분포처럼 나타난다.

따라서 11.2의 결론은 간단하다. 단순 밴드 전략은 평균회귀를 이용한 직관을 잘 보여 주지만, 밴드 선택이 임의적이고, 종료시점 리스크와 진입·청산 비대칭을 제대로 반영하지 못한다. 그래서 다음 절에서는 밴드 자체를 최적화 문제의 해로 다시 정의한다.

11.3 Optimal Band Selection

11.3에서는 앞 절의 임의적 밴드 규칙을 버리고, 공적분 포트폴리오의 진입과 청산을 무한시계한 최적정지 문제로 재구성한다. 원문은 먼저 포트폴리오 가치 \(C_t\)가 Ornstein-Uhlenbeck 과정

$$dC_t = \kappa(\theta-C_t)dt + \sigma dW_t$$

를 따른다고 가정한다. 여기서 \(\kappa>0\)는 평균회귀 속도, \(\theta\)는 장기평균, \(\sigma\)는 변동성이다. 투자자는 한 번의 왕복거래만 수행하며, 먼저 롱 포지션 청산 문제를 풀고, 그 해를 이용해 롱 포지션 진입 문제를 푼다.

롱 포지션을 이미 보유하고 있을 때의 청산 가치와, 아직 포지션이 없을 때의 진입 가치는 각각

$$H_+(c)=\sup_{\tau\in\mathcal T}\mathbb E_c\!\left[e^{-\rho\tau}(C_\tau-c_0)\right],$$ $$G_+(c)=\sup_{\tau\in\mathcal T}\mathbb E_c\!\left[e^{-\rho\tau}\big(H_+(C_\tau)-C_\tau-c_0\big)\right]$$

로 둔다. \(c_0\)는 거래비용이고, \(\rho>0\)는 할인율이다. 평균회귀 과정이 time-homogeneous Markov 과정이므로 시간의존성은 사라지고, 책의 원문처럼 가치함수는 상태변수 \(c\)만의 함수로 쓸 수 있다. 생성자

$$\mathcal L f(c)=\kappa(\theta-c)f'(c)+\tfrac12\sigma^2 f''(c)$$

를 쓰면 두 문제는 다음 변분부등식으로 표현된다.

$$\max\Big\{(\mathcal L-\rho)H_+(c),\ (c-c_0)-H_+(c)\Big\}=0,$$ $$\max\Big\{(\mathcal L-\rho)G_+(c),\ \big(H_+(c)-c-c_0\big)-G_+(c)\Big\}=0.$$

즉 continuation 영역에서는 선형 ODE를 풀고, 정지영역에서는 즉시행사 payoff와 접합시키면 된다. 아래의 세 하위절은 이 원리를 각각 청산, 진입, 양방향 진입·청산 문제에 적용한 것이다.

11.3.1 롱 포지션의 최적 청산

정의 11.3.1 — OU 공적분 요인, 생성자, 정지문제

공적분 포트폴리오의 상태변수인 확률과정 \(C=(C_t)_{t\ge 0}\)가 다음 Ornstein-Uhlenbeck 과정이라 하자.

$$dC_t = \kappa(\theta-C_t)\,dt + \sigma\,dW_t, \qquad \kappa>0,\ \sigma>0.$$

여기서 \(\kappa\)는 평균회귀 속도, \(\theta\)는 장기평균 수준, \(W\)는 표준 브라운 운동이다. \(f\in C^2\)에 대한 이 과정의 무한소 생성자는

$$ (\mathcal L f)(c)=\kappa(\theta-c)f'(c)+\frac12\sigma^2 f''(c) $$

이다. 롱 포지션을 이미 보유한 투자자가 거래비용 \(c_0>0\)를 내고 청산한다고 하자. 현재 시점부터의 상대적 정지시간을 \(\tau\)라 두면, 청산 시 현금흐름은 \(C_\tau-c_0\)이고, 할인율은 \(\rho>0\)이다. 따라서 상태 \(C_0=c\)에서의 청산 가치함수는

$$H_+(c)=\sup_{\tau\in\mathcal T}\mathbb E_c\!\left[e^{-\rho\tau}(C_\tau-c_0)\right]$$

로 정의한다. 여기서 \(\mathcal T\)는 모든 정지시간의 집합이고, \(\mathbb E_c[\cdot]\)는 \(C_0=c\) 조건하 기댓값이다.

정리 11.3.2 — 시간불변화와 변분부등식

위 정의의 가치함수 \(H_+\)는 시간에 의존하지 않으며, 다음 변분부등식을 만족한다.

$$\max\Big\{(\mathcal L-\rho)H_+(c),\ (c-c_0)-H_+(c)\Big\}=0.$$

즉 continuation 영역에서는 \((\mathcal L-\rho)H_+=0\)이고, stopping 영역에서는 \(H_+(c)=c-c_0\)이다.

증명

먼저 OU 과정의 계수는 시간에 직접 의존하지 않으므로 \(C\)는 time-homogeneous Markov 과정이다. 따라서 시각 \(t\)에서 상태가 \(c\)이면, 그 뒤의 문제는 시각 \(0\)에서 상태가 \(c\)인 문제와 분포상 동일하다. 그러므로 원래의 시간의존 표기 \(H_+(t,c)\)는 실제로 \(t\)와 무관하며 \(H_+(c)\)로 쓸 수 있다.

이제 아주 작은 \(h>0\)를 택한다. 상태 \(c\)가 continuation 영역에 있으면 즉시 청산하지 않고 적어도 \(h\)만큼은 기다린다. 동적계획원리에 의해

$$H_+(c)=\mathbb E_c\!\left[e^{-\rho h}H_+(C_h)\right].$$

양변에서 \(H_+(c)\)를 빼면

$$0=\mathbb E_c\!\left[e^{-\rho h}H_+(C_h)-H_+(c)\right].$$

여기서 Itô 공식과 Dynkin 공식을 적용하면, \(f\in C^2\)에 대해

$$\mathbb E_c[f(C_h)] = f(c)+h\,\mathcal L f(c)+o(h)$$

이고, 또한

$$e^{-\rho h}=1-\rho h+o(h).$$

따라서

$$\mathbb E_c\!\left[e^{-\rho h}H_+(C_h)\right] = (1-\rho h+o(h))\big(H_+(c)+h\mathcal L H_+(c)+o(h)\big).$$

곱을 전개하면

$$\mathbb E_c\!\left[e^{-\rho h}H_+(C_h)\right] = H_+(c)+h(\mathcal L-\rho)H_+(c)+o(h).$$

이를 앞 식에 대입하고 \(h\)로 나눈 뒤 \(h\downarrow 0\)을 보내면

$$(\mathcal L-\rho)H_+(c)=0$$

를 얻는다. 반대로 stopping 영역에서는 기다릴 이유가 없으므로 최적 정지시간은 \(\tau=0\)이고 가치함수는 즉시 보수와 일치한다.

$$H_+(c)=c-c_0.$$

마지막으로 최적정지 문제의 일반 원리에 따라 continuation 영역에서는 기다리는 가치가 즉시 청산 가치보다 크거나 같아야 하고, stopping 영역에서는 두 값이 같아야 하므로

$$H_+(c)\ge c-c_0,\qquad (\mathcal L-\rho)H_+(c)\le 0,$$

그리고 적어도 하나는 등호여야 한다. 이것이 곧

$$\max\Big\{(\mathcal L-\rho)H_+(c),\ (c-c_0)-H_+(c)\Big\}=0$$

이다.

정의 11.3.3 — 기본해의 적분표현

이제 선형 상미분방정식

$$(\mathcal L-\rho)F(c)=0$$

의 두 기본해를 다음과 같이 둔다. 편의를 위해

$$\nu=\frac{\rho}{\kappa},\qquad \beta=\frac{\sqrt{2\kappa}{\sigma}$$

라고 쓰면, 증가해와 감소해를 각각

$$F_+(c)=\int_0^\infty u^{\nu-1}\exp\!\left(\beta(c-\theta)u-\frac12u^2\right)du,$$ $$F_-(c)=\int_0^\infty u^{\nu-1}\exp\!\left(\beta(\theta-c)u-\frac12u^2\right)du$$

로 정의한다. 이 적분들은 책 원문이 사용하는 Whittaker / confluent hypergeometric 해의 적분표현과 같은 해를 준다.

정리 11.3.4 — 기본해의 성질

위에서 정의한 \(F_+,F_-\)는 모두 \((\mathcal L-\rho)F=0\)의 해이며,

$$F_+'(c)>0,\qquad F_+''(c)>0,\qquad F_-'(c)<0,\qquad F_-''(c)>0$$

가 성립한다. 따라서 \(F_+\)는 양의 증가 볼록함수이고 \(F_-\)는 양의 감소 볼록함수이다.

증명

먼저 \(F_+\)에 대해 미분적분 교환을 정당화한다. 적분핵

$$g(c,u)=u^{\nu-1}\exp\!\left(\beta(c-\theta)u-\frac12u^2\right)$$

는 \(u\to\infty\)에서 \(e^{-u^2/2}\) 때문에 급격히 감소하므로, \(c\)가 임의의 유계구간에 있을 때 \(u\)-적분과 \(c\)-미분을 교환할 수 있다. 그러면

$$F_+'(c)=\beta\int_0^\infty u^\nu\exp\!\left(\beta(c-\theta)u-\frac12u^2\right)du,$$ $$F_+''(c)=\beta^2\int_0^\infty u^{\nu+1}\exp\!\left(\beta(c-\theta)u-\frac12u^2\right)du.$$

적분핵이 양이므로 \(F_+'(c)>0\), \(F_+''(c)>0\)가 즉시 따라온다.

이제 ODE를 확인한다. 생성자를 대입하면

$$\begin{aligned} (\mathcal L-\rho)F_+(c) &=\kappa(\theta-c)F_+'(c)+\frac12\sigma^2F_+''(c)-\rho F_+(c)\\ &=\kappa\int_0^\infty\Big[(\theta-c)\beta u+u^2-\nu\Big]u^{\nu-1}e^{\beta(c-\theta)u-u^2/2}du. \end{aligned}$$

그런데

$$\frac{d}{du}\Big(u^\nu e^{\beta(c-\theta)u-u^2/2}\Big) =\Big(\nu u^{\nu-1}+\beta(c-\theta)u^\nu-u^{\nu+1}\Big)e^{\beta(c-\theta)u-u^2/2}.$$

따라서 앞 적분의 integrand는 위 도함수의 음수와 정확히 일치하므로

$$ (\mathcal L-\rho)F_+(c)=-\kappa\int_0^\infty \frac{d}{du}\Big(u^\nu e^{\beta(c-\theta)u-u^2/2}\Big)\,du. $$

이제 경계값을 본다. \(u\downarrow 0\)에서 \(u^\nu\to 0\)이고, \(u\to\infty\)에서 \(e^{-u^2/2}\)가 지배하므로 양 끝점 기여는 모두 0이다. 따라서 적분 전체가 0이 되고 \((\mathcal L-\rho)F_+=0\)이다.

\(F_-\)에 대해서도 완전히 같은 방식으로 계산할 수 있다. 이때

$$F_-'(c)=-\beta\int_0^\infty u^\nu\exp\!\left(\beta(\theta-c)u-\frac12u^2\right)du<0,$$ $$F_-''(c)=\beta^2\int_0^\infty u^{\nu+1}\exp\!\left(\beta(\theta-c)u-\frac12u^2\right)du>0.$$

즉 \(F_-\)는 감소 볼록해이다.

정리 11.3.5 — 롱 포지션 최적 청산 경계와 가치함수

롱 포지션 청산 문제의 최적 stopping 영역은 \([c^*_{\mathrm{exit}},\infty)\) 꼴이고, continuation 영역은 \(( -\infty,c^*_{\mathrm{exit}} )\)이다. 최적 임계값 \(c^*_{\mathrm{exit}}\)는

$$\frac{F_+(c)}{F_+'(c)}=c-c_0$$

의 유일한 해로 주어지며, 가치함수는

$$H_+(c)=\begin{cases} \dfrac{c^*_{\mathrm{exit}}-c_0}{F_+(c^*_{\mathrm{exit}})}F_+(c), & c<c^*_{\mathrm{exit}},\\[1.2ex] c-c_0, & c\ge c^*_{\mathrm{exit}}. \end{cases}$$

로 주어진다.

증명

청산 문제에서는 상태가 매우 작을수록, 즉 \(c\to -\infty\)일수록 포지션 가치가 불리하고 평균까지 올라오기를 오래 기다려야 한다. 할인인자 \(e^{-\rho\tau}\) 때문에 그런 매우 먼 상태에서의 가치함수는 0으로 가야 한다. 따라서 continuation 영역 일반해

$$H_+(c)=A F_+(c)+B F_-(c)$$

에서 \(c\to-\infty\)일 때 폭주하는 항을 제거해야 한다. \(F_-\)는 감소해이므로 왼쪽 꼬리에서 커지고, \(F_+\)는 증가해이므로 왼쪽 꼬리에서 0으로 내려간다. 따라서 \(B=0\)이어야 한다. 즉 continuation 영역에서는

$$H_+(c)=A F_+(c).$$

이제 자유경계 \(c^*_{\mathrm{exit}}\)에서 value matching과 smooth pasting을 적용한다. value matching은 경계에서 기다리는 가치와 즉시 청산 가치가 같다는 뜻이므로

$$A F_+(c^*_{\mathrm{exit}})=c^*_{\mathrm{exit}}-c_0.$$

smooth pasting은 경계에서 좌우 미분계수가 같다는 뜻이므로

$$A F_+'(c^*_{\mathrm{exit}})=1.$$

두 식을 나누면

$$\frac{F_+(c^*_{\mathrm{exit}})}{F_+'(c^*_{\mathrm{exit}})}=c^*_{\mathrm{exit}}-c_0$$

를 얻는다. 이 식이 임계값 방정식이다. 또한 둘째 식에서 \(A=1/F_+'(c^*_{\mathrm{exit}})\)이고, 첫째 식과 결합하면

$$A=\frac{c^*_{\mathrm{exit}}-c_0}{F_+(c^*_{\mathrm{exit}})}. $$

따라서 continuation 영역 해는 위 식의 형태가 된다. stopping 영역에서는 이미 \(H_+(c)=c-c_0\)이다. 두 부분을 합치면 정리의 표현이 나온다.

유일성은 다음과 같이 본다. 함수 \(R(c)=F_+(c)/F_+'(c)-(c-c_0)\)를 두면, \(F_+\)가 증가 볼록함수이므로 \(F_+'\)도 양수이며 \(R\)는 단조적으로 감소한다. 한편 왼쪽 꼬리와 오른쪽 꼬리에서 부호가 바뀌므로 근은 하나뿐이다.

Figure 11.4
Figure 11.4.
최적 청산 트리거와 가치함수 \(H_+\).

원문은 그림 11.4에서 \(\theta=0\), \(\sigma=0.5\), \(c_0=0.01\)을 고정하고 \(\kappa\)와 \(\rho\)를 바꾸며 가치함수와 최적 청산경계를 그린다. 평균회귀 속도 \(\kappa\)가 커질수록 상태는 더 빠르게 평균으로 끌려가기 때문에 투자자는 너무 높은 수준까지 기다릴 필요가 없고, 따라서 최적 청산경계 \(c^*_{\rm exit}\)는 낮아진다. 반대로 할인율 \(\rho\)가 커지면 미래 이익의 현재가치가 줄어들어 더 빨리 청산하는 편이 유리하므로 역시 청산경계가 평균 쪽으로 내려온다.

11.3.2 롱 포지션의 최적 진입

정의 11.3.6 — 진입 문제

이제 아직 포지션이 없는 투자자를 생각하자. 상태 \(c\)에서 롱 포지션에 진입하면 즉시 \(c+c_0\)를 지불하고, 이후에는 위에서 구한 청산 옵션 \(H_+\)를 보유하게 된다. 따라서 진입 정지문제의 가치함수는

$$G_+(c)=\sup_{\tau\in\mathcal T}\mathbb E_c\!\left[e^{-\rho\tau}\big(H_+(C_\tau)-C_\tau-c_0\big)\right]$$

로 정의한다.

정리 11.3.7 — 롱 포지션 최적 진입 경계와 가치함수

진입 문제의 continuation 영역은 \((c^*_{\mathrm{entry}},\infty)\)이고, stopping 영역은 \(( -\infty,c^*_{\mathrm{entry}} ]\)이다. 최적 임계값 \(c^*_{\mathrm{entry}}\)는

$$\frac{F_-(c)}{F_-'(c)}=\frac{H_+(c)-c-c_0}{H_+'(c)-1}$$

의 유일한 해로 주어지고, 가치함수는

$$G_+(c)=\begin{cases} \dfrac{H_+(c^*_{\mathrm{entry}})-c^*_{\mathrm{entry}}-c_0}{F_-(c^*_{\mathrm{entry}})}F_-(c), & c>c^*_{\mathrm{entry}},\\[1.2ex] H_+(c)-c-c_0, & c\le c^*_{\mathrm{entry}}. \end{cases}$$

또한 일반적으로 \(c^*_{\mathrm{entry}}<\theta<c^*_{\mathrm{exit}}\)이며, 진입점과 청산점은 평균을 중심으로 정확히 대칭이 아니다.

증명

상태 \(c\)가 높을수록, 즉 포트폴리오가 이미 비싸질수록 롱 진입의 매력은 작아진다. 따라서 \(G_+\)는 감소함수여야 하며, \(c\to\infty\)에서는 결국 기다리더라도 얻을 가치가 0으로 수렴해야 한다. continuation 영역에서는 다시 \((\mathcal L-\rho)G_+=0\)이므로

$$G_+(c)=A F_+(c)+B F_-(c).$$

그런데 \(c\to\infty\)에서 \(F_+\)는 증가해이므로 폭주할 수 있고, \(F_-\)는 감소해이므로 0으로 가는 쪽에 맞는다. 따라서 \(A=0\)이고 continuation 영역 해는

$$G_+(c)=B F_-(c).$$

이제 자유경계 \(c^*_{\mathrm{entry}}\)에서 value matching을 쓰면

$$B F_-(c^*_{\mathrm{entry}})=H_+(c^*_{\mathrm{entry}})-c^*_{\mathrm{entry}}-c_0.$$

smooth pasting을 쓰면

$$B F_-'(c^*_{\mathrm{entry}})=H_+'(c^*_{\mathrm{entry}})-1.$$

두 식을 나누면 정리의 비선형 방정식이 나온다.

$$\frac{F_-(c^*_{\mathrm{entry}})}{F_-'(c^*_{\mathrm{entry}})}=\frac{H_+(c^*_{\mathrm{entry}})-c^*_{\mathrm{entry}}-c_0}{H_+'(c^*_{\mathrm{entry}})-1}. $$

그 다음 \(B\)는 value matching 식에서 바로 구한다.

$$B=\frac{H_+(c^*_{\mathrm{entry}})-c^*_{\mathrm{entry}}-c_0}{F_-(c^*_{\mathrm{entry}})}. $$

따라서 continuation 영역과 stopping 영역을 합친 조각별 가치함수가 정리의 식으로 완성된다.

마지막 비대칭성은 경제적으로 자연스럽다. 청산 문제는 이미 포지션을 들고 있는 상태에서 더 높은 상태를 기다리는 문제인데, 진입 문제는 진입 뒤에 따라오는 최적 청산 옵션의 시간가치까지 함께 평가한다. 즉 진입 시점과 청산 시점은 시간순서가 강제로 부여되어 있고, 같은 할인율 \(\rho\) 아래에서도 두 자유경계가 서로 다른 식으로 결정된다. 그래서 \(\theta\)를 중심으로 완전한 거울대칭이 생기지 않는다.

Figure 11.5
Figure 11.5.
최적 진입 트리거와 가치함수 \(G_+\).

그림 11.5에서 원문이 특히 강조하는 점은 진입점과 청산점이 평균을 기준으로 대칭이 아니라는 사실이다. 표면적으로 보면 평균회귀 문제이므로 진입과 청산이 \(\theta\)를 중심으로 좌우대칭일 것 같지만, 실제로는 그렇지 않다. 이유는 진입 후에 다시 청산까지 기다려야 하므로 할인효과가 두 정지시각의 순서를 통해 비대칭적으로 작동하기 때문이다. 예를 들어 같은 매개변수에서도 진입경계는 평균에 좀 더 가깝고, 청산경계는 평균보다 더 바깥쪽에서 형성된다.

11.3.3 롱과 숏을 모두 허용하는 양방향 전략

정의 11.3.8 — 양방향 청산/진입 가치

이제 투자자가 롱뿐 아니라 숏 포지션도 취할 수 있다고 하자. 숏 포지션 청산 가치는

$$H_-(c)=\sup_{\tau\in\mathcal T}\mathbb E_c\!\left[e^{-\rho\tau}(-C_\tau-c_0)\right]$$

로 두고, 포지션이 없는 상태에서 롱 진입과 숏 진입을 모두 허용하는 가치함수는

$$G(c)=\sup_{\tau\in\mathcal T}\mathbb E_c\!\left[e^{-\rho\tau}\max\big\{H_+(C_\tau)-C_\tau-c_0,\ H_-(C_\tau)+C_\tau-c_0\big\}\right]$$

로 둔다. 여기서 첫 번째 항은 롱 진입, 두 번째 항은 숏 진입의 즉시가치이다.

정리 11.3.9 — 양방향 전략의 자유경계 시스템

숏 포지션 청산 가치 \(H_-\)는 어떤 하방 청산경계 \(c^*_{\mathrm{sx}}\)에 대해

$$H_-(c)=\begin{cases} -\dfrac{c^*_{\mathrm{sx}}+c_0}{F_-(c^*_{\mathrm{sx}})}F_-(c), & c>c^*_{\mathrm{sx}},\\[1.2ex] -c-c_0, & c\le c^*_{\mathrm{sx}}. \end{cases}$$

로 주어지며, 청산경계는

$$\frac{F_-(c)}{F_-'(c)}=c+c_0$$

의 해이다. 또한 양방향 진입 가치 \(G\)는 두 진입경계 \(c^*_{\mathrm{long}}<c^*_{\mathrm{short}}\) 사이의 continuation 영역에서

$$G(c)=A F_+(c)+B F_-(c)$$

꼴을 갖고, 경계점 \(c^*_{\mathrm{long}},c^*_{\mathrm{short}}\)에서 각 payoff와 value matching, smooth pasting을 만족하는 네 개의 연립방정식으로 \(A,B\)와 두 경계를 결정한다.

증명

먼저 숏 청산 문제는 롱 청산 문제의 부호 반전 버전이다. payoff가 \(-C_\tau-c_0\)이므로 상태가 너무 높을 때는 기다리고, 충분히 낮아지면 청산한다. 따라서 continuation 영역은 오른쪽 꼬리이고, \(c\to\infty\)에서 가치가 0으로 가야 하므로 폭주하지 않는 감소해 \(F_-\)만 남는다.

$$H_-(c)=D F_-(c)\qquad (c>c^*_{\mathrm{sx}}).$$

경계 \(c^*_{\mathrm{sx}}\)에서 value matching과 smooth pasting은

$$D F_-(c^*_{\mathrm{sx}})=-(c^*_{\mathrm{sx}}+c_0),$$ $$D F_-'(c^*_{\mathrm{sx}})=-1$$

이다. 두 식을 나누면

$$\frac{F_-(c^*_{\mathrm{sx}})}{F_-'(c^*_{\mathrm{sx}})}=c^*_{\mathrm{sx}}+c_0$$

를 얻고, \(D\)를 제거하면 정리의 조각별 표현이 나온다.

이제 진입 문제로 간다. 롱과 숏 중 어느 쪽으로 진입할지 미정인 영역에서는 아직 아무 포지션도 잡지 않고 기다리므로 \(G\)는 again \((\mathcal L-\rho)G=0\)을 만족한다. 2차 ODE의 일반해는

$$G(c)=A F_+(c)+B F_-(c).$$

그런데 이제 continuation 영역이 왼쪽 경계와 오른쪽 경계 사이의 유한구간이므로 \(F_+\)와 \(F_-\)를 둘 다 유지해야 한다. 왼쪽 경계 \(c^*_{\mathrm{long}}\)에서는 롱 진입 payoff

$$\Phi_{\mathrm{long}}(c)=H_+(c)-c-c_0$$

와 접합되고, 오른쪽 경계 \(c^*_{\mathrm{short}}\)에서는 숏 진입 payoff

$$\Phi_{\mathrm{short}}(c)=H_-(c)+c-c_0$$

와 접합된다. 따라서 네 개의 조건

$$A F_+(c^*_{\mathrm{long}})+B F_-(c^*_{\mathrm{long}})=\Phi_{\mathrm{long}}(c^*_{\mathrm{long}}),$$ $$A F_+'(c^*_{\mathrm{long}})+B F_-'(c^*_{\mathrm{long}})=\Phi_{\mathrm{long}}'(c^*_{\mathrm{long}}),$$ $$A F_+(c^*_{\mathrm{short}})+B F_-(c^*_{\mathrm{short}})=\Phi_{\mathrm{short}}(c^*_{\mathrm{short}}),$$ $$A F_+'(c^*_{\mathrm{short}})+B F_-'(c^*_{\mathrm{short}})=\Phi_{\mathrm{short}}'(c^*_{\mathrm{short}})$$

이 성립한다. 첫째와 셋째 식으로 \(A,B\)를 \(c^*_{\mathrm{long}},c^*_{\mathrm{short}}\)의 함수로 쓴 뒤, 둘째와 넷째 식에 대입하면 두 자유경계에 대한 비선형 연립방정식이 남는다. 이것이 양방향 진입·청산 문제의 완전한 특성화다.

Figure 11.6
Figure 11.6.
양방향 진입/청산 문제에서의 최적 트리거와 가치함수.

양방향 문제에서는 더 이상 한쪽 방향만의 자유경계가 아니라, 가운데 continuation 띠를 기준으로 아래쪽에서는 롱 진입, 위쪽에서는 숏 진입이 최적이 된다. 원문은 특히 다음의 대칭관계를 지적한다. 롱 진입 최적경계는 숏 포지션 최적청산 경계와 같고, 숏 진입 최적경계는 롱 포지션 최적청산 경계와 같다. 이는 평균회귀 구조와 payoff의 부호반전이 결합된 결과다.

\(\kappa\) 롱 청산 \(\,c^*_{\rm exit,long}\) 숏 청산 \(\,c^*_{\rm exit,short}\) 롱 진입 \(\,c^*_{\rm entry,long}\) 숏 진입 \(\,c^*_{\rm entry,short}\)
0.5 1.9537 -0.4060 -0.4060 1.9537
1.0 1.7460 -0.1815 -0.1815 1.7460
2.0 1.5744 -0.0740 -0.0740 1.5744
4.0 1.4367 -0.0410 -0.0410 1.4367

원문 표에서 보듯이 평균회귀 속도 \(\kappa\)가 커질수록 모든 자유경계가 평균에 가까워진다. 즉 평균회귀가 빠를수록 투자자는 더 작은 괴리에서도 곧바로 진입·청산 결정을 내릴 수 있다. 이 절 전체는 11.2의 임의적 밴드를 자유경계 해석으로 대체했다는 점에서, pairs trading을 직관적 룰 기반 전략에서 엄밀한 stopping 문제로 끌어올리는 핵심부다.

11.4 Co-integrated Log Prices with Short-Term-Alpha

11.4는 장의 관점을 한 단계 더 확장한다. 앞 절에서는 가격수준의 선형결합이 평균회귀한다고 가정했지만, 이번에는 드리프트 자체가 공적분 구조를 갖는다고 본다. 즉 가격은 계속 확산적으로 움직이되, 기대수익률을 움직이는 잠재 요인 \(\alpha_t\)가 로그가격들의 선형결합으로 주어진다고 가정한다. 이 요인은 짧은 기간에 나타났다 사라지는 예측가능한 알파, 곧 short-term alpha로 해석된다.

책의 모형은 위험자산 벡터 \(Y_t=(Y_t^1,\dots,Y_t^n)^\top\)와 공적분 요인 \(\alpha_t\)를

$$dY_t^i = Y_t^i\left(\delta_i\alpha_t\,dt + \sum_{k=1}^n \sigma_{ki}\,dW_t^k\right),\qquad \alpha_t = a_0 + \sum_{i=1}^n a_i \log Y_t^i$$

로 놓는다. \(\alpha_t=0\)이면 모든 자산은 drift가 \(0\)인 상관된 geometric Brownian motion이 되므로 마팅게일이고, \(\alpha_t\neq0\)일 때만 잠시 기대수익률 구조가 생긴다. 따라서 이 절은 평균회귀 스프레드 자체를 거래하는 대신, 공적분된 알파를 기반으로 최적 포트폴리오 투자 문제를 푸는 절이다.

11.4.1 모형 설정과 공적분 요인의 동학

정의 11.4.1 — 드리프트 공적분 모형

위험자산 \(Y^1,\dots,Y^n\)의 가격을 \(Y_t=(Y_t^1,\dots,Y_t^n)^\top\)라 하자. 책의 모형은

$$\frac{dY_t^i}{Y_t^i}=\delta_i\alpha_t\,dt+\sum_{k=1}^n \sigma_{ik}\,dW_t^k,\qquad i=1,\dots,n$$

이며, 여기서 \(W=(W^1,\dots,W^n)^\top\)는 독립 브라운 운동 벡터, \(\sigma=(\sigma_{ik})\)는 가역 행렬, \(\Omega=\sigma\sigma^\top\)는 순간 공분산행렬이다. 또한 short-term-alpha 요인을

$$\alpha_t=a_0+a^\top \log Y_t$$

로 둔다. 여기서 \(a=(a_1,\dots,a_n)^\top\), \(A=\operatorname{diag}(a)\), \(\log Y_t\)는 성분별 로그벡터이다.

정리 11.4.2 — 공적분 요인 \(\alpha_t\)는 OU 과정이다

위 모형 아래에서 로그가격은

$$d\log Y_t^i = \Big(\delta_i\alpha_t-\frac12\Omega_{ii}\Big)dt+\sum_{k=1}^n \sigma_{ik}dW_t^k$$

를 만족하고, 따라서 \(\alpha_t\)는

$$d\alpha_t = \kappa(\theta-\alpha_t)dt + a^\top \sigma \, dW_t$$

를 만족한다. 여기서

$$\kappa=-a^\top\delta,\qquad \theta=\frac{\operatorname{Tr}(A\Omega)}{2\kappa}$$

이다. 특히 \(a^\top\delta<0\)이면 \(\kappa>0\)이고 \(\alpha_t\)는 평균회귀한다.

증명

먼저 각 자산에 Itô 공식을 적용한다. 가격 SDE가

$$dY_t^i = Y_t^i\Big(\delta_i\alpha_tdt+\sum_{k=1}^n\sigma_{ik}dW_t^k\Big)$$

이므로 \(f(y)=\log y\)에 대해 \(f'(y)=1/y\), \(f''(y)=-1/y^2\)를 사용하면

$$d\log Y_t^i = \frac{dY_t^i}{Y_t^i} - \frac12\frac{d[Y^i]_t}{(Y_t^i)^2}. $$

그런데

$$d[Y^i]_t=(Y_t^i)^2\sum_{k=1}^n\sigma_{ik}^2 dt=(Y_t^i)^2\Omega_{ii}dt$$

이므로

$$d\log Y_t^i = \Big(\delta_i\alpha_t-\frac12\Omega_{ii}\Big)dt+\sum_{k=1}^n\sigma_{ik}dW_t^k.$$

이제 \(\alpha_t=a_0+\sum_i a_i\log Y_t^i\)를 미분하면

$$d\alpha_t=\sum_{i=1}^n a_i\,d\log Y_t^i.$$

방금 얻은 식을 대입하면

$$\begin{aligned} d\alpha_t &=\sum_{i=1}^n a_i\Big(\delta_i\alpha_t-\frac12\Omega_{ii}\Big)dt+\sum_{i=1}^n a_i\sum_{k=1}^n\sigma_{ik}dW_t^k\\ &=\Big((a^\top\delta)\alpha_t-\frac12\sum_{i=1}^n a_i\Omega_{ii}\Big)dt+a^\top\sigma dW_t. \end{aligned}$$

대각합 표기를 쓰면 \(\sum_i a_i\Omega_{ii}=\operatorname{Tr}(A\Omega)\)이므로

$$d\alpha_t=\Big((a^\top\delta)\alpha_t-\frac12\operatorname{Tr}(A\Omega)\Big)dt+a^\top\sigma dW_t.$$

여기서 \(\kappa=-a^\top\delta\)와 \(\theta=\operatorname{Tr}(A\Omega)/(2\kappa)\)를 정의하면

$$ (a^\top\delta)\alpha_t-\frac12\operatorname{Tr}(A\Omega)=\kappa(\theta-\alpha_t) $$

가 되어 정리의 OU 표현이 성립한다.

원문은 같은 내용을 로그가격 \(Z_t=(\log Y_t^1,\dots,\log Y_t^n)^\top\)의 관점에서 다시 쓸 수도 있다고 설명한다. 실제로 \(\alpha_t=a_0+a^\top Z_t\)를 대입하면

$$dZ_t = (C-BZ_t)dt + \sigma^\top dW_t,$$ $$C = a_0\delta - \tfrac12\operatorname{diag}(\Omega),\qquad B=-\delta a^\top$$

와 같은 벡터 자기회귀(VAR) 형태를 얻는다. 이 표현은 모형의 선형구조를 한 번에 보여 준다는 장점이 있다. 다만 이 장의 후반부에서는 투자문제를 풀어야 하므로, 원문처럼 \(\alpha_t\)를 명시적으로 상태변수로 드러내는 표현이 더 해석하기 좋다.

11.4.2 부의 동학, 가치함수, HJB 방정식

원문은 여기서 앞선 가격충격 모형과의 차이를 분명히 한다. Chapter 6과 7에서는 거래가 가격에 미치는 impact를 모델링했지만, 11.4에서는 거래충격을 넣지 않는다. 대신 투자자는 각 자산에 몇 달러를 배분할지 선택하면서 기대효용을 극대화한다. 위험자산 투자액 벡터를 \(\pi_t=(\pi_t^1,\dots,\pi_t^n)^\top\)라 두고, 자기금융 조건 아래 wealth를 추적하면 결국 \(X_t^\pi\)와 \(Y_t\)를 상태변수로 하는 확률제어 문제가 된다.

정의 11.4.3 — 자기금융 전략과 효용극대화 문제

시각 \(t\)에 위험자산들에 투자한 달러 벡터를 \(\pi_t=(\pi_t^1,\dots,\pi_t^n)^\top\)라 하자. 무위험자산 금리는 책의 가정대로 0으로 둔다. 그러면 자기금융 부 과정 \(X_t^\pi\)는

$$dX_t^\pi = \pi_t^\top\delta\,\alpha_t\,dt + \pi_t^\top\sigma\,dW_t$$

를 따른다. 투자자는 지수효용

$$U(x)=-e^{-\gamma x},\qquad \gamma>0$$

를 가지고, 만기 \(T\)에서의 기대효용을 최대화한다.

$$H(t,x,y)=\sup_{\pi\in\mathcal A}\mathbb E_{t,x,y}\big[-e^{-\gamma X_T^\pi}\big].$$

또한 계산을 간단히 하기 위해 다음 연산자를 정의한다.

$$\mathcal D_y H=(y_1H_{y_1},\dots,y_nH_{y_n})^\top,$$ $$\mathcal D_{yy}H=\sum_{i,j=1}^n y_i y_j\Omega_{ij}H_{y_i y_j},$$ $$\mathcal D_{xy}H=(y_1H_{xy_1},\dots,y_nH_{xy_n})^\top.$$
정리 11.4.4 — HJB 방정식

가치함수 \(H\)가 충분히 매끄럽다고 하면 다음 HJB를 만족한다.

$$\partial_t H + \alpha\,\delta^\top \mathcal D_y H + \frac12\mathcal D_{yy}H + \sup_{\pi\in\mathbb R^n}\Big\{\pi^\top\delta\,\alpha\,H_x + \frac12\pi^\top\Omega\pi\,H_{xx} + \pi^\top\Omega\mathcal D_{xy}H\Big\}=0,$$ $$H(T,x,y)=-e^{-\gamma x},\qquad \alpha=a_0+a^\top\log y.$$
증명

상태변수는 \((X_t^\pi,Y_t)\)이다. \(Y_t\)의 drift는 \(\delta\alpha_t\), 공분산은 \(\Omega\)이므로, \(f(t,x,y)\)에 대한 생성자는

$$\begin{aligned} \mathcal G^\pi f &= f_t + \pi^\top\delta\alpha\,f_x + (\delta\alpha)^\top \mathcal D_y f + \frac12\pi^\top\Omega\pi\,f_{xx} \\ &\quad + \pi^\top\Omega\mathcal D_{xy}f + \frac12\mathcal D_{yy}f. \end{aligned}$$

이 식에서 첫 번째 행의 두 번째 항은 부의 drift, 세 번째 항은 가격벡터의 drift, 네 번째 항은 부의 분산, 다섯 번째 항은 부와 가격의 교차변동, 마지막 항은 가격벡터 자체의 분산에 해당한다.

동적계획원리에 의해 최적 가치함수는 짧은 구간 \([t,t+h]\)에서

$$H(t,x,y)=\sup_\pi \mathbb E\big[H(t+h,X_{t+h}^\pi,Y_{t+h})\mid X_t=x,Y_t=y\big]$$

를 만족한다. Itô 공식으로 전개하면

$$\mathbb E[H(t+h,X_{t+h}^\pi,Y_{t+h})] = H(t,x,y)+h\,\mathcal G^\pi H(t,x,y)+o(h).$$

이를 위 식에 대입하고 \(H(t,x,y)\)를 빼서 \(h\)로 나눈 다음 \(h\downarrow0\)을 보내면

$$\sup_\pi \mathcal G^\pi H(t,x,y)=0$$

가 나온다. \(\mathcal G^\pi\)를 다시 쓰면 정리의 HJB가 된다. 말기조건은 만기 이후 더 이상 의사결정이 없고 효용이 바로 적용되므로

$$H(T,x,y)=-e^{-\gamma x}$$

이다.

정리 11.4.5 — 제곱완성으로 얻는 일반 피드백 최적전략

HJB의 \(\pi\)-최적화 항을

$$\mathfrak M(\pi)=\pi^\top\delta\,\alpha\,H_x + \frac12\pi^\top\Omega\pi\,H_{xx} + \pi^\top\Omega\mathcal D_{xy}H$$

라고 하면, \(H_{xx}<0\)인 경우 최적 투자벡터는

$$\pi^* = -\Omega^{-1}\frac{\delta\,\alpha\,H_x+\Omega\mathcal D_{xy}H}{H_{xx}$$

이다.

증명

\(\mathfrak M(\pi)\)는 \(\pi\)에 대한 2차식이다. 먼저 gradient를 계산한다.

$$\nabla_\pi \mathfrak M(\pi)=\delta\,\alpha\,H_x + \Omega\pi\,H_{xx} + \Omega\mathcal D_{xy}H.$$

최적점에서는 1차 조건 \(\nabla_\pi\mathfrak M(\pi)=0\)가 성립하므로

$$\Omega\pi^* H_{xx} = -\delta\,\alpha\,H_x - \Omega\mathcal D_{xy}H.$$

\(\Omega\)가 가역이고 \(H_{xx}\neq0\)이므로 양변을 정리하면

$$\pi^* = -\Omega^{-1}\frac{\delta\,\alpha\,H_x+\Omega\mathcal D_{xy}H}{H_{xx}.$$

또한 \(H_{xx}<0\)이면 Hessian은 \(H_{xx}\Omega\)이고 \(\Omega\)가 양의정부호이므로 \(\mathfrak M\)는 엄격한 concave 함수다. 따라서 위 1차 조건으로 얻은 \(\pi^*\)는 유일한 전역최대점이다.

정리 11.4.5에서 얻는 피드백 형태의 최적투자벡터는 고전적인 Merton 문제와 매우 닮아 있다. 실제로 첫 번째 항 \(\frac1\gamma\Omega^{-1}\delta\,\alpha\)는 순간 drift가 \(\delta\alpha\)일 때의 Merton형 투자비중에 해당한다. 그러나 여기서는 \(\alpha_t\) 자체가 동태적으로 움직이고, 그 변화가 미래 기회집합에 영향을 미치므로 두 번째 보정항이 나타난다. 즉 이 절의 최적전략은 '지금 보이는 drift만 쫓는 투자'가 아니라, 공적분 요인의 미래 경로까지 반영한 동적전략이다.

11.4.3 지수효용 가정형과 선형 PDE 환원

정의 11.4.6 — 지수효용 가정형

지수효용 문제에서 책이 사용하는 가정형은

$$H(t,x,y)=-\exp\big\{-\gamma\big(x+h(t,\alpha)\big)\big\},\qquad \alpha=a_0+a^\top\log y$$

이다. 여기서 미지수는 이제 \((t,\alpha)\)의 함수 \(h\) 하나로 줄어든다.

정리 11.4.7 — HJB의 선형 PDE 환원과 특수형 최적전략

위 가정형을 쓰면

$$\pi^*(t,\alpha)=\frac1\gamma\Omega^{-1}\delta\,\alpha-a\,h_\alpha(t,\alpha)$$

이고, 함수 \(h\)는 다음 선형 PDE를 만족한다.

$$h_t - \frac12\operatorname{Tr}(A\Omega) h_\alpha + \frac12(a^\top\Omega a) h_{\alpha\alpha} + \frac1{2\gamma}\delta^\top\Omega^{-1}\delta\,\alpha^2 = 0,$$ $$h(T,\alpha)=0.$$
증명

먼저 \(H=-e^{-\gamma(x+h)}\)를 미분한다. \(x\)-미분은 간단하여

$$H_x=-\gamma H,\qquad H_{xx}=\gamma^2 H.$$

다음으로 \(\alpha=a_0+\sum_i a_i\log y_i\)이므로

$$y_i\frac{\partial \alpha}{\partial y_i}=a_i, \qquad y_i y_j\frac{\partial^2 \alpha}{\partial y_i\partial y_j}=-a_i\,\mathbf 1_{\{i=j\}.$$

이를 이용하면

$$\mathcal D_y H = -\gamma H\,a\,h_\alpha,$$ $$\mathcal D_{xy}H = \gamma^2 H\,a\,h_\alpha.$$

2차 \(y\)-미분은 항을 하나씩 계산해야 한다. \(i\neq j\)일 때는

$$y_i y_j H_{y_i y_j} = -\gamma H\,a_i a_j\big(h_{\alpha\alpha}-\gamma h_\alpha^2\big),$$

\(i=j\)일 때는 추가로 \(\partial^2\alpha/\partial y_i^2\) 항이 생겨

$$y_i^2 H_{y_i y_i} = -\gamma H\,a_i^2\big(h_{\alpha\alpha}-\gamma h_\alpha^2\big)+\gamma H\,a_i h_\alpha.$$

따라서 공분산 행렬 \(\Omega\)로 합치면

$$\mathcal D_{yy}H = -\gamma H\,(a^\top\Omega a)\big(h_{\alpha\alpha}-\gamma h_\alpha^2\big)+\gamma H\,\operatorname{Tr}(A\Omega)h_\alpha.$$

이제 정리 11.4.5의 일반 최적전략 식에 \(H_x,H_{xx},\mathcal D_{xy}H\)를 대입한다.

$$\begin{aligned} \pi^* &= -\Omega^{-1}\frac{\delta\,\alpha(-\gamma H)+\Omega(\gamma^2 H a h_\alpha)}{\gamma^2 H}\\ &= \frac1\gamma\Omega^{-1}\delta\,\alpha-a h_\alpha. \end{aligned}$$

이제 HJB에 같은 미분식을 전부 넣는다. 모든 항에 공통으로 있는 \(-\gamma H\)를 묶어내면, \(h\)에 대한 식은

$$\begin{aligned} 0={}&h_t +(\delta^\top a)\alpha h_\alpha -\frac12\operatorname{Tr}(A\Omega)h_\alpha +\frac12(a^\top\Omega a)\big(h_{\alpha\alpha}-\gamma h_\alpha^2\big)\\ &\qquad -\frac1{2\gamma}\big(\delta\alpha-\gamma\Omega a h_\alpha\big)^\top\Omega^{-1}\big(\delta\alpha-\gamma\Omega a h_\alpha\big). \end{aligned}$$

마지막 제곱항을 전개하면

$$\big(\delta\alpha-\gamma\Omega a h_\alpha\big)^\top\Omega^{-1}\big(\delta\alpha-\gamma\Omega a h_\alpha\big) =\delta^\top\Omega^{-1}\delta\,\alpha^2 -2\gamma\alpha\,\delta^\top a\,h_\alpha + \gamma^2 a^\top\Omega a\,h_\alpha^2.$$

이를 위 식에 대입하면 \((\delta^\top a)\alpha h_\alpha\) 항과 \(-2\gamma\alpha\delta^\top a h_\alpha\)에서 나온 항이 정확히 상쇄되고, \(h_\alpha^2\) 항도 \(\frac12(a^\top\Omega a)(-\gamma h_\alpha^2)\)와 제곱항의 마지막 부분이 정확히 상쇄된다. 따라서 남는 것은

$$h_t - \frac12\operatorname{Tr}(A\Omega) h_\alpha + \frac12(a^\top\Omega a) h_{\alpha\alpha} + \frac1{2\gamma}\delta^\top\Omega^{-1}\delta\,\alpha^2 = 0.$$

말기조건 \(H(T,x,y)=-e^{-\gamma x}\)는 \(h(T,\alpha)=0\)와 동치다.

이 절의 수학적 핵심은 비선형 HJB가 예상보다 깔끔한 선형 PDE로 떨어진다는 점이다. 원문은 지수효용의 특수형 때문에 \(H_{xx}\), \(H_x\), \(D_{xy}H\), \(D_{yy}H\) 항 사이에 중요한 소거가 일어나고, 그 결과 \(h(t,\alpha)\)가 사실상 \(\alpha\)에 대한 2차식이 될 것임을 보여 준다. 따라서 최적전략 \(\pi^*(t,\alpha)\)는 결국 \(\alpha\)에 대한 선형 함수가 된다. 즉 투자자는 공적분 요인의 현재값에 선형적으로 반응하되, 남은 만기 \(T-t\)에 따라 그 반응의 크기를 조절한다.

11.4.4 측도변환, Feynman-Kac, 명시해

정리 11.4.8 — 위험중립측도와 Feynman-Kac 표현

시장위험가격 벡터를

$$\Lambda_t=-\sigma^{-1}\delta\,\alpha_t$$

로 두고, Part A에서 증명한 Girsanov 정리를 적용하여

$$\frac{d\mathbb P^*}{d\mathbb P}\Big|_{\mathcal F_T}= \exp\!\left(-\int_t^T \Lambda_s^\top dW_s-\frac12\int_t^T \|\Lambda_s\|^2ds\right)$$

를 정의하자. 그러면 \(\mathbb P^*\) 아래에서

$$dY_t^i = Y_t^i\sum_{k=1}^n\sigma_{ik}dW_t^{*,k}$$

가 되어 모든 traded asset의 drift가 사라지고, 공적분 요인은

$$d\alpha_t = -\frac12\operatorname{Tr}(A\Omega)dt + a^\top\sigma\,dW_t^*$$

를 따른다. 따라서 \(h\)는

$$h(t,\alpha)=\frac1{2\gamma}\delta^\top\Omega^{-1}\delta\;\mathbb E_t^*\!\left[\int_t^T \alpha_s^2\,ds\ \Big|\ \alpha_t=\alpha\right]$$

로 표현된다.

증명

Part A.5에서 이미 증명한 Girsanov 정리에 의해

$$W_t^* = W_t + \int_0^t \Lambda_s ds$$

는 \(\mathbb P^*\) 아래 브라운 운동이다. 이제 원래 자산 SDE를 \(W^*\)로 다시 쓰면

$$\frac{dY_t^i}{Y_t^i} = \delta_i\alpha_t dt + \sum_k \sigma_{ik}(dW_t^{*,k}-\Lambda_t^k dt).$$

정의한 \(\Lambda_t=-\sigma^{-1}\delta\alpha_t\)를 대입하면 \(\sigma\Lambda_t=-\delta\alpha_t\)이므로 drift 항이 정확히 상쇄된다.

$$\delta\alpha_t + \sigma\Lambda_t = \delta\alpha_t + \sigma(-\sigma^{-1}\delta\alpha_t)=0.$$

따라서 traded asset은 \(\mathbb P^*\) 아래 martingale이 된다.

이제 \(\alpha_t\)의 동학을 변환한다. 정리 11.4.2에서 얻은 식

$$d\alpha_t = \kappa(\theta-\alpha_t)dt + a^\top\sigma(dW_t^*-\Lambda_tdt)$$

에 \(\Lambda_t=-\sigma^{-1}\delta\alpha_t\)를 넣으면

$$d\alpha_t = \kappa(\theta-\alpha_t)dt + a^\top\sigma dW_t^* + a^\top\delta\,\alpha_t dt.$$

그런데 \(\kappa=-a^\top\delta\)이므로 \(-\kappa\alpha_t + a^\top\delta\alpha_t =0\)가 되어 평균회귀 항의 \(\alpha_t\)-의존 부분이 사라진다. 또한 \(\kappa\theta = \operatorname{Tr}(A\Omega)/2\)이므로

$$d\alpha_t = -\frac12\operatorname{Tr}(A\Omega)dt + a^\top\sigma dW_t^*.$$

즉 \(\mathbb P^*\) 아래에서 \(\alpha_t\)는 상수 drift를 가진 브라운 운동이다. 이 과정의 생성자는

$$\mathcal L^* f(\alpha)= -\frac12\operatorname{Tr}(A\Omega)f'(\alpha)+\frac12(a^\top\Omega a)f''(\alpha).$$

그런데 정리 11.4.7의 PDE는 정확히

$$h_t + \mathcal L^* h + \frac1{2\gamma}\delta^\top\Omega^{-1}\delta\,\alpha^2=0,\qquad h(T,\alpha)=0$$

의 형태다. 그러므로 Feynman-Kac 정리를 적용하면 정리의 기대값 표현이 곧바로 나온다.

정리 11.4.9 — \(h(t,\alpha)\)와 최적 투자벡터의 명시형

\(U=T-t\), \(k=\frac12\operatorname{Tr}(A\Omega)\), \(v=a^\top\Omega a\), \(q=\frac1{2\gamma}\delta^\top\Omega^{-1}\delta\)라고 두면

$$h(t,\alpha)=q\left[\alpha^2U-k\alpha U^2+\frac13k^2U^3+\frac12 vU^2\right].$$

따라서

$$h_\alpha(t,\alpha)=q\left[2\alpha U-kU^2\right]$$

이고, 최적 투자벡터는

$$\pi^*(t,\alpha)=\frac1\gamma\Omega^{-1}\delta\,\alpha - \frac{\delta^\top\Omega^{-1}\delta}{2\gamma}\Big(2U\alpha-kU^2\Big)a$$

가 된다. 특히 \(\pi^*\)는 \(\alpha\)에 대해 선형이고, \(U\downarrow0\)이면 공적분 보정항은 0으로 사라진다.

증명

정리 11.4.8에서 얻은 위험중립 동학은

$$d\alpha_s = -k\,ds + \sqrt{v}\,dB_s^*,\qquad s\in[t,T]$$

로 쓸 수 있다. 여기서 \(B^*\)는 \(\mathbb P^*\)-브라운 운동이다. 적분하면

$$\alpha_s = \alpha - k(s-t) + \sqrt{v}\,(B_s^*-B_t^*).$$

따라서 조건부 평균과 분산은

$$\mathbb E_t^*[\alpha_s\mid\alpha_t=\alpha]=\alpha-k(s-t),$$ $$\operatorname{Var}_t^*(\alpha_s\mid\alpha_t=\alpha)=v(s-t).$$

그러므로

$$\mathbb E_t^*[\alpha_s^2\mid\alpha_t=\alpha]=\big(\alpha-k(s-t)\big)^2+v(s-t).$$

Feynman-Kac 표현에 넣으면

$$h(t,\alpha)=q\int_t^T \Big(\big(\alpha-k(s-t)\big)^2+v(s-t)\Big)ds.$$

변수변환 \(u=s-t\)를 하면 적분구간은 \([0,U]\)가 되고

$$h(t,\alpha)=q\int_0^U \Big((\alpha-ku)^2+vu\Big)du.$$

이를 항별로 적분한다.

$$\int_0^U (\alpha-ku)^2du = \int_0^U (\alpha^2-2\alpha ku+k^2u^2)du = \alpha^2U-\alpha kU^2+\frac13k^2U^3,$$ $$\int_0^U vu\,du = \frac12 vU^2.$$

둘을 합치면

$$h(t,\alpha)=q\left[\alpha^2U-k\alpha U^2+\frac13k^2U^3+\frac12 vU^2\right].$$

이제 \(\alpha\)에 대해 미분하면

$$h_\alpha(t,\alpha)=q(2\alpha U-kU^2).$$

정리 11.4.7의 최적전략 식

$$\pi^* = \frac1\gamma\Omega^{-1}\delta\,\alpha-a h_\alpha$$

에 대입하면 정리의 명시형이 즉시 나온다. 마지막으로 \(U=T-t\to0\)이면 \(h_\alpha\to0\)이므로 공적분 보정항은 사라지고, 남는 것은 순간 drift \(\delta\alpha\)에만 반응하는 Merton형 항뿐이다.

위험중립측도 \(\mathbb P^*\)로 넘어가면 원래 실세계 측도에서 OU 과정이었던 \(\alpha_t\)가, 놀랍게도 drift가 상수인 Brownian motion으로 바뀐다. 바로 이 점 때문에 Feynman-Kac 표현이 닫힌 형태로 계산되고, \(h(t,\alpha)\)와 최적전략 \(\pi^*(t,\alpha)\)가 명시적으로 써진다. 다시 말해 이 절은 공적분 알파 모형을 단지 '추상적인 HJB 문제'로 남겨 두지 않고, 실제로 계산 가능한 전략식까지 끝까지 밀어 붙이는 절이다.

수치실험 설정 — 원문 11.4.4의 파라미터

원문 수치실험에서는 다음 값을 사용한다.

$$ \delta = \begin{pmatrix}1\\1\\0\end{pmatrix},\qquad a = \begin{pmatrix}-1\\0\\1\end{pmatrix},\qquad a_0=0, $$ $$ \sigma= \begin{pmatrix} 0.2000 & 0 & 0\\ 0.0375 & 0.1452 & 0\\ 0.0250 & 0.0039 & 0.0967 \end{pmatrix} \qquad\Rightarrow\qquad \Omega= \begin{pmatrix} 0.04 & 0.0075 & 0.005\\ 0.0075 & 0.0225 & 0.0015\\ 0.005 & 0.0015 & 0.01 \end{pmatrix}. $$

따라서 세 자산의 변동성은 각각 \(\{2\%,1.5\%,1\%\}\)이고, 대응하는 상관계수행렬은

$$ \rho= \begin{pmatrix} 1.00 & 0.25 & 0.25\\ 0.25 & 1.00 & 0.10\\ 0.25 & 0.10 & 1.00 \end{pmatrix}. $$

초기 가격은

$$ Y_0^1=11.10,\qquad Y_0^2=12.00,\qquad Y_0^3=11.00 $$

로 둔다. 여기서 \(a=(-1,0,1)^\top\)이므로 공적분 요인에는 첫째와 셋째 자산만 직접 들어가고, \(\delta=(1,1,0)^\top\)이므로 공적분 알파는 첫째와 둘째 자산의 drift에만 영향을 준다. 이 구조적 비대칭이 그림 11.7의 포지션 경로에 그대로 반영된다.

Figure 11.7
Figure 11.7.
세 자산 로그가격, 공적분 요인, 투자자 wealth, 각 자산 포지션의 표본경로.

그림 11.7의 네 패널은 각각 세 자산 가격경로, 공적분 요인 \(\alpha_t\), 투자자 wealth, 그리고 각 자산에 대한 최적 포지션을 보여 준다. 책의 설명대로 첫째와 셋째 자산이 공적분 요인을 형성하지만, 실제 drift 반응은 첫째와 둘째 자산에서 일어나므로 포지션 조정 역시 비대칭적으로 나타난다. 또한 남은 만기가 줄수록 보정항이 약해져 포지션이 점차 Merton형 항에 가까워지는 점도 그림의 후반부에서 읽을 수 있다.

Figure 11.8
Figure 11.8.
최적 pairs trading 전략의 P&L 히스토그램.

그림 11.8은 위 최적전략을 반복 시뮬레이션했을 때의 P&L 히스토그램이다. 원문 그림에는 Sharpe ratio가 약 \(3.45\)로 제시되어 있다. 이 수치는 단순히 '평균회귀가 보인다'는 수준을 넘어, 효용극대화·측도변환·선형 PDE·Feynman-Kac 표현을 모두 거쳐 얻은 전략이 수치실험에서도 의미 있는 성과를 낸다는 것을 보여 준다. 동시에 이 절은 11.2의 ad hoc 밴드 전략과 달리, 거래규칙이 외생적으로 주어진 것이 아니라 모형과 목적함수로부터 내생적으로 도출되었다는 점에서 질적으로 다른 수준의 pairs trading 이론을 제시한다.

'Financial Engineering > ALGORITHMIC AND HIGH-FREQUENCY TRADING' 카테고리의 다른 글

Chapter 12. Order Imbalance  (0) 2026.03.22
Chapter 10. Market Making  (0) 2026.03.22
9  (1) 2026.03.22
8  (0) 2026.03.22
Chapter 7. Optimal Execution with Continuous Trading II  (0) 2026.03.22