본문 바로가기

Financial Engineering/ALGORITHMIC AND HIGH-FREQUENCY TRADING

Chapter 12. Order Imbalance

 

 

 

Part A — 선수지식

1. 확률공간, 시그마대수, 가측함수

1.1 정의

정의 1.1

확률공간은 \((\Omega,\mathcal F,\mathbb P)\)로 쓴다. 여기서 \(\Omega\)는 표본공간, \(\mathcal F\)는 사건들의 시그마대수, \(\mathbb P\)는 \(\mathcal F\) 위의 확률측도다.

$$ \Omega\in\mathcal F,\qquad A\in\mathcal F\Rightarrow A^c\in\mathcal F,\qquad A_n\in\mathcal F\Rightarrow \bigcup_{n=1}^{\infty}A_n\in\mathcal F. $$

랜덤변수 \((X:\Omega\to\mathbb R)\)는 모든 Borel 집합 \((B\subset\mathbb R)\)에 대해 \((X^{-1}(B)\in\mathcal F)\)를 만족하는 가측함수다. 보통은 모든 \((x\in\mathbb R)\)에 대해 \((\{X\le x\}\in\mathcal F)\)임을 보이면 충분하다.

1.2 기본 명제

정리 1.1

시그마대수 \(\mathcal F\)는 공집합, 가산교집합, 차집합에 대해 닫혀 있다.

증명

먼저 \((\Omega\in\mathcal F)\)이므로 여집합 닫힘성에 의해 \((\Omega^c=\varnothing\in\mathcal F)\)다. 이제 \((A_n\in\mathcal F)\)라 하자. 그러면 각 \((A_n^c\in\mathcal F)\)이고, 시그마대수의 가산합집합 닫힘성 때문에

$$ \bigcup_{n=1}^{\infty}A_n^c\in\mathcal F $$

가 된다. 다시 여집합을 취하면 드모르간 법칙

$$ \left(\bigcup_{n=1}^{\infty}A_n^c\right)^c=\bigcap_{n=1}^{\infty}A_n $$

에 의해 \((\bigcap_{n=1}^{\infty}A_n\in\mathcal F)\)를 얻는다. 마지막으로 차집합은

$$ A\setminus B=A\cap B^c $$

로 쓸 수 있다. 이미 여집합 닫힘성과 교집합 닫힘성을 보였으므로 \((A,B\in\mathcal F\Rightarrow A\setminus B\in\mathcal F)\)다. ∎

2. 적분, \(L^p\) 공간, 조건부기댓값

2.1 적분가능성과 \(L^p\)

정의 2.1

적분가능하다는 것은 \((\mathbb E[|X|]<\infty)\)를 뜻한다. 제곱적분가능하다는 것은 \((\mathbb E[X^2]<\infty)\)를 뜻한다. 일반적으로

$$ L^p(\Omega,\mathcal F,\mathbb P)=\left\{X:\Omega\to\mathbb R\,\middle|\,\mathbb E[|X|^p]<\infty\right\},\qquad 1\le p<\infty $$

로 둔다.

2.2 조건부기댓값의 정의

정의 2.2

부분 시그마대수 \((\mathcal G\subset\mathcal F)\)와 적분가능한 확률변수 \((X\in L^1)\)가 주어졌다고 하자. \((\mathbb E[X\mid\mathcal G])\)는 다음 두 조건을 만족하는 확률변수 \((Y)\)다.

  1. \((Y)\)는 \((\mathcal G)\)-가측이다.
  2. 모든 \((A\in\mathcal G)\)에 대해 \((\int_A Y\,d\mathbb P=\int_A X\,d\mathbb P)\).

둘째 조건은 \((\mathcal G)\)가 담고 있는 정보 범위 안에서 \((Y)\)가 \((X)\)와 같은 적분을 갖는다는 뜻이다.

2.3 존재성에 필요한 정리: 라돈–니코딤 정리

정의 2.3

측도 \((\nu)\)가 측도 \((\mu)\)에 대해 절대연속이라는 것은 \((\mu(A)=0\Rightarrow \nu(A)=0)\)가 모든 가측집합 \((A)\)에 대해 성립함을 뜻하며, 이를 \((\nu\ll\mu)\)로 쓴다.

정리 2.1 (Radon–Nikodym 정리)

\((S,\Sigma)\) 위의 \(\sigma\)-유한측도 \((\nu,\mu)\)가 \((\nu\ll\mu)\)를 만족하면, 어떤 비음수 가측함수 \((f)\)가 존재하여

$$ \nu(A)=\int_A f\,d\mu,\qquad \forall A\in\Sigma $$

가 된다. 이 \((f)\)를 \((d\nu/d\mu)\)라 한다.

증명

증명은 여러 방식이 있으나 여기서는 조건부기댓값 존재성에 직접 이어지는 형태로 전개한다. 먼저 \((\mu)\)가 유한측도인 경우를 보인다. 집합

$$ \mathcal C:=\left\{g\ge 0:\ g\text{ 가측},\ \int_A g\,d\mu\le \nu(A)\ \forall A\in\Sigma\right\} $$

를 생각하자. \((0\in\mathcal C)\)이므로 공집합이 아니다. 이제

$$ \alpha:=\sup_{g\in\mathcal C}\int g\,d\mu $$

를 두고, \((g_n\in\mathcal C)\)를 골라 \((\int g_n d\mu\uparrow \alpha)\)가 되게 하자. \((h_n:=\max\{g_1,\dots,g_n\})\)로 두면 \((h_n\in\mathcal C)\)이고 \((h_n\uparrow h)\)인 가측함수 \((h)\)가 존재한다. 단조수렴정리에 의해

$$ \int_A h\,d\mu=\lim_{n\to\infty}\int_A h_n\,d\mu\le \nu(A),\qquad \forall A\in\Sigma, $$

이므로 \((h\in\mathcal C)\)이고 \((\int h d\mu=\alpha)\)다. 이제 잔여측도 \((\lambda:=\nu-h\mu)\)를 정의하자. 즉

$$ \lambda(A):=\nu(A)-\int_A h\,d\mu,\qquad A\in\Sigma. $$

정의상 \((\lambda)\)는 비음수 측도다. 이제 \((\lambda)\)가 영측도임을 보이면 끝난다. 반대로 영측도가 아니라고 가정하자. 그러면 어떤 \((\varepsilon>0)\)와 어떤 가측집합 \((B)\)가 존재하여 \((\lambda(B)>\varepsilon\mu(B))\)가 된다. 그러면

$$ \tilde h:=h+\varepsilon \mathbf 1_B $$

에 대해 모든 \((A\in\Sigma)\)에 대하여

$$ \int_A \tilde h\,d\mu=\int_A h\,d\mu+\varepsilon\mu(A\cap B) \le \nu(A)-\lambda(A\cap B)+\varepsilon\mu(A\cap B) \le \nu(A) $$

가 되어 \((\tilde h\in\mathcal C)\)다. 그런데

$$ \int \tilde h\,d\mu=\int h\,d\mu+\varepsilon\mu(B)>\alpha $$

이므로 \((\alpha)\)의 정의에 모순이다. 따라서 \((\lambda\equiv 0)\)이고 \((\nu(A)=\int_A h\,d\mu)\)다. 유일성은 두 밀도 \((f,g)\)가 있다면 \((A=\{f>g\})\)에 대해

$$ 0=\int_A(f-g)\,d\mu $$

인데 integrand가 양이므로 \((\mu(A)=0)\)다. \((\{g>f\})\)도 같은 방식으로 영집합이므로 \((f=g)\) almost everywhere다. \(\sigma\)-유한측도인 일반 경우는 전체 공간을 유한측도 조각으로 분해하여 각 조각에서 얻은 밀도를 이어붙이면 된다. ∎

2.4 조건부기댓값의 존재와 유일성

정리 2.2

모든 \((X\in L^1(\mathcal F))\)에 대해 \((\mathbb E[X\mid\mathcal G])\)가 존재하고 almost surely 유일하다.

증명

먼저 \((X\ge 0)\)인 경우를 보자. \((\mathcal G)\) 위에 측도 \((\nu)\)를

$$ \nu(A):=\int_A X\,d\mathbb P,\qquad A\in\mathcal G $$

로 정의한다. \((\mathbb P(A)=0)\)이면 \((\nu(A)=0)\)이므로 \((\nu\ll \mathbb P|_{\mathcal G})\)다. 방금 증명한 라돈–니코딤 정리에 의해 어떤 \((\mathcal G)\)-가측 함수 \((Y\ge 0)\)가 존재하여

$$ \nu(A)=\int_A Y\,d\mathbb P, \qquad \forall A\in\mathcal G. $$

$$ \int_A X\,d\mathbb P=\int_A Y\,d\mathbb P, \qquad \forall A\in\mathcal G. $$

이므로 \((Y)\)는 정의에 의해 \((\mathbb E[X\mid\mathcal G])\)다. 일반적인 \((X\in L^1)\)에 대해서는

$$ X=X^+-X^-,\qquad X^+,X^-\in L^1 $$

로 분해한 뒤 각 항에 위 과정을 적용해

$$ \mathbb E[X\mid\mathcal G]:=\mathbb E[X^+\mid\mathcal G]-\mathbb E[X^-\mid\mathcal G] $$

로 정의하면 된다. 유일성은 두 후보 \((Y_1,Y_2)\)에 대해 집합 \((A=\{Y_1>Y_2\}\in\mathcal G)\)를 택하면

$$ \int_A(Y_1-Y_2)\,d\mathbb P=0 $$

인데 integrand가 \((A)\) 위에서 양수이므로 \((\mathbb P(A)=0)\)다. 같은 방식으로 \((\{Y_2>Y_1\})\)도 영집합이므로 \((Y_1=Y_2)\) almost surely다. ∎

2.5 조건부기댓값의 기본 성질

정리 2.3

다음 성질들이 성립한다.

  • 선형성: \((\mathbb E[aX+bY\mid\mathcal G]=a\mathbb E[X\mid\mathcal G]+b\mathbb E[Y\mid\mathcal G])\).
  • tower property: \((\mathcal H\subset\mathcal G)\)이면 \((\mathbb E[\mathbb E[X\mid\mathcal G]\mid\mathcal H]=\mathbb E[X\mid\mathcal H])\).
  • pull-out: \((Z)\)가 bounded \((\mathcal G)\)-가측이면 \((\mathbb E[ZX\mid\mathcal G]=Z\mathbb E[X\mid\mathcal G])\).
  • Jensen: \((\varphi)\)가 볼록이고 \((X,\varphi(X)\in L^1)\)이면 \((\varphi(\mathbb E[X\mid\mathcal G])\le \mathbb E[\varphi(X)\mid\mathcal G])\) almost surely.

증명

선형성은 정의의 적분 등식을 양변에 그대로 적용하면 된다. 예를 들어 임의의 \((A\in\mathcal G)\)에 대해

$$ \int_A \big(a\mathbb E[X\mid\mathcal G]+b\mathbb E[Y\mid\mathcal G]\big)\,d\mathbb P =a\int_A X\,d\mathbb P+b\int_A Y\,d\mathbb P =\int_A (aX+bY)\,d\mathbb P. $$

tower property는 \((Y:=\mathbb E[X\mid\mathcal G])\)라고 두고 \((A\in\mathcal H\subset\mathcal G)\)에 대해

$$ \int_A \mathbb E[Y\mid\mathcal H]d\mathbb P=\int_A Yd\mathbb P=\int_A Xd\mathbb P $$

를 확인하면 끝난다. pull-out 성질은 \((Z)\)가 \((\mathcal G)\)-가측이고 bounded이므로 \((A\in\mathcal G)\)에 대해 \((ZA\)의 지시함수와 함께 묶어

$$ \int_A Z\mathbb E[X\mid\mathcal G]d\mathbb P=\int_A ZX\,d\mathbb P $$

를 얻으면 된다. Jensen 부등식은 먼저 \((\varphi)\)의 접선지지식

$$ \varphi(x)=\sup_{(a,b)\in\mathcal D}(ax+b) $$

를 유리기울기의 가산한 집합 \((\mathcal D)\)에 대해 잡을 수 있음을 이용한다. 그러면 각 \((a,b)\)에 대해

$$ \varphi(X)\ge aX+b. $$

조건부기댓값을 취하면

$$ \mathbb E[\varphi(X)\mid\mathcal G]\ge a\mathbb E[X\mid\mathcal G]+b. $$

이 부등식이 모든 \((a,b)\)에 대해 성립하므로 우변의 상한을 취하면

$$ \mathbb E[\varphi(X)\mid\mathcal G]\ge \varphi(\mathbb E[X\mid\mathcal G]). $$

따라서 Jensen 부등식이 나온다. ∎

3. 수렴정리와 균등적분가능성

3.1 단조수렴정리, Fatou 보조정리, 지배수렴정리

정리 3.1 \((0\le X_n\uparrow X)\)이면 \((\mathbb E[X_n]\uparrow \mathbb E[X])\).

정리 3.2 \((X_n\ge 0)\)이면 \((\mathbb E[\liminf X_n]\le \liminf \mathbb E[X_n])\).

정리 3.3 \((X_n\to X)\) a.s.이고 \((|X_n|\le Y\in L^1)\)이면 \((\mathbb E[X_n]\to\mathbb E[X])\).

3.2 균등적분가능성의 정의

정의 3.1

확률변수족 \((\mathcal X)\)가 균등적분가능하다는 것은

$$ \lim_{K\to\infty}\sup_{X\in\mathcal X}\mathbb E\big[|X|\mathbf 1_{\{|X|>K\}}\big]=0 $$

가 성립함을 말한다. 한 수열 \((X_n)\)에 대해서는 \((\{X_n:n\ge 1\})\)가 이 성질을 가지면 UI라고 말한다.

3.3 UI가 주는 \(L^1\) 수렴

정리 3.4

확률변수열 \((X_n)\)이 \((X)\)로 확률수렴하고, 가족 \((\{X_n\})\)가 균등적분가능하다고 하자. 그러면 \((X\in L^1)\)이며

$$ \mathbb E[|X_n-X|]\to 0. $$

증명

먼저 균등적분가능성으로부터 일률적 \((L^1)\)-유계를 얻는다. 임의의 \((K>0)\)에 대해

$$ \mathbb E|X_n| = \mathbb E\big[|X_n|\mathbf 1_{\{|X_n|\le K\}}\big] + \mathbb E\big[|X_n|\mathbf 1_{\{|X_n|>K\}}\big] \le K+\sup_m\mathbb E\big[|X_m|\mathbf 1_{\{|X_m|>K\}}\big]. $$

균등적분가능성의 정의에 의해 우변의 두 번째 항은 \((K\to\infty)\)일 때 0으로 간다. 따라서 적당한 \((K)\)를 고르면 우변이 \((n)\)에 무관하게 유계이므로

$$ \sup_n \mathbb E|X_n|<\infty $$

를 얻는다.

이제 확률수렴으로부터 부분수열 \((X_{n_k})\)를 하나 잡으면, 그 안에서 다시 거의확실수렴하는 부분부분수열 \((X_{n_{k_j}})\)를 고를 수 있다. 즉

$$ X_{n_{k_j}}\to X \qquad \text{a.s.} $$

이다. 그러면 Fatou 보조정리에 의해

$$ \mathbb E|X| \le \liminf_{j\to\infty}\mathbb E|X_{n_{k_j}}| \le \sup_n \mathbb E|X_n| <\infty. $$

따라서 \((X\in L^1)\)다.

다음으로 \((L^1)\)-수렴을 보인다. 임의의 \((K>0)\)에 대해

$$ \mathbb E|X_n-X| = \mathbb E\Big[|X_n-X|\mathbf 1_{\{|X_n|\le K,\ |X|\le K\}}\Big] + \mathbb E\Big[|X_n-X|\mathbf 1_{\{|X_n|>K\}\cup\{|X|>K\}}\Big]. $$

첫 번째 항은 body 부분이다. 그 영역에서는 \((|X_n-X|\le 2K)\)이므로, 확률수렴과 유계성으로부터

$$ \mathbb E\Big[|X_n-X|\mathbf 1_{\{|X_n|\le K,\ |X|\le K\}}\Big]\to 0 $$

가 된다. 둘째 항은 tail 부분인데, 삼각부등식으로

$$ |X_n-X|\mathbf 1_{\{|X_n|>K\}\cup\{|X|>K\}} \le 2|X_n|\mathbf 1_{\{|X_n|>K\}} + 2|X|\mathbf 1_{\{|X|>K\}} $$

라고 둘 수 있으므로

$$ \mathbb E\Big[|X_n-X|\mathbf 1_{\{|X_n|>K\}\cup\{|X|>K\}}\Big] \le 2\mathbb E\big[|X_n|\mathbf 1_{\{|X_n|>K\}}\big] + 2\mathbb E\big[|X|\mathbf 1_{\{|X|>K\}}\big]. $$

첫 번째 항은 균등적분가능성 때문에 \((K)\)를 크게 잡으면 \((n)\)에 무관하게 작아진다. 둘째 항은 \((X\in L^1)\)이므로 \((K\to\infty)\)일 때 0으로 간다. 따라서 임의의 \((\varepsilon>0)\)에 대해 먼저 \((K)\)를 크게 골라 tail 전체를 \((\varepsilon/2)\)보다 작게 만들고, 그 다음 \((n)\)을 크게 골라 body 부분을 \((\varepsilon/2)\)보다 작게 만들면

$$ \mathbb E|X_n-X|<\varepsilon $$

가 된다. \((\varepsilon)\)가 임의였으므로 \((\mathbb E|X_n-X|\to 0)\)이고, 따라서 \((X_n\to X)\) in \((L^1)\)다. ∎

4. 필트레이션, 정지시간, 마팅게일, 선택정지

4.1 정의

정의 4.1

\((\mathbb F=(\mathcal F_t)_{t\ge 0})\)가 필트레이션이라는 것은 \((s\le t\Rightarrow \mathcal F_s\subset\mathcal F_t)\)를 뜻한다. 과정 \((X_t)\)가 adapted라는 것은 \((X_t)\)가 각 \((t)\)마다 \((\mathcal F_t)\)-가측임을 뜻한다.

랜덤시간 \((\tau)\)가 정지시간이라는 것은 모든 \((t\ge 0)\)에 대해 \((\{\tau\le t\}\in\mathcal F_t)\)임을 뜻한다.

적응과정 \((M_t)\)가 마팅게일이라는 것은 \((\mathbb E|M_t|<\infty)\)이고 모든 \((s\le t)\)에 대해

$$ \mathbb E[M_t\mid\mathcal F_s]=M_s $$

가 성립함을 말한다.

4.2 선택정지정리의 한 형태

정리 4.1

\((M_t)\)가 UI 마팅게일이고 \((\tau)\)가 유계 정지시간이면

$$ \mathbb E[M_\tau]=\mathbb E[M_0]. $$

더 일반적으로 \((\sigma\le\tau)\)인 두 유계 정지시간에 대해

$$ \mathbb E[M_\tau\mid\mathcal F_\sigma]=M_\sigma $$

가 성립한다.

증명

먼저 \((\tau)\)가 유한한 격자값 \((0=t_0<t_1<\cdots<t_n)\)만 p="" 그러면<="" 취한다고="" 하자.="">

$$ M_\tau = M_{t_0} + \sum_{k=1}^{n}(M_{t_k}-M_{t_{k-1}})\mathbf 1_{\{\tau\ge t_k\}}. $$

왜냐하면 \((\tau=t_j)\)인 경우 위 합에서 \((k\le j)\)인 항만 살아남아 망원합이 정확히 \((M_{t_j})\)를 만들기 때문이다. 기대값을 취하면

$$ \mathbb E[M_\tau] = \mathbb E[M_0] + \sum_{k=1}^{n}\mathbb E\Big[(M_{t_k}-M_{t_{k-1}})\mathbf 1_{\{\tau\ge t_k\}}\Big]. $$

정지시간의 정의 때문에 \((\{\tau\ge t_k\}=\{\tau>t_{k-1}\}\in\mathcal F_{t_{k-1}})\)다. 따라서

$$ \mathbb E\Big[(M_{t_k}-M_{t_{k-1}})\mathbf 1_{\{\tau\ge t_k\}}\Big] = \mathbb E\Big[ \mathbf 1_{\{\tau\ge t_k\}} \mathbb E[M_{t_k}-M_{t_{k-1}}\mid\mathcal F_{t_{k-1}}] \Big]. $$

그런데 \((M_t)\)가 마팅게일이므로

$$ \mathbb E[M_{t_k}-M_{t_{k-1}}\mid\mathcal F_{t_{k-1}}] = \mathbb E[M_{t_k}\mid\mathcal F_{t_{k-1}}]-M_{t_{k-1}} = 0. $$

따라서 각 항이 0이고, 결국 \((\mathbb E[M_\tau]=\mathbb E[M_0])\)다.

이제 \((\sigma,\tau)\)가 같은 격자값만 취한다고 하자. \((A\in\mathcal F_\sigma)\)를 임의로 잡고 \((\sigma)\)의 값에 따라 분해하면

$$ A=\bigcup_{j=0}^{n}\Big(A\cap\{\sigma=t_j\}\Big), $$

이고 이 합은 서로소다. 또 \((A\cap\{\sigma=t_j\}\in\mathcal F_{t_j})\)다. 각 \((j)\)에 대해 위에서 한 계산을 \((t_j)\) 이후 구간에 적용하면

$$ \mathbb E\Big[M_\tau\mathbf 1_{A\cap\{\sigma=t_j\}}\Big] = \mathbb E\Big[M_{t_j}\mathbf 1_{A\cap\{\sigma=t_j\}}\Big]. $$

이를 모두 더하면

$$ \mathbb E[M_\tau\mathbf 1_A] = \mathbb E[M_\sigma\mathbf 1_A]. $$

이 식이 모든 \((A\in\mathcal F_\sigma)\)에 대해 성립하므로 조건부기댓값의 정의에 의해

$$ \mathbb E[M_\tau\mid\mathcal F_\sigma]=M_\sigma $$

를 얻는다.

마지막으로 일반 유계 정지시간으로 간다. dyadic 상근사

$$ \tau_n:=2^{-n}\lceil 2^n\tau\rceil,\qquad \sigma_n:=2^{-n}\lceil 2^n\sigma\rceil $$

를 두면 각 \((\tau_n,\sigma_n)\)는 유한 격자값을 취하는 정지시간이고 \((\sigma_n\le\tau_n)\), \((\tau_n\downarrow\tau)\), \((\sigma_n\downarrow\sigma)\)다. 연속경로 가정 아래 \((M_{\tau_n}\to M_\tau)\), \((M_{\sigma_n}\to M_\sigma)\) almost surely다. 또 \((M_t)\)가 UI 마팅게일이므로 \((\{M_{\tau_n}\})\)와 \((\{M_{\sigma_n}\})\)는 균등적분가능하다. 따라서 3.4를 적용하면 \((L^1)\)-수렴이 따라온다.

$$ M_{\tau_n}\to M_\tau\quad\text{in }L^1,\qquad M_{\sigma_n}\to M_\sigma\quad\text{in }L^1. $$

각 \((n)\)에 대해 이미 \((\mathbb E[M_{\tau_n}\mid\mathcal F_{\sigma_n}]=M_{\sigma_n})\)를 알고 있으므로, \((n\to\infty)\) 극한을 통과시키면

$$ \mathbb E[M_\tau\mid\mathcal F_\sigma]=M_\sigma $$

를 얻는다. 특히 \((\sigma\equiv 0)\)으로 두면 \((\mathbb E[M_\tau]=\mathbb E[M_0])\)가 된다. ∎

</t_1<\cdots<t_n)\)만>

5. 측도변환, density process, Bayes 공식

5.1 density process의 정의

정의 5.1

같은 가측공간 위의 두 확률측도 \((\mathbb Q\ll\mathbb P)\)가 있고 필트레이션 \((\mathbb F)\)가 주어졌다고 하자. 시간 \((t)\)에서의 density process \((Z_t)\)를

$$ Z_t:=\mathbb E^{\mathbb P}\!\left[\frac{d\mathbb Q}{d\mathbb P}\Bigm|\mathcal F_t\right] $$

로 정의한다. \((Z_t)\)는 \((\mathbb P)\)-마팅게일이고 \((Z_t\ge 0)\), \((\mathbb E^{\mathbb P}[Z_t]=1)\)을 만족한다.

5.2 Bayes 공식

정리 5.1

\((\mathbb Q\ll\mathbb P)\), \((Z_t=d\mathbb Q/d\mathbb P|_{\mathcal F_t})\)라 하자. 적당히 적분가능한 확률변수 \((X)\)에 대하여 \((s\le t)\)이면

$$ \mathbb E^{\mathbb Q}[X\mid\mathcal F_s]=\frac{1}{Z_s}\,\mathbb E^{\mathbb P}[XZ_t\mid\mathcal F_s]. $$

증명

우변을 \((Y)\)라고 두자. \((Y)\)는 \((\mathcal F_s)\)-가측이다. 이제 임의의 \((A\in\mathcal F_s)\)에 대해

$$ \int_A Y\,d\mathbb Q =\int_A YZ_s\,d\mathbb P =\int_A \mathbb E^{\mathbb P}[XZ_t\mid\mathcal F_s]d\mathbb P =\int_A XZ_t\,d\mathbb P =\int_A X\,d\mathbb Q. $$

첫 번째 등식은 \((d\mathbb Q=Z_s d\mathbb P)\) on \((\mathcal F_s)\), 세 번째 등식은 조건부기댓값의 정의, 마지막 등식은 \((d\mathbb Q=Z_t d\mathbb P)\) on \((\mathcal F_t)\)를 쓴 것이다. 따라서 조건부기댓값의 정의에 의해 \((Y=\mathbb E^{\mathbb Q}[X\mid\mathcal F_s])\)다. ∎

6. 브라운 운동, Itô 적분, 지수마팅게일

6.1 정의

정의 6.1

과정 \((W_t)_{t\ge 0}\)가 표준 브라운 운동이라는 것은 다음을 만족함을 뜻한다.

  1. \((W_0=0)\) almost surely.
  2. 서로 겹치지 않는 구간의 증가분이 독립이다.
  3. \((W_t-W_s\sim N(0,t-s))\) for \((0\le s<t)\).
  4. 표본경로가 거의 확실하게 연속이다.

6.2 Itô 적분의 정의와 등거리식

정의 6.2

단순예측가능과정

$$ H_t=\sum_{k=0}^{n-1}\xi_k\mathbf 1_{(t_k,t_{k+1}]}(t),\qquad \xi_k\in\mathcal F_{t_k} $$

에 대해 Itô 적분을

$$ \int_0^T H_t\,dW_t:=\sum_{k=0}^{n-1}\xi_k(W_{t_{k+1}}-W_{t_k}) $$

로 정의한다.

정리 6.1 (Itô 등거리식)

단순예측가능과정 \((H)\)에 대해

$$ \mathbb E\left[\left(\int_0^T H_t\,dW_t\right)^2\right]=\mathbb E\left[\int_0^T H_t^2\,dt\right]. $$

증명

적분 정의를 제곱하면

$$ \left(\sum_{k=0}^{n-1}\xi_k\Delta W_k\right)^2 =\sum_{k=0}^{n-1}\xi_k^2(\Delta W_k)^2+2\sum_{0\le i<j\le n-1}\xi_i\xi_j\Delta W_i\Delta W_j, $$

여기서 \((\Delta W_k:=W_{t_{k+1}}-W_{t_k})\)다. 기댓값을 취하면 교차항은 0이다. 실제로 \((i<j)\)이면 \((\xi_i\Delta W_i\xi_j)\)는 \((\mathcal F_{t_j})\)-가측이고 \((\Delta W_j)\)는 \((\mathcal F_{t_j})\)와 독립이며 평균이 0이므로

$$ \mathbb E[\xi_i\xi_j\Delta W_i\Delta W_j] =\mathbb E\big[\xi_i\xi_j\Delta W_i\,\mathbb E[\Delta W_j\mid\mathcal F_{t_j}]\big]=0. $$

따라서

$$ \mathbb E\left[\left(\int_0^T H_t\,dW_t\right)^2\right] =\sum_{k=0}^{n-1}\mathbb E[\xi_k^2(\Delta W_k)^2]. $$

또한 \((\xi_k)\)는 \((\mathcal F_{t_k})\)-가측이고 \((\Delta W_k)\)는 \((\mathcal F_{t_k})\)와 독립이며 분산이 \((t_{k+1}-t_k)\)이므로

$$ \mathbb E[\xi_k^2(\Delta W_k)^2]=\mathbb E[\xi_k^2]\,(t_{k+1}-t_k). $$

한편

$$ \int_0^T H_t^2\,dt=\sum_{k=0}^{n-1}\xi_k^2(t_{k+1}-t_k), $$

이므로 두 식의 기대값이 일치한다. ∎

6.3 Doléans–Dade 지수

정의 6.3

적절한 예측가능과정 \((\theta_t)\)에 대해 지수과정

$$ \mathcal E_t\!\left(-\int_0^{\cdot}\theta_u\,dW_u\right) :=\exp\left(-\int_0^t\theta_u\,dW_u-\frac12\int_0^t\theta_u^2\,du\right) $$

를 쓴다. Novikov 조건

$$ \mathbb E\left[\exp\left(\frac12\int_0^T\theta_u^2\,du\right)\right]<\infty $$

이 성립하면 이 지수과정은 진정한 마팅게일이 된다.

7. Girsanov 정리

7.1 정리의 준비

정의 7.1

\((\theta)\)가 예측가능하고 Novikov 조건을 만족한다고 하자. 그러면

$$ Z_t:=\exp\left(-\int_0^t\theta_u\,dW_u-\frac12\int_0^t\theta_u^2\,du\right) $$

는 양의 \((\mathbb P)\)-마팅게일이며 \((\mathbb E^{\mathbb P}[Z_t]=1)\)이다. 따라서

$$ \frac{d\mathbb Q}{d\mathbb P}\Bigg|_{\mathcal F_t}=Z_t $$

로 새 측도 \((\mathbb Q)\)를 정의할 수 있다.

7.2 Girsanov 정리와 증명

정리 7.1 (Girsanov)

위 설정에서

$$ W_t^{\mathbb Q}:=W_t+\int_0^t\theta_u\,du $$

는 측도 \((\mathbb Q)\) 아래 표준 브라운 운동이다.

증명

연속성과 적응성은 정의에서 즉시 따라온다. 따라서 남은 일은 \((\mathbb Q)\) 아래에서 증가분이 정규분포를 갖고 서로 독립임을 보이는 것이다. 이를 위해 \((0\le s<t)\)와 \((\mathcal="" \((u\in\mathbb="" f_s)\)-조건부="" p="" r)\)를="" 계산한다.<="" 고정하고="" 특성함수를="">

$$ \mathbb E^{\mathbb Q}\!\left[e^{iu(W_t^{\mathbb Q}-W_s^{\mathbb Q})}\mid\mathcal F_s\right] = \frac{1}{Z_s}\, \mathbb E^{\mathbb P}\!\left[Z_t e^{iu(W_t^{\mathbb Q}-W_s^{\mathbb Q})}\mid\mathcal F_s\right]. $$

여기서 \((W_t^{\mathbb Q}-W_s^{\mathbb Q}=W_t-W_s+\int_s^t\theta_rdr)\)이므로

$$ \mathbb E^{\mathbb Q}\!\left[e^{iu(W_t^{\mathbb Q}-W_s^{\mathbb Q})}\mid\mathcal F_s\right] = \frac{1}{Z_s}\, \mathbb E^{\mathbb P}\!\left[ Z_t\exp\left(iu(W_t-W_s)+iu\int_s^t\theta_rdr\right) \Bigm|\mathcal F_s \right]. $$

density process의 곱분해를 쓰면

$$ Z_t = Z_s\exp\left( -\int_s^t\theta_r\,dW_r-\frac12\int_s^t\theta_r^2dr \right). $$

이를 대입하여 \((Z_s)\)를 약분하면

$$ \mathbb E^{\mathbb Q}\!\left[e^{iu(W_t^{\mathbb Q}-W_s^{\mathbb Q})}\mid\mathcal F_s\right] = \mathbb E^{\mathbb P}\!\left[ \exp\left( iu(W_t-W_s)+iu\int_s^t\theta_rdr-\int_s^t\theta_r dW_r-\frac12\int_s^t\theta_r^2dr \right) \Bigm|\mathcal F_s \right]. $$

이제 확률적분 부분을 먼저 묶는다.

$$ iu(W_t-W_s)-\int_s^t\theta_r dW_r = \int_s^t(iu-\theta_r)\,dW_r. $$

또한

$$ (iu-\theta_r)^2=-u^2-2iu\theta_r+\theta_r^2 $$

이므로

$$ -\frac12(iu-\theta_r)^2 = \frac12u^2+iu\theta_r-\frac12\theta_r^2. $$

이를 적분하면

$$ iu\int_s^t\theta_rdr-\frac12\int_s^t\theta_r^2dr = -\frac12\int_s^t(iu-\theta_r)^2dr-\frac12u^2(t-s). $$

따라서 위 식은

$$ \mathbb E^{\mathbb P}\!\left[ \exp\left(\int_s^t(iu-\theta_r)dW_r-\frac12\int_s^t(iu-\theta_r)^2dr\right) \exp\left(-\frac12u^2(t-s)\right) \Bigm|\mathcal F_s \right] $$

로 정리된다. 두 번째 지수항은 \((\mathcal F_s)\)-가측 상수이므로 밖으로 뺄 수 있다.

이제 첫 번째 지수항의 조건부기댓값이 1임을 보인다. 단순예측가능 과정 \((\psi_r=\sum_{m=0}^{N-1}\xi_m\mathbf 1_{(t_m,t_{m+1}]}(r))\)를 생각하자. 각 \((\xi_m)\)가 \((\mathcal F_{t_m})\)-가측 bounded 복소수라고 하면, 브라운 운동의 독립증가분과 정규분포의 mgf를 이용해

$$ \mathbb E\left[ \exp\left(\xi_m\Delta W_m-\frac12\xi_m^2\Delta t_m\right) \Bigm|\mathcal F_{t_m} \right] = 1 $$

가 성립한다. 이를 구간마다 반복해 tower property를 적용하면

$$ \mathbb E\left[ \exp\left(\int_s^t\psi_r dW_r-\frac12\int_s^t\psi_r^2dr\right) \Bigm|\mathcal F_s \right] = 1. $$

\((\psi=iu-\theta)\)는 \((L^2)\)에서 단순예측가능 과정으로 근사할 수 있고, Novikov 가정 덕분에 대응 지수과정들의 \((L^1)\)-수렴이 보장된다. 따라서 위 결론은 \((\psi=iu-\theta)\)에도 그대로 적용된다. 그래서

$$ \mathbb E^{\mathbb Q}\!\left[e^{iu(W_t^{\mathbb Q}-W_s^{\mathbb Q})}\mid\mathcal F_s\right] = e^{-\frac12u^2(t-s)}. $$

이는 \((W_t^{\mathbb Q}-W_s^{\mathbb Q})\)가 \((N(0,t-s))\)임을 뜻한다. 우변이 \((\mathcal F_s)\)에 의존하지 않으므로 증가분은 과거와 독립이다. 서로 겹치지 않는 여러 구간에 대해서도 같은 계산을 결합특성함수에 적용하면 곱으로 분해되므로 증가분 독립성이 얻어진다. 따라서 \((W^{\mathbb Q})\)는 연속경로를 갖는 독립정규증가분 과정이므로 표준 브라운 운동이다. ∎

</t)\)와>

8. 뉴메레르, numeraire derivative, 측도변환

8.1 정의

정의 8.1

엄밀한 양의 거래가능 자산 \((N_t)\)를 뉴메레르라 부른다. 자산가격 \((S_t)\)를 \((N_t)\)로 나눈 값

$$ \widetilde S_t^{(N)}:=\frac{S_t}{N_t} $$

이 어떤 측도 아래 마팅게일이 되면 그 측도를 \((N)\)-forward 혹은 \((N)\)-numeraire measure라고 부른다. payoff \((H_T)\)를 이 뉴메레르로 나눈 값 \((H_T/N_T)\)을 기대값으로 평가하는 것이 numeraire pricing의 핵심이다.

8.2 change of numeraire 정리

정리 8.1

기준 화폐계정 \((B_t)\) 아래의 위험중립측도를 \((\mathbb Q^B)\)라 하자. 다른 양의 거래가능 자산 \((N_t)\)를 뉴메레르로 택하면

$$ \frac{d\mathbb Q^N}{d\mathbb Q^B}\Bigg|_{\mathcal F_t} = \frac{N_t/B_t}{N_0/B_0}. $$

또한 임의의 payoff \((H_T)\)의 시각 \((t)\) 가격은

$$ V_t = N_t\,\mathbb E^{\mathbb Q^N}\!\left[\frac{H_T}{N_T}\Bigm|\mathcal F_t\right] $$

로 쓸 수 있다.

증명

출발점은 기준 뉴메레르 \((B_t)\) 아래의 위험중립가격식이다.

$$ \frac{V_t}{B_t} = \mathbb E^{\mathbb Q^B}\!\left[\frac{H_T}{B_T}\Bigm|\mathcal F_t\right]. $$

특히 \((N_t)\)도 거래가능 자산이므로 할인과정 \((N_t/B_t)\)는 \((\mathbb Q^B)\) 아래 마팅게일이다.

$$ \frac{N_t}{B_t} = \mathbb E^{\mathbb Q^B}\!\left[\frac{N_T}{B_T}\Bigm|\mathcal F_t\right]. $$

따라서 정규화된 과정

$$ Z_t:=\frac{N_t/B_t}{N_0/B_0} $$

는 양의 평균 1 마팅게일이고, 이것으로 새 측도 \((\mathbb Q^N)\)를

$$ \frac{d\mathbb Q^N}{d\mathbb Q^B}\Bigg|_{\mathcal F_t}=Z_t $$

로 정의할 수 있다.

이제 가격식 우변에 \((N_T/N_T)\)를 곱해

$$ \frac{V_t}{B_t} = \mathbb E^{\mathbb Q^B}\!\left[ \frac{H_T}{N_T}\frac{N_T}{B_T} \Bigm|\mathcal F_t \right] $$

라고 쓴다. 그런데 \((N_T/B_T=(N_0/B_0)Z_T)\)이므로

$$ \frac{V_t}{B_t} = \frac{N_0}{B_0}\, \mathbb E^{\mathbb Q^B}\!\left[ \frac{H_T}{N_T}Z_T \Bigm|\mathcal F_t \right]. $$

5.2의 Bayes 공식을 적용하면

$$ \mathbb E^{\mathbb Q^B}[Z_TY\mid\mathcal F_t] = Z_t\,\mathbb E^{\mathbb Q^N}[Y\mid\mathcal F_t] $$

이므로 \((Y=H_T/N_T)\)로 두어

$$ \frac{V_t}{B_t} = \frac{N_0}{B_0}Z_t\, \mathbb E^{\mathbb Q^N}\!\left[ \frac{H_T}{N_T} \Bigm|\mathcal F_t \right]. $$

마지막으로 \((Z_t=(N_t/B_t)/(N_0/B_0))\)를 대입하면

$$ \frac{V_t}{B_t} = \frac{N_t}{B_t} \mathbb E^{\mathbb Q^N}\!\left[ \frac{H_T}{N_T} \Bigm|\mathcal F_t \right]. $$

양변에 \((B_t)\)를 곱하면

$$ V_t = N_t\,\mathbb E^{\mathbb Q^N}\!\left[ \frac{H_T}{N_T} \Bigm|\mathcal F_t \right] $$

를 얻는다. 즉 새로운 뉴메레르를 택한다는 것은 그 자산으로 나눈 가격들이 마팅게일이 되도록 측도를 다시 정의하는 일이다. payoff도 같은 뉴메레르로 나누어 기대값을 취한 뒤 다시 현재 뉴메레르를 곱하면 현재가격이 복원된다. ∎

9. 이산시간/연속시간 마르코프 연쇄와 생성자

9.1 이산시간 마르코프 연쇄

정의 9.1

상태공간 \((\{1,\dots,K\})\)를 가진 과정 \((Z_n)\)가 마르코프 연쇄라는 것은

$$ \mathbb P(Z_{n+1}=j\mid Z_n=i,Z_{n-1},\dots,Z_0)=\mathbb P(Z_{n+1}=j\mid Z_n=i)=A_{ij} $$

가 성립하는 것을 말한다. \((A=(A_{ij}))\)는 전이행렬이며 각 행이 1로 합쳐진다.

9.2 전이행렬 MLE

정리 9.1

관측값 \((z_1,\dots,z_T)\)에서 전이횟수

$$ n_{ij}:=\sum_{t=2}^{T}\mathbf 1_{\{z_{t-1}=i,\ z_t=j\}} $$

를 두면 전이행렬의 최대우도추정량은

$$ \widehat A_{ij}=\frac{n_{ij}}{\sum_{k=1}^{K}n_{ik}}. $$

증명

마르코프 성질에 의해 표본경로 우도는 초기분포를 제외하면

$$ L(A)=\prod_{t=2}^{T}A_{z_{t-1}z_t}. $$

같은 전이들을 모아 쓰면

$$ L(A)=\prod_{i=1}^{K}\prod_{j=1}^{K}A_{ij}^{n_{ij}}. $$

로그우도는

$$ \ell(A)=\sum_{i=1}^{K}\sum_{j=1}^{K}n_{ij}\log A_{ij}. $$

제약식은 각 행마다

$$ \sum_{j=1}^{K}A_{ij}=1, \qquad A_{ij}\ge 0. $$

라그랑주 승수 \((\gamma_i)\)를 도입해

$$ \mathcal L(A,\gamma)=\sum_{i,j}n_{ij}\log A_{ij}+\sum_i\gamma_i\left(\sum_jA_{ij}-1\right) $$

를 최대화한다. 미분하면

$$ \frac{\partial \mathcal L}{\partial A_{ij}}=\frac{n_{ij}}{A_{ij}}+\gamma_i=0, $$

$$ A_{ij}=-\frac{n_{ij}}{\gamma_i}. $$

이 식을 행합 제약에 대입하면

$$ 1=\sum_{j=1}^{K}A_{ij}=-\frac{1}{\gamma_i}\sum_{j=1}^{K}n_{ij}, $$

따라서

$$ \gamma_i=-\sum_{j=1}^{K}n_{ij}. $$

이를 다시 대입하면

$$ \widehat A_{ij}=\frac{n_{ij}}{\sum_{k=1}^{K}n_{ik}}. $$

이 값은 \((A_{ij}\ge 0)\), 행합 1을 만족하고 로그우도는 각 행에서 엄격오목이므로 전역 최대점이다. ∎

9.3 연속시간 마르코프 연쇄와 생성자

정의 9.2

연속시간 상태과정 \((Z_t)\)가 생성자 \((G=(G_{ij}))\)를 가진 CTMC라는 것은 \((i\neq j)\)에 대해 \((G_{ij}\ge 0)\), \((G_{ii}=-\sum_{j\neq i}G_{ij})\)이고, 작은 \((h)\)에 대해

$$ \mathbb P(Z_{t+h}=j\mid Z_t=i)=G_{ij}h+o(h),\qquad i\neq j, $$
$$ \mathbb P(Z_{t+h}=i\mid Z_t=i)=1+G_{ii}h+o(h) $$

를 만족하는 것을 뜻한다.

10. 포아송 과정, 강도, doubly stochastic Poisson

10.1 정의

정의 10.1

포아송 과정 \((N_t)\)는 \((N_0=0)\), 독립증분, 정상증분을 갖고

$$ \mathbb P(N_{t+h}-N_t=1)=\lambda h+o(h),\qquad \mathbb P(N_{t+h}-N_t\ge 2)=o(h) $$

를 만족하는 counting process다. 상태의존 강도에서는 \((\lambda)\)가 상수가 아니라 현재 상태 \((Z_t)\)와 제어 \((\delta_t)\)의 함수 \((\lambda(Z_t,\delta_t))\)가 된다.

10.2 강도모형의 우도

정리 10.1

상태 \((i)\)에 머문 총시간을 \((U_i)\), 그 상태에서 관측된 사건 수를 \((M_i)\)라 하자. 상태별 상수강도 \((\lambda_i)\)의 최대우도추정량은

$$ \widehat\lambda_i=\frac{M_i}{U_i} $$

다.

증명

상태 \((i)\)에서의 사건도착이 강도 \((\lambda_i)\)를 가진 포아송 과정이라고 하면, 상태 \((i)\)에 머무는 전체 시간 \((U_i)\) 동안 관측된 총 사건수 \((M_i)\)는

$$ \mathbb P(M_i=m)=e^{-\lambda_i U_i}\frac{(\lambda_i U_i)^m}{m!} $$

를 따른다. 우도는 상수항을 제외하면

$$ L_i(\lambda_i)\propto e^{-\lambda_i U_i}\lambda_i^{M_i} $$

이고 로그우도는

$$ \ell_i(\lambda_i)=M_i\log\lambda_i-\lambda_i U_i+\text{const}. $$

미분하여 0으로 두면

$$ \frac{d\ell_i}{d\lambda_i}=\frac{M_i}{\lambda_i}-U_i=0 $$

이므로

$$ \widehat\lambda_i=\frac{M_i}{U_i}. $$

둘째 미분은

$$ \frac{d^2\ell_i}{d\lambda_i^2}=-\frac{M_i}{\lambda_i^2}<0 $$

이므로 최대점이다. ∎

11. 동적계획법과 점프형 DPE

11.1 가치함수의 정의

정의 11.1

상태변수 \((Y_t)\), 제어 \((\alpha_t)\), 목표시각 \((T)\), running reward \((f)\), terminal reward \((g)\)가 주어졌을 때 가치함수는

$$ V(t,y)=\sup_{\alpha}\mathbb E_{t,y}\left[\int_t^T f(u,Y_u,\alpha_u)\,du+g(Y_T)\right] $$

로 정의된다.

11.2 점프가 있는 경우의 형식적 DPE

정리 11.1

확산 생성자 \((\mathcal L^\alpha)\)와 점프강도 \((\lambda(y,\alpha))\), 점프 후 상태 \((\Gamma(y,\alpha))\)를 갖는 제어문제의 형식적 HJB/DPE는

$$ 0 = \partial_tV(t,y) + \sup_{\alpha}\Big\{ f(t,y,\alpha)+\mathcal L^\alpha V(t,y) +\lambda(y,\alpha)\big(V(t,\Gamma(y,\alpha))-V(t,y)\big) \Big\} $$

와 terminal condition \((V(T,y)=g(y))\)로 주어진다.

증명

짧은 시간폭 \((h>0)\)를 고정하고 \((t)\)에서 \((t+h)\)까지 제어를 상수 \((\alpha)\)로 묶는다. 동적계획원리의 형식적 버전은

$$ V(t,y) = \sup_{\alpha} \mathbb E\left[ \int_t^{t+h}f(u,Y_u,\alpha)\,du + V(t+h,Y_{t+h}) \right]. $$

이제 \([t,t+h]\) 구간에서 일어날 수 있는 사건을 0회 점프, 정확히 1회 점프, 2회 이상 점프로 나눈다. 한 번도 점프하지 않을 확률은 \((1-\lambda(y,\alpha)h+o(h))\), 정확히 한 번 점프할 확률은 \((\lambda(y,\alpha)h+o(h))\), 두 번 이상 점프할 확률은 \((o(h))\)다.

점프가 없으면 상태는 확산 부분만 따라 움직인다. 따라서 Itô 공식과 생성자의 정의에 의해

$$ \mathbb E\big[V(t+h,Y_{t+h})\mid \text{no jump}\big] = V(t,y)+\big(\partial_tV(t,y)+\mathcal L^\alpha V(t,y)\big)h+o(h). $$

또한 running reward 적분은 \((u\in[t,t+h])\) 동안 상태가 거의 \((y)\)에 머무르므로

$$ \int_t^{t+h}f(u,Y_u,\alpha)\,du = f(t,y,\alpha)h+o(h). $$

정확히 한 번 점프하면 상태는 1차근사에서 \((\Gamma(y,\alpha))\)로 이동하므로 점프로 인한 가치 변화는

$$ V(t,\Gamma(y,\alpha))-V(t,y) $$

이고, 그 기대기여는

$$ \lambda(y,\alpha)h\big(V(t,\Gamma(y,\alpha))-V(t,y)\big)+o(h) $$

이다. 두 번 이상 점프하는 사건은 확률 자체가 \((o(h))\)이므로 전체 기대값에 주는 기여도 \((o(h))\)다.

따라서 모든 1차항을 모으면

$$ V(t,y) = \sup_{\alpha}\Bigg\{ V(t,y) + \Big[ f(t,y,\alpha) + \partial_tV(t,y) + \mathcal L^\alpha V(t,y) + \lambda(y,\alpha)\big(V(t,\Gamma(y,\alpha))-V(t,y)\big) \Big]h + o(h) \Bigg\}. $$

양변에서 \((V(t,y))\)를 빼고 \((h)\)로 나누면

$$ 0 = \sup_{\alpha}\Bigg\{ f(t,y,\alpha) + \partial_tV(t,y) + \mathcal L^\alpha V(t,y) + \lambda(y,\alpha)\big(V(t,\Gamma(y,\alpha))-V(t,y)\big) \Bigg\} + o(1). $$

여기서 \((h\downarrow0)\) 극한을 취하면 원하는 HJB/DPE를 얻는다. terminal time에서는 더 이상 미래 제어가 남아 있지 않고 terminal payoff만 남으므로 \((V(T,y)=g(y))\)다. ∎

12. Order Imbalance 장에 직접 필요한 미시구조 정의

12.1 주문불균형

정의 12.1

bid 측 최우선 호가 수량을 \((V_t^b)\), ask 측 최우선 호가 수량을 \((V_t^a)\)라 하면 quoted volume order imbalance는

$$ P_t=\frac{V_t^b-V_t^a}{V_t^b+V_t^a} $$

로 정의된다. 값이 1에 가까우면 매수호가 쪽이 두껍고, -1에 가까우면 매도호가 쪽이 두껍다.

12.2 regime화

정의 12.2

실증모형에서는 연속값 \((P_t)\)를 몇 개의 구간으로 나누어 \((Z_t\in\{1,\dots,K\})\)라는 regime 변수로 바꾼다. Chapter 12에서는 다섯 개 regime을 사용하며, ask-heavy, ask-bias, neutral, bid-bias, bid-heavy라는 해석을 부여한다.

12.3 주문불균형 장에서 왜 이 선수지식이 모두 필요한가

이 장은 단순한 회귀분석 장이 아니다. 주문불균형 \((P_t)\)를 regime \((Z_t)\)로 이산화한 뒤, \((Z_t)\)의 전이행렬 또는 생성자를 최대우도로 추정하고, 그 상태에 의존하는 시장가주문 도착강도와 가격점프분포를 추정한 뒤, 다시 그 상태를 포함하는 지정가주문 청산문제의 DPE를 푼다. 따라서 조건부기댓값, RN 정리, UI, 측도변환, Girsanov, 뉴메레르, 마르코프 연쇄, 포아송 강도, 동적계획법이 모두 직접적으로 연결된다.

Part B — Chapter 12 Order Imbalance

12.1 서론

이 장의 출발점은 단순하다. 이전 장들에서 에이전트는 대체로 중간가격, 외부 시장가주문의 도착, 그리고 자기 재고를 기준으로 행동했다. 그러나 실제 전자시장에서 이 세 변수만으로는 충분하지 않다. 호가창 자체가 이미 매수 압력과 매도 압력의 비대칭을 드러내고 있기 때문이다. 이 장은 바로 그 비대칭을 주문불균형(order imbalance)이라는 상태변수로 끌어올린다. 원문이 강조하는 바는 분명하다. 주문불균형은 단순한 묘사 통계가 아니라, 들어올 시장가주문의 방향과 강도, 그리고 직후 가격점프의 방향과 크기까지 동시에 예고하는 예측변수다.

장의 구성도 이 논리를 그대로 따른다. 먼저 12.2절에서는 장중 자료를 이용해 주문불균형의 정의와 관측적 특징을 설명하고, 이를 이산시간 및 연속시간 마르코프 연쇄와 상태의존 포아송 도착 모형으로 정식화한다. 이어서 가격점프를 같은 상태공간에 결합한다. 12.3절에서는 장 전체를 함수로 본 일별 특징을 검토한다. 마지막 12.4절에서는 주문불균형을 외생 상태변수로 포함한 지정가주문 전용 최적청산 문제를 설정하고 DPE를 도출한다.

12.2 장중 특징

12.2.1 주문불균형의 정의

원문은 시간 \(t\)에서의 호가 수량 기반 주문불균형을 다음과 같이 정의한다.

$$ P_t = \frac{V_t^b - V_t^a}{V_t^b + V_t^a}. $$

여기서 \(V_t^b\)는 매수호가 측에 게시된 지정가주문 수량, \(V_t^a\)는 매도호가 측에 게시된 지정가주문 수량이다. 따라서 \(P_t\in[-1,1]\)이며, 값이 \(+1\)에 가까울수록 매수호가 측이 두껍고, \(-1\)에 가까울수록 매도호가 측이 두껍다. 책은 at-the-touch 수량, 상위 \(n\)개 호가수준, 혹은 중간가격 주변 \(n\)틱 이내 수량 등 여러 정의가 가능하다고 말하지만, 실증 부분에서는 단순성과 예측력의 균형을 위해 최우선 호가만 사용한다. 이것이 이후 모든 추정의 기준이 된다.

Figure 12.1 Order imbalance for ORCL

그림 12.1. ORCL의 2013년 11월 1일 주문불균형. 아래 두 패널의 파란 점은 매수 시장가주문, 빨간 점은 매도 시장가주문의 도착시점과 그 시점의 불균형을 나타낸다.

상단 패널은 하루 전체에서 불균형이 매우 빠르게 진동함을 보여 준다. 하단의 두 개 확대 패널은 짧은 시간 구간 안에서도 불균형 상태가 여러 regime 사이를 오가며, 시장가주문 도착이 그 상태와 결합되어 있음을 눈으로 확인하게 한다.

12.2.2 주문불균형의 관측적 특징

Figure 12.1의 핵심은 변동의 크기만이 아니다. 불균형이 장중 내내 크게 흔들리지만, 그 흔들림은 무질서한 백색잡음이 아니라 상태 지속성과 방향성을 가진다는 점이 중요하다. 원문은 ORCL 자료를 밀리초 단위로 표본화하고 100ms 평균을 취해 장 전체와 두 개의 짧은 확대 구간을 제시한다. 이 그림만으로도 두 가지 사실이 드러난다. 첫째, 불균형은 상당한 자기상관을 가진다. 둘째, 특정 불균형 상태에 있을 때 어느 방향의 시장가주문이 더 자주 들어오는지가 달라진다.

Figure 12.2 MO arrival conditional on imbalance regime

그림 12.2. ORCL 2013-11-01 자료에서 주문불균형 regime에 조건부한 시장가주문 도착 특성.

좌측 패널은 특정 regime에서 buy, sell, total 시장가주문이 관측되는 비중을, 우측 패널은 regime별 체류시간으로 정규화한 초당 도착률을 보여 준다. 오른쪽 패널이 더 본질적이다. 단순 빈도는 해당 상태에 오래 머문 효과를 섞어버리지만, 정규화된 도착률은 상태가 고정되었을 때 진짜 체결강도를 보여 준다. buy-heavy 구간에서는 매수 시장가주문 강도가 커지고, ask-heavy 구간에서는 매도 시장가주문 강도가 커진다.

Figure 12.3 ACF and correlation with future price changes

그림 12.3. 주문불균형의 자기상관함수와 미래 가격변화와의 상관구조.

왼쪽 패널은 2,000개 시차에 대한 자기상관을 보여 주며, 주문불균형이 짧은 시간에서 상당한 지속성을 가짐을 보여 준다. 오른쪽 패널은 미래 가격변화와의 상관을 나타내며, 불균형이 양수일수록 이후 가격상승과 연결되는 경향이 있음을 보여 준다. 즉 주문불균형은 order flow뿐 아니라 가격 자체의 단기 이동까지 예고한다.

12.2.3 이산시간 마르코프 연쇄 모형

이제 연속값인 \((P_t)\)를 몇 개의 regime로 이산화한다. 이산화된 상태열을 \((Z_1,Z_2,\dots,Z_T)\)라 하고, 전이확률행렬 \((A=(A_{ij}))\)를 갖는 이산시간 마르코프 연쇄를 가정하면

$$ \mathbb P(Z_{n+1}=j\mid Z_n=i)=A_{ij} $$

가 된다. 각 행은 현재 상태 \((i)\)에서 다음 상태로 가는 확률벡터이므로

$$ A_{ij}\ge 0,\qquad \sum_{j=1}^{K}A_{ij}=1 $$

를 만족해야 한다. 관측된 상태열로부터 전이횟수를

$$ n_{ij}:=\sum_{r=2}^{T}\mathbf 1_{\{Z_{r-1}=i,\ Z_r=j\}}, \qquad n_i:=\sum_{j=1}^{K}n_{ij} $$

라고 두면 likelihood는

$$ L(A)=\prod_{i=1}^{K}\prod_{j=1}^{K}A_{ij}^{n_{ij}} $$

이고 로그가능도는

$$ \ell(A)=\sum_{i=1}^{K}\sum_{j=1}^{K}n_{ij}\log A_{ij} $$

가 된다. 제약은 행별로 분리되므로 \((i)\)번째 행에 대해

$$ \mathcal L_i=\sum_{j=1}^{K}n_{ij}\log A_{ij}+\lambda_i\left(\sum_{j=1}^{K}A_{ij}-1\right) $$

를 두면 일차조건은

$$ \frac{\partial\mathcal L_i}{\partial A_{ij}} = \frac{n_{ij}}{A_{ij}}+\lambda_i=0 \qquad\Longrightarrow\qquad A_{ij}=-\frac{n_{ij}}{\lambda_i} $$

이고, 행합 제약으로부터 \((\lambda_i=-n_i)\)를 얻는다. 따라서 MLE는

$$ \widehat A_{ij}=\frac{n_{ij}}{n_i}. \tag{12.1} $$

즉 현재 상태 \((i)\)가 나타난 횟수 중에서 다음 상태가 \((j)\)였던 상대빈도가 곧 추정량이다. 책의 ORCL 자료에서는 5개 균등 구간을 사용했고, 추정 전이행렬은 다음과 같다.

$$ \widehat{A}= \begin{pmatrix} 0.946 & 0.050 & 0.003 & 0.000 & 0.000\\ 0.006 & 0.973 & 0.020 & 0.001 & 0.000\\ 0.000 & 0.009 & 0.979 & 0.012 & 0.000\\ 0.000 & 0.000 & 0.013 & 0.980 & 0.008\\ 0.000 & 0.000 & 0.001 & 0.023 & 0.976 \end{pmatrix}. \tag{12.4} $$

행렬을 보면 대각원소가 매우 크다. 이는 100ms 같은 짧은 샘플링 간격에서는 imbalance regime이 한 번 관측되면 바로 다음 시점에도 그대로 남아 있을 확률이 높다는 뜻이다. 따라서 주문불균형은 단순한 잡음 지표가 아니라 persistence를 가진 상태변수로 다루는 편이 맞다.

12.2.4 연속시간 생성자 모형

최적제어로 넘어가려면 상태변수를 연속시간으로 다루는 편이 자연스럽다. 따라서 책은 이산시간 전이행렬 \((A)\)를 생성자 행렬 \((B)\)로 바꾼다. 연속시간 마르코프 연쇄에서는 작은 시간폭 \((h)\)에 대해

$$ \mathbb P(Z_{t+h}=j\mid Z_t=i) = \begin{cases} 1+B_{ii}h+o(h), & j=i,\\ B_{ij}h+o(h), & j\neq i, \end{cases} $$

가 성립한다. 그래서 비대각원소 \((B_{ij})\)는 \((i\to j)\)의 순간전이율이고, 대각원소는 전체 이탈률의 음수다.

$$ B_{ij}\ge 0\ (i\neq j),\qquad B_{ii}=-\sum_{j\neq i}B_{ij},\qquad \sum_{j=1}^{K}B_{ij}=0. $$

유한 시간폭 \((\Delta T)\)에 대한 전이행렬과 생성자 사이에는

$$ \mathbb P(Z_t=j\mid Z_s=i)=\big[e^{B(t-s)}\big]_{ij}, \qquad A=e^{B\Delta T}, \qquad B=\frac{1}{\Delta T}\log A $$

의 관계가 있다. ORCL 데이터에 대해 100ms 기준으로 얻은 생성자 추정치는

$$ \widehat{B}= \begin{pmatrix} -0.553 & 0.521 & 0.030 & 0.002 & 0.000\\ 0.068 & -0.279 & 0.205 & 0.005 & 0.001\\ 0.001 & 0.089 & -0.219 & 0.128 & 0.001\\ 0.000 & 0.002 & 0.128 & -0.209 & 0.078\\ 0.000 & 0.001 & 0.008 & 0.235 & -0.244 \end{pmatrix}. \tag{12.5} $$

여기서 \(( -B_{ii})\)는 상태 \((i)\)에서 떠나는 총률이므로 평균 체류시간은

$$ \mathbb E[\text{holding time in state }i]=\frac{1}{-B_{ii}} $$

로 해석된다. 또 상태 \((i)\)를 떠난다고 했을 때 다음 상태가 \((j)\)일 조건부확률은

$$ \mathbb P(\text{next state}=j\mid \text{leave }i)=\frac{B_{ij}}{-B_{ii}},\qquad j\neq i $$

다. 즉 생성자는 “얼마나 빨리 떠나는가”와 “떠나면 어디로 가는가”를 동시에 담는다. 뒤의 가치함수 방정식에 \((\sum_kG_{z,k}(h(t,q,k)-h(t,q,z)))\)가 들어가는 것은 바로 이 작은 시간 전개 때문이다.

12.2.5 시장가주문 도착을 결합한 연속시간 모형

연속시간으로 옮긴 뒤에도 상태전이만으로는 부족하다. 책의 핵심은 각 regime에서 buy와 sell 시장가주문이 서로 독립인 포아송 도착을 가진다고 두는 것이다. 즉 regime \(i\)에 있을 때

$$ N_t^+\text{의 강도}=\lambda_i^+, \qquad N_t^-\text{의 강도}=\lambda_i^-. $$

한 epoch 안에서 buy와 sell 도착이 i.i.d. 구조를 갖는다는 사실을 이용하면, regime 체류시간과 regime 전이횟수를 함께 포함한 가능도를 쓸 수 있고, 최종 MLE는

$$ \widehat{\lambda}_i^\pm = \frac{\widehat{M}_i^\pm}{\Delta \tau_i}, \qquad \widehat{\Lambda}_i = \frac{\sum_{j\ne i} n_{ij}}{\Delta \tau_i}, \qquad [\widehat{P}]_{ij} = \frac{n_{ij}}{\sum_{j\ne i} n_{ij}}. \tag{12.6} $$

로 정리된다. 따라서 off-diagonal 생성자 추정량은

$$ \widehat{\lambda}_{ij} = \frac{n_{ij}}{\Delta \tau_i} $$

가 된다. 이 모형의 직관은 단순하다. 어떤 상태에서 얼마나 오래 있었는지와 그 상태에서 무슨 사건이 몇 번 일어났는지를 분리해서 센다. 그러면 체류시간당 발생횟수로 도착강도와 상태전이율을 동시에 추정할 수 있다.

이 절의 핵심은 likelihood가 상태별 체류시간과 사건횟수로 분해된다는 점이다. regime \((i)\)에 머문 총 시간을 \((\Delta\tau_i)\), 그 동안의 buy MO 횟수를 \((M_i^+)\), sell MO 횟수를 \((M_i^-)\), 그리고 \((i\to j)\) 전이횟수를 \((n_{ij})\)라고 두면 로그가능도는 상수항을 제외하고

$$ \ell_i = M_i^+\log\lambda_i^+ + M_i^-\log\lambda_i^- + \sum_{j\ne i}n_{ij}\log P_{ij} - (\lambda_i^+ + \lambda_i^- + \Lambda_i)\Delta\tau_i $$

처럼 쓸 수 있다. 여기서 \((\Lambda_i=\sum_{j\ne i}\lambda_{ij})\)는 상태 \((i)\)를 떠나는 총률이다. 이 식을 보면 왜 추정량이 “횟수 / 시간” 꼴이 되는지가 바로 드러난다.

$$ \widehat\lambda_i^+ = \frac{M_i^+}{\Delta\tau_i}, \qquad \widehat\lambda_i^- = \frac{M_i^-}{\Delta\tau_i}, \qquad \widehat\lambda_{ij} = \frac{n_{ij}}{\Delta\tau_i}. $$

즉 상태별 체류시간은 exposure이고, 그 위에 발생한 사건횟수가 numerator가 된다. 그래서 드물게 방문되는 극단 regime일수록 추정오차가 커질 수 있다.

Figure 12.4 event timeline likelihood

그림 12.4. 한 epoch 내부 가능도를 계산하기 위한 이벤트 타임라인.

이 그림은 regime이 바뀌지 않는 구간 안에서 buy와 sell 시장가주문 도착시각을 분리하여 기록하고, 그 생존확률과 마지막 무도착 확률을 곱해 epoch 가능도를 만드는 과정을 시각화한다. 상태전이는 epoch 경계에서만 일어나고, 각 epoch 내부에서는 조건부 포아송 구조가 유지된다.

ORCL 자료에 이벤트 시점 불균형을 사용해 추정한 결과는 다음과 같다.

$$ \widehat{\lambda}^+ = \begin{pmatrix} 0.074\\ 0.042\\ 0.037\\ 0.074\\ 0.216 \end{pmatrix}, \qquad \widehat{\lambda}^- = \begin{pmatrix} 0.856\\ 0.123\\ 0.048\\ 0.027\\ 0.025 \end{pmatrix}, $$
$$ \widehat{B}= \begin{pmatrix} -3.34 & 2.34 & 0.59 & 0.28 & 0.13\\ 0.31 & -0.93 & 0.54 & 0.01 & 0.07\\ 0.01 & 0.26 & -0.58 & 0.30 & 0.02\\ 0.03 & 0.01 & 0.29 & -0.56 & 0.23\\ 0.03 & 0.03 & 0.09 & 0.74 & -0.88 \end{pmatrix}. \tag{12.7} $$

이 결과는 sell-heavy한 하루라는 전체 평균과, bid-heavy 상태에서 buy MO 강도가 더 커지는 조건부 구조를 동시에 보여 준다. 즉 하루 전체로 보면 매도 쪽이 우세했지만, 현재 호가창 상태를 조건으로 걸면 전혀 다른 미세동학이 드러난다. 이것이 주문불균형을 상태변수로 넣어야 하는 직접적인 이유다.

12.2.6 가격점프의 조건부 분포

책은 한 걸음 더 나아가 시장가주문 도착 직후의 중간가격 변화 \(\Delta S\)를, 도착 직전의 주문불균형 regime과 시장가주문 방향에 조건부하여 측정한다. 불균형을 다섯 개 구간으로 자르면 상태는

$$ Z=\begin{cases} -2, & \rho\in[-1,-\tfrac35],\\ -1, & \rho\in[-\tfrac35,-\tfrac15),\\ 0, & \rho\in[-\tfrac15,+\tfrac15),\\ +1, & \rho\in[+\tfrac15,+\tfrac35),\\ +2, & \rho\in[+\tfrac35,+1], \end{cases} $$

로 정의된다. 각각 sell-heavy, sell-bias, neutral, buy-bias, buy-heavy 상태다. 아래 표는 원문 Table 12.1 전체를 그대로 반영한 것이다.

표 12.1의 내용을 수학적으로 쓰면, 각 regime \((i)\)와 주문 방향 \((\pm)\)에 대해 가격점프의 조건부 pmf를

$$ p_{i,k}^{\pm} := \mathbb P\big(\Delta S=d_k\mid Z_{t^-}=i,\ \text{MO sign}=\pm\big) $$

로 둘 수 있다. 실증적으로는 각 bin \((d_k)\)에 들어간 횟수를 \((c_{i,k}^{\pm})\)라고 두고

$$ \widehat p_{i,k}^{\pm} = \frac{c_{i,k}^{\pm}}{\sum_m c_{i,m}^{\pm}} $$

로 추정한다. 그 일차모멘트

$$ m_i^\pm:=\sum_k d_k p_{i,k}^\pm $$

는 해당 상태에서 buy 또는 sell MO가 들어왔을 때 평균적으로 중간가격이 어느 방향으로 얼마만큼 움직이는지를 뜻한다. 뒤의 \((\mu(z))\)는 바로 이런 조건부 평균점프들로 구성된다.

Table 12.1 conditional price change distribution

표 12.1. ORCL 2013-11-01 자료에서 주문불균형 regime과 시장가주문 방향에 조건부한 가격변화 분포.

buy MO가 buy-heavy 상태에서 들어오면 위쪽 가격점프 확률이 커지고, sell MO가 sell-heavy 상태에서 들어오면 아래쪽 가격점프 확률이 커진다. 따라서 주문불균형은 체결강도뿐 아니라 가격영향 함수의 조건부 형태까지 바꾼다.

12.3 일별 특징

앞 절이 장중 미시구조에 초점을 맞췄다면, 12.3절은 하루 전체를 함수로 본다. 주문불균형 버킷을 \([-1,1]\) 구간 위의 그리드로 놓고, 각 날마다 그 버킷에 조건부한 거래활동 곡선을 관측한 뒤 이를 함수형 자료(functional data)로 해석한다. 이때 평균곡선은 Legendre 다항식 기저에 사영해서 추정하고, 일별 편차는 functional principal components로 요약한다. 요점은 일별 거래환경을 하나의 숫자가 아니라 곡선 전체의 모양으로 파악해야 한다는 것이다.

함수형 자료 관점에서는 각 거래일 \((d)\)의 관측곡선을 하나의 랜덤함수 \((X_d(\rho))\)로 본다. 평균곡선 \((\mu)\)를 뺀 뒤 주성분 전개를 하면

$$ X_d(\rho)=\mu(\rho)+\sum_{m=1}^{M}\xi_{d,m}\varphi_m(\rho)+\varepsilon_d(\rho). $$

여기서 \((\varphi_m)\)는 함수형 주성분, \((\xi_{d,m})\)는 그날의 score다. 원래 imbalance 변수는 \(([-1,1])\)에 살지만, Legendre 다항식을 쓰기 위해 \(([-1,1])\)를 \(([0,1])\)로 선형변환한 뒤 전개해도 본질은 같다. 중요한 점은 하루 전체를 하나의 숫자가 아니라 곡선 전체의 모양으로 본다는 것이다.

Figure 12.5 functional principal components

그림 12.5. ORCL 2013년 자료에서 주문불균형-조건부 거래활동 곡선의 함수형 주성분 구조.

상단 패널들은 buy와 sell을 합친 total activity의 평균곡선과 주성분 편차를, 하단 패널들은 buy MO activity의 평균곡선과 주성분 편차를 보여 준다. 곡선 전체가 U자형 혹은 비대칭 형태를 보이는 것은 극단적인 불균형 상태에서 거래가 더 활발하다는 사실을 말해 준다. 또한 주성분은 어떤 날에는 전체 강도가 커지고, 어떤 날에는 한쪽 꼬리가 더 두꺼워지는 식의 변형을 분리해 준다.

원문은 평균곡선을 다음과 같이 Legendre 다항식에 사영한 함수로 둔다.

$$ \mu(\rho)=\sum_{n=1}^N \alpha_n P_n(\rho), \qquad \rho\in[0,1], $$

여기서 계수 \(\alpha_n\)들이 매일 달라지는 확률변수로 해석된다. 즉 각 거래일은 함수공간에서 하나의 랜덤 드로우이고, 실제 관측은 유한 버킷 위의 noisy sample이다. 이런 관점은 장중 상태모형과 일별 환경정보를 한 프레임 안에서 결합할 수 있게 해 준다.

12.4 최적 청산

12.4.1 주문불균형이 포함된 가격과 체결 모형

이제 책은 주문불균형을 상태변수로 포함한 지정가주문 전용 최적청산 문제로 들어간다. 상태는 현금 \((X_t)\), 중간가격 \((S_t)\), 재고 \((Q_t)\), 그리고 주문불균형 regime \((Z_t)\)다. 외부 시장가주문과 외생적 호가창 재배치가 가격을 움직인다고 두면 중간가격 동학은

$$ dS_t = \varepsilon_{M^+_{t^-}, Z_{t^-}}\,dM_t^+ - \varepsilon_{M^-_{t^-}, Z_{t^-}}\,dM_t^- + \eta^+_{J^+_{t^-}, Z_{t^-}}\,dJ_t^+ - \eta^-_{J^-_{t^-}, Z_{t^-}}\,dJ_t^-. $$

여기서 \((M_t^\pm)\)는 외부 buy/sell MO 개수, \((J_t^\pm)\)는 외생적 LOB 재배치 점프를 센다. 계수 \((\varepsilon,\eta)\)는 점프가 일어날 때 중간가격이 얼마나 움직이는지를 나타내며, regime \((Z_t)\)에 의존한다.

에이전트는 오직 매도 지정가주문만 이용해 재고를 청산한다. 시각 \((t)\)에 깊이 \((\delta_t\ge 0)\)에 한 단위를 posting한다고 하고, 그 주문의 체결 counting process를 \((N_t^\delta)\)라 쓰면 재고와 현금의 동학은

$$ dQ_t^\delta=-dN_t^\delta, \qquad dX_t^\delta=(S_{t^-}+\delta_t)\,dN_t^\delta. $$

즉 체결이 한 번 일어날 때마다 재고는 1 감소하고, 현금은 그 순간의 체결가격만큼 증가한다. 체결강도는 regime과 깊이에 의존하는 감소함수로

$$ \Lambda^+(z,\delta)=\lambda^+(z)e^{-\kappa\delta} $$

처럼 둔다. 여기서 \((\lambda^+(z))\)는 해당 regime에서의 기본 buy MO 강도이고, \((\kappa)\)는 호가를 더 멀리 둘수록 체결확률이 얼마나 빨리 감소하는지를 나타낸다. 따라서 주문불균형은 가격 drift만 바꾸는 것이 아니라 체결속도 자체도 바꾼다.

이 모형을 regime별 기대점프로 요약하면 가격의 조건부 drift는

$$ \mu(z)=\lambda^+(z)\,\mathbb E[\varepsilon^+_{0,z}] -\lambda^-(z)\,\mathbb E[\varepsilon^-_{0,z}] +\eta^+(z)\,\mathbb E[\eta^+_{0,z}] -\eta^-(z)\,\mathbb E[\eta^-_{0,z}] $$

로 정리된다. 이후 DPE 안에서 \((q\mu(z))\)가 나타나는 이유는, 재고 \((q)\)단위를 들고 있을 때 가격 drift가 곧 mark-to-market 기대손익으로 직결되기 때문이다.

12.4.2 정지시각과 성과기준

에이전트는 재고가 0이 되거나 만기 \((T)\)가 오면 거래를 중단한다. 정지시각은

$$ \tau = T\wedge \inf\{t\ge 0:Q_t^\delta=0\} $$

로 둔다. 제어 \((\delta)\) 하에서의 성과기준은

$$ H^\delta(t,x,S,z,q) = \mathbb E_{t,x,S,z,q}\!\left[ X_\tau^\delta + Q_\tau^\delta\big(S_\tau-\alpha Q_\tau^\delta\big) - \phi\int_t^\tau (Q_s^\delta)^2\,ds \right]. \tag{12.8} $$

첫째 항은 누적 현금, 둘째 항은 만기 잔여재고를 충격비용 \((\alpha Q_\tau^2)\)를 감안해 청산한 terminal value, 셋째 항은 inventory risk penalty다. 따라서 가치함수는

$$ H(t,x,S,z,q)=\sup_{\delta\in\mathcal A} H^\delta(t,x,S,z,q) $$

가 된다. 허용전략집합은 보통

$$ \mathcal A= \left\{ \delta=(\delta_t)_{t\ge 0}: \delta_t\text{ is predictable and }\delta_t\ge 0 \right\} $$

처럼 둔다. predictability는 현재까지의 정보만으로 quote depth를 정해야 한다는 뜻이고, \((\delta_t\ge 0)\)는 문제를 limit-order-only liquidation으로 유지하기 위한 제약이다.

12.4.3 DPE와 ansatz

동적계획원리를 적용하면, 가치함수는 재고 보유에 따른 running penalty, 자신의 LO를 체결시키는 buy MO 도착, 외생적 가격점프, 그리고 주문불균형 상태전이를 모두 포함한 DPE를 만족해야 한다. 책은 현금과 현재 midprice가 선형으로만 들어간다는 점을 이용해

$$ H(t,x,S,z,q)=x+qS+h(t,q,z) $$

라는 ansatz를 둔다. 이 ansatz의 의미는 분명하다. 현금 \((x)\)는 이미 실현된 부이고, 현재 midprice \((S)\)에 대해 \((q)\)단위를 들고 있으면 당장의 mark-to-market 가치는 \((qS)\)다. 남는 비선형 최적화 효과만 \((h(t,q,z))\)에 모은다.

체결이 한 번 일어났을 때 상태는 \((x,q)\mapsto(x+S+\delta,q-1)\)로 바뀌므로

$$ H(t,x+S+\delta,S,z,q-1) = x+qS+\delta+h(t,q-1,z). $$

따라서 fill jump가 만들어 내는 가치의 순증분은

$$ H(t,x+S+\delta,S,z,q-1)-H(t,x,S,z,q) = \delta+h(t,q-1,z)-h(t,q,z). $$

이를 위해 한계재고가치 차이를

$$ \Delta h(t,q,z):=h(t,q-1,z)-h(t,q,z) $$

라고 두면 체결의 순편익은 \((\delta+\Delta h)\)가 된다. 첫 번째 부분은 price improvement이고, 두 번째 부분은 재고를 한 단위 줄임으로써 continuation value가 얼마나 개선되는지를 뜻한다. 같은 방식으로 regime 전이항은

$$ H(t,x,S,k,q)-H(t,x,S,z,q)=h(t,q,k)-h(t,q,z) $$

가 되고, 또 \((\partial_tH=\partial_t h)\), \((\partial_SH=q)\)이므로 DPE는 \((h)\)만의 coupled system으로 줄어든다.

$$ 0 = \partial_t h(t,q,z)+\mu(z)q-\phi q^2 + \sup_{\delta\ge 0}\left\{\lambda^+(z)e^{-\kappa\delta}\big(\delta+\Delta h(t,q,z)\big)\right\} + \sum_{k} G_{z,k}\big[h(t,q,k)-h(t,q,z)\big]. \tag{12.9} $$

여기서 \((q\mu(z))\)는 drift로부터 얻는 기대 mark-to-market 손익, \((\phi q^2)\)는 inventory risk, 마지막 두 항은 각각 통제 가능한 체결효과와 통제 불가능한 regime switching 효과다.

12.4.4 최적 호가깊이와 제약된 문제

이제 \((12.9)\)의 내부 최적화를 고정된 \((t,q,z)\)에서 푼다. 최적화해야 할 함수는

$$ F(\delta)=\lambda^+(z)e^{-\kappa\delta}\big(\delta+\Delta h(t,q,z)\big), \qquad \Delta h(t,q,z):=h(t,q-1,z)-h(t,q,z). $$

여기서 \((\Delta h)\)가 클수록 재고를 한 단위 줄이는 것이 더 가치 있으므로, 최적 깊이는 더 작아져야 한다.

일차도함수는

$$ F'(\delta) = \lambda^+(z)e^{-\kappa\delta}\Big(1-\kappa(\delta+\Delta h(t,q,z))\Big) $$

이므로 내부해가 존재한다면

$$ 1-\kappa(\delta+\Delta h)=0 \qquad\Longrightarrow\qquad \widetilde\delta^*(t,q,z)=\frac{1}{\kappa}-\Delta h(t,q,z). $$

두 번째 도함수는

$$ F''(\delta) = \lambda^+(z)e^{-\kappa\delta}\Big(-2\kappa+\kappa^2(\delta+\Delta h)\Big) $$

이고, 내부해를 대입하면

$$ F''(\widetilde\delta^*)=-\kappa\lambda^+(z)e^{-\kappa\widetilde\delta^*}<0 $$

이므로 indeed 최대점이다. 하지만 문제의 제약은 \((\delta\ge 0)\)이므로 허용된 최적해는

$$ \delta^*(t,q,z)=\max\left\{\frac{1}{\kappa}-\Delta h(t,q,z),\,0\right\}. \tag{12.11} $$

이 된다. 이제 두 경우를 나눈다.

  1. \((\Delta h<1/\kappa)\)이면 내부해가 양수이므로 \((\delta^*=1/\kappa-\Delta h)\).
  2. \((\Delta h\ge 1/\kappa)\)이면 내부해가 음수이므로 경계점 \((\delta^*=0)\).

첫 번째 경우에는

$$ F(\delta^*) = \lambda^+(z)e^{-\kappa(\frac{1}{\kappa}-\Delta h)}\left(\frac{1}{\kappa}\right) = \lambda^+(z)\frac{1}{\kappa}e^{-1+\kappa\Delta h}, $$

두 번째 경우에는

$$ F(0)=\lambda^+(z)\Delta h. $$

결국 constrained equation은

$$ 0=\partial_t h(t,q,z)+\mu(z)q-\phi q^2 +\lambda^+(z) \begin{cases} \dfrac{1}{\kappa}e^{-1+\kappa\Delta h(t,q,z)}, & \Delta h(t,q,z)<\dfrac{1}{\kappa},\\[1ex] \Delta h(t,q,z), & \Delta h(t,q,z)\ge \dfrac{1}{\kappa}, \end{cases} +\sum_{k}G_{z,k}\big(h(t,q,k)-h(t,q,z)\big). \tag{12.12} $$

즉 한계재고가치가 충분히 크면 quote를 midprice에 바짝 붙여서라도 빨리 체결시키는 것이 최적이고, 한계재고가치가 작으면 더 먼 깊이에 주문을 두고 price improvement를 노리는 것이 최적이다.

Figure 12.6 optimal depth and inventory quantiles

그림 12.6. (a) sell-heavy와 buy-heavy regime에서의 최적 호가깊이. (b) 10,000회 시뮬레이션에서 재고경로의 평균, 중앙값, 5%, 95% 분위수.

buy-heavy 상태에서는 가격이 위로 움직일 기대가 더 크므로, 에이전트는 지나치게 낮은 가격에 먼저 팔려 나가는 역선택을 피하기 위해 더 깊게 호가를 낸다. 반대로 sell-heavy 상태에서는 기다릴수록 가격이 불리해질 가능성이 높으므로 midprice에 더 가깝게 호가를 낸다. 재고가 줄어들수록 급하게 팔 필요가 줄어들어 깊이도 커진다.

12.4.5 시뮬레이션과 표본경로

수치실험에서는 표 12.1과 식 (12.7)의 추정치를 사용하고, 단순화를 위해 MO 사이 LOB 재배치 점프는 생략한다. 원문이 제시한 불변분포는

$$ [0.0196,\;0.1548,\;0.3577,\;0.3534,\;0.1160] $$

이며, 불변상태에서의 buy MO 도착강도는 초당 약 0.0727이다. 실험 파라미터는

$$ T=300\text{ sec},\qquad S_0=33.61,\qquad \alpha=0.01,\qquad \kappa=100,\qquad \phi=10^{-5} $$

다. 책은 이 설정에서 constrained equation (12.12)를 수치적으로 푼 뒤 최적 깊이를 계산한다.

수치실험의 절차는 다음과 같다. 먼저 coupled equation \((12.12)\)를 backward in time으로 풀어 \((h(t,q,z))\)를 계산한다. 그런 다음 현재 상태 \((q,z)\)를 관측할 때마다

$$ \delta^*(t,q,z)=\max\left\{\frac{1}{\kappa}-\big(h(t,q-1,z)-h(t,q,z)\big),0\right\} $$

를 이용해 즉시 최적깊이를 산출한다. 시뮬레이션 중에는 \((Z_t)\)를 생성자 \((G)\)에 따라 점프시키고, 외부 buy MO는 상태의존 강도 \((\lambda^+(Z_t))\)로, 가격점프는 표 12.1의 조건부분포로 발생시킨다. 그러면 재고는 체결 때마다 계단식으로 감소하고, 최적깊이도 상태와 재고가 바뀔 때마다 함께 재조정된다.

Figure 12.7 sample path of optimal strategy

그림 12.7. 최적전략의 단일 표본경로: 가격, 시장가주문 도착, 재고경로, 최적 호가깊이, 주문불균형 regime.

패널 (a)는 중간가격과 에이전트의 최적 offer posting, 그리고 외부 buy/sell MO의 도착을 함께 보여 준다. 패널 (b)는 실제 재고경로와 평균 재고경로를 비교한다. 패널 (c)는 최적 깊이가 상태와 재고에 따라 계단식으로 조정되는 모습을 보여 주고, 패널 (d)는 주문불균형 regime이 시간에 따라 어떻게 바뀌는지 나타낸다. 이 그림은 주문불균형이 단순 설명변수가 아니라 제어규칙을 시시각각 바꾸는 실시간 상태라는 점을 가장 압축적으로 보여 준다.

12.4.6 정리와 증명

정의 12.3 이산시간 regime 전이횟수

정의 12.3

관측된 regime 표본 \((z_1,\dots,z_T)\)에 대해

$$ n_{ij}:=\sum_{t=2}^{T}\mathbf 1_{\{z_{t-1}=i,\ z_t=j\}} $$

를 상태 \((i)\)에서 \((j)\)로 이동한 횟수라고 한다.

정리 12.1

이산시간 주문불균형 regime 연쇄의 전이행렬 \((A)\)에 대한 최대우도추정량은

$$ \widehat A_{ij}=\frac{n_{ij}}{\sum_{k=1}^{K}n_{ik}} $$

이다.

증명

표본경로의 조건부우도는 초기상태를 제외하면

$$ L(A)=\prod_{t=2}^{T}A_{z_{t-1}z_t} $$

이다. 같은 항들을 모으면

$$ L(A)=\prod_{i=1}^{K}\prod_{j=1}^{K}A_{ij}^{n_{ij}}, \qquad \ell(A)=\sum_{i=1}^{K}\sum_{j=1}^{K}n_{ij}\log A_{ij}. $$

행별 제약식 \((\sum_jA_{ij}=1)\)을 도입해 라그랑지안을 쓰면

$$ \mathcal L(A,\gamma)=\sum_{i,j}n_{ij}\log A_{ij}+\sum_i\gamma_i\left(\sum_jA_{ij}-1\right). $$

미분 조건은

$$ \frac{\partial\mathcal L}{\partial A_{ij}}=\frac{n_{ij}}{A_{ij}}+\gamma_i=0 $$

이므로

$$ A_{ij}=-\frac{n_{ij}}{\gamma_i}. $$

이를 행합 제약식에 넣으면

$$ 1=\sum_jA_{ij}=-\frac{1}{\gamma_i}\sum_j n_{ij} $$

이라서

$$ \gamma_i=-\sum_jn_{ij}. $$

따라서

$$ \widehat A_{ij}=\frac{n_{ij}}{\sum_kn_{ik}}. $$

이 값은 행합 1과 비음수 조건을 만족한다. 각 행의 로그우도는 확률단체 위의 엄격오목함수이므로 이 해는 유일한 전역최대점이다. ∎

정의 12.4 연속시간 체류시간과 점프횟수

정의 12.4

연속시간 regime 과정 \((Z_t)\)에 대해 \((U_i)\)를 상태 \((i)\)에 머문 총시간, \((n_{ij})\)를 \((i\to j)\) 점프횟수라 하자.

정리 12.2

연속시간 마르코프 연쇄의 생성자 \((G)\)에서 off-diagonal 원소에 대한 최대우도추정량은

$$ \widehat G_{ij}=\frac{n_{ij}}{U_i},\qquad i\neq j, $$

그리고 대각원소는

$$ \widehat G_{ii}=-\sum_{j\neq i}\widehat G_{ij} $$

이다.

증명

상태 \((i)\)에 있을 때 다음 점프까지의 대기시간은 매개변수 \((\Lambda_i:=\sum_{j\neq i}G_{ij})\)의 지수분포를 가진다. 또한 한 번 점프가 일어났을 때 \((j\neq i)\)로 갈 조건부분포는

$$ \mathbb P(i\to j\mid \text{jump from }i)=\frac{G_{ij}}{\Lambda_i}. $$

따라서 상태 \((i)\)에서 관측된 모든 체류시간과 점프방향을 합친 우도는 상수항을 제외하면

$$ L_i(G)=\exp(-\Lambda_i U_i)\prod_{j\neq i}G_{ij}^{n_{ij}}. $$

로그우도는

$$ \ell_i(G)=\sum_{j\neq i}n_{ij}\log G_{ij}-U_i\sum_{j\neq i}G_{ij}. $$

각 \((G_{ij})\)에 대해 편미분하면

$$ \frac{\partial\ell_i}{\partial G_{ij}}=\frac{n_{ij}}{G_{ij}}-U_i. $$

이를 0으로 두면 곧바로

$$ \widehat G_{ij}=\frac{n_{ij}}{U_i} $$

를 얻는다. 둘째 편미분은 \(( -n_{ij}/G_{ij}^2<0 )\)이므로 최대점이다. 대각성분은 생성자의 행합이 0이어야 하므로

$$ \widehat G_{ii}=-\sum_{j\neq i}\widehat G_{ij} $$

로 정해진다. ∎

정의 12.5 상태의존 시장가주문 도착강도

정의 12.5

상태 \((i)\)에서 buy MO와 sell MO의 도착강도를 각각 \((\lambda_i^+)\), \((\lambda_i^-)\)로 두자. 상태 \((i)\)에 머무는 총시간 동안 buy MO 발생 횟수를 \((M_i^+)\), sell MO 발생 횟수를 \((M_i^-)\)라 하자.

정리 12.3

위 모형에서 최대우도추정량은

$$ \widehat\lambda_i^+=\frac{M_i^+}{U_i}, \qquad \widehat\lambda_i^- =\frac{M_i^-}{U_i} $$

이다.

증명

상태 \((i)\)에서 buy MO 도착은 강도 \((\lambda_i^+)\)의 포아송 과정이고, 총 노출시간은 \((U_i)\)다. 따라서 \((M_i^+)\)의 분포는

$$ \mathbb P(M_i^+=m)=e^{-\lambda_i^+U_i}\frac{(\lambda_i^+U_i)^m}{m!} $$

다. 로그우도는

$$ \ell_i^+(\lambda_i^+)=M_i^+\log\lambda_i^+-\lambda_i^+U_i+\text{const} $$

이므로 일차조건은

$$ \frac{M_i^+}{\lambda_i^+}-U_i=0. $$

따라서 \((\widehat\lambda_i^+=M_i^+/U_i)\)다. sell MO의 경우도 똑같다. ∎

정의 12.6 조건부 가격점프 분포

정의 12.6

regime \((i)\)에서 buy 또는 sell MO가 도착했을 때 발생한 가격변화를 \((\Delta S)\)라 하자. Chapter 12의 표 12.1은 \((i)\)와 MO 방향을 조건으로 한 \((\Delta S)\)의 이산분포를 기록한다.

정리 12.4

regime \((i)\)와 주문방향 \((\pm)\)이 주어졌을 때 관측된 가격점프가 이산값 \((d_1,\dots,d_m)\) 중 하나를 취한다고 하자. 각 값의 발생횟수를 \((c_{i,k}^{\pm})\), 총횟수를 \((C_i^{\pm}=\sum_k c_{i,k}^{\pm})\)라 하면 조건부확률의 MLE는

$$ \widehat p_{i,k}^{\pm}=\frac{c_{i,k}^{\pm}}{C_i^{\pm}} $$

이다.

증명

이는 다항분포의 표준 MLE 문제다. 우도는

$$ L(p)=\prod_{k=1}^{m}(p_{i,k}^{\pm})^{c_{i,k}^{\pm}}, \qquad \sum_{k=1}^{m}p_{i,k}^{\pm}=1. $$

로그우도는

$$ \ell(p)=\sum_{k=1}^{m}c_{i,k}^{\pm}\log p_{i,k}^{\pm}. $$

라그랑주 승수 \((\eta)\)를 써서

$$ \mathcal L(p,\eta)=\sum_k c_{i,k}^{\pm}\log p_{i,k}^{\pm}+\eta\left(\sum_k p_{i,k}^{\pm}-1\right) $$

를 만들고 미분하면

$$ \frac{c_{i,k}^{\pm}}{p_{i,k}^{\pm}}+\eta=0 \quad\Rightarrow\quad p_{i,k}^{\pm}=-\frac{c_{i,k}^{\pm}}{\eta}. $$

합제약에 넣으면

$$ 1=\sum_k p_{i,k}^{\pm}=-\frac{1}{\eta}\sum_k c_{i,k}^{\pm} =-\frac{C_i^{\pm}}{\eta}, $$

이므로 \((\eta=-C_i^{\pm})\), 따라서

$$ \widehat p_{i,k}^{\pm}=\frac{c_{i,k}^{\pm}}{C_i^{\pm}}. $$

정의 12.7 주문불균형이 있는 청산문제의 상태

정의 12.7

청산문제의 상태를 현금 \((X_t)\), 중간가격 \((S_t)\), 재고 \((Q_t)\), imbalance regime \((Z_t)\)로 둔다. 지정가주문 깊이를 \((\delta_t\ge 0)\)라 하고, fill counting process의 강도를 \((\Lambda^+(Z_t,\delta_t))\)라 하자. terminal wealth는 남은 재고를 페널티 \((\alpha Q_T^2)\)와 함께 청산한 값으로 둔다.

정리 12.5

가치함수

$$ H(t,x,s,q,z)=\sup_{\delta}\mathbb E_{t,x,s,q,z}\left[X_T+Q_T(S_T-\alpha Q_T)-\phi\int_t^TQ_u^2du\right] $$

는 형식적으로 다음 DPE를 만족한다.

$$ 0=\partial_tH+\mu(z)\partial_sH-\phi q^2 +\sup_{\delta\ge 0}\Lambda^+(z,\delta)\Big(H(t,x+s+\delta,s,q-1,z)-H(t,x,s,q,z)\Big) +\sum_k G_{zk}\Big(H(t,x,s,q,k)-H(t,x,s,q,z)\Big) $$

terminal condition은

$$ H(T,x,s,q,z)=x+q(s-\alpha q) $$

이다.

증명

짧은 구간 \((h)\) 동안 제어를 상수 \((\delta)\)로 고정한다. 동적계획원리에 의해

$$ H(t,x,s,q,z)=\sup_{\delta\ge 0}\mathbb E\left[ -\phi q^2 h + H(t+h,X_{t+h},S_{t+h},Q_{t+h},Z_{t+h})\right]+o(h). $$

이제 사건을 세 종류로 분해한다.

  1. fill도 regime 전환도 일어나지 않는 경우: 확률은 \((1-\Lambda^+(z,\delta)h+G_{zz}h+o(h))\)이고, 가격의 drift 항 때문에 가치 증가는 \((\partial_tH+\mu(z)\partial_sH)h\)다.
  2. 한 번의 fill이 일어나는 경우: 확률은 \((\Lambda^+(z,\delta)h+o(h))\)이고, 상태변화는 \((x,q)\mapsto(x+s+\delta,q-1)\)다.
  3. regime이 \((z\to k)\)로 바뀌는 경우: 확률은 \((G_{zk}h+o(h))\), 가치변화는 \((H(t,x,s,q,k)-H(t,x,s,q,z))\)다.

두 번 이상 사건이 동시에 일어날 확률은 \((o(h))\)이므로 1차항에서는 사라진다. 따라서 1차항을 모두 모으면

$$ 0= -\phi q^2 + \partial_tH+\mu(z)\partial_sH +\sup_{\delta\ge 0}\Lambda^+(z,\delta)\Big(H(t,x+s+\delta,s,q-1,z)-H(t,x,s,q,z)\Big) +\sum_kG_{zk}\Big(H(t,x,s,q,k)-H(t,x,s,q,z)\Big). $$

여기서 \((h)\)로 나눈 뒤 \((h\downarrow 0)\)를 취하면 원하는 식을 얻는다. ∎

정리 12.6

ansatz

$$ H(t,x,s,q,z)=x+qs+h(t,q,z) $$

를 대입하면 \((h)\)는

$$ 0=\partial_th(t,q,z)-\phi q^2+q\mu(z)+\sum_kG_{zk}\big(h(t,q,k)-h(t,q,z)\big) +\sup_{\delta\ge 0}\Lambda^+(z,\delta)\big(\delta+h(t,q-1,z)-h(t,q,z)\big) $$

를 만족하고 terminal condition은

$$ h(T,q,z)=-\alpha q^2 $$

이다.

증명

먼저 도함수들을 계산한다.

$$ \partial_tH=\partial_th, \qquad \partial_sH=q. $$

fill 이후 상태에서의 가치함수는

$$ H(t,x+s+\delta,s,q-1,z) =(x+s+\delta)+(q-1)s+h(t,q-1,z) =x+qs+\delta+h(t,q-1,z). $$

따라서 fill 점프항은

$$ H(t,x+s+\delta,s,q-1,z)-H(t,x,s,q,z) =\delta+h(t,q-1,z)-h(t,q,z). $$

regime 전이항은 \((x,s,q)\)가 그대로이므로

$$ H(t,x,s,q,k)-H(t,x,s,q,z)=h(t,q,k)-h(t,q,z). $$

이를 정리 12.5의 DPE에 대입하면 정확히 원하는 식을 얻는다. terminal condition도

$$ H(T,x,s,q,z)=x+q(s-\alpha q)=x+qs-\alpha q^2 $$

이므로 \((h(T,q,z)=-\alpha q^2)\)다. ∎

정리 12.7

체결강도가

$$ \Lambda^+(z,\delta)=A^+(z)e^{-\kappa(z)\delta} $$

꼴이면 unconstrained 최적깊이 \((\widetilde\delta^*)\)는

$$ \widetilde\delta^*(t,q,z)=\frac{1}{\kappa(z)}-\big(h(t,q-1,z)-h(t,q,z)\big) $$

이고 제약 \((\delta\ge 0)\)를 고려한 최적해는

$$ \delta^*(t,q,z)=\max\left\{\frac{1}{\kappa(z)}-\big(h(t,q-1,z)-h(t,q,z)\big),0\right\} $$

이다.

증명

고정된 \((t,q,z)\)에서 최적화해야 하는 함수는

$$ F(\delta)=A^+(z)e^{-\kappa(z)\delta}\big(\delta+\Delta h(t,q,z)\big), \qquad \Delta h(t,q,z):=h(t,q-1,z)-h(t,q,z). $$

이를 미분하면

$$ F'(\delta)=A^+(z)e^{-\kappa(z)\delta}\Big(1-\kappa(z)(\delta+\Delta h)\Big). $$

지수항과 \((A^+(z))\)는 양수이므로 일차조건은

$$ 1-\kappa(z)(\delta+\Delta h)=0. $$

$$ \widetilde\delta^*=\frac{1}{\kappa(z)}-\Delta h. $$

둘째 미분은

$$ F''(\delta)=A^+(z)e^{-\kappa(z)\delta}\big(-\kappa(z)(2-\kappa(z)(\delta+\Delta h))\big). $$

특히 일차조건이 성립하는 점에서는

$$ F''(\widetilde\delta^*)=-\kappa(z)A^+(z)e^{-\kappa(z)\widetilde\delta^*}<0 $$

이므로 최대점이다. 다만 실제 허용집합은 \((\delta\ge 0)\)이므로 unconstrained 최대점이 음수이면 경계점 0이 최적이다. 따라서 최종 최적해는 \((\delta^*=\max\{\widetilde\delta^*,0\})\)다. ∎

정리 12.8

재고위험 패널티 \((\phi)\) 또는 terminal penalty \((\alpha)\)가 커질수록 최적깊이는 감소하는 방향으로 움직인다.

증명

정리 12.7에 의해 최적깊이는 \((\Delta h=h(t,q-1,z)-h(t,q,z))\)의 함수다. 패널티가 커지면 큰 재고 \((q)\)를 유지하는 continuation value가 더 나빠져 \((h(t,q,z))\)가 \((q)\)에 대해 더 가파르게 감소한다. 따라서 \((\Delta h)\)는 증가한다. 이제

$$ \delta^*=\max\left\{\frac{1}{\kappa(z)}-\Delta h,0\right\} $$

를 보면 \((\Delta h)\)가 증가할수록 괄호 안 값은 작아진다. 따라서 unconstrained 최적해는 감소하고, 제약을 고려한 최적해도 증가할 수는 없다. 결국 패널티가 클수록 에이전트는 더 얕은 가격, 즉 더 공격적인 quote를 내어 청산을 서두르게 된다. ∎