Algorithmic and High-Frequency Trading — Chapter 9 — Targeting Volume

Algorithmic and High-Frequency Trading — Chapter 9
Targeting Volume

Part A — 선수지식

1. 확률공간, σ-대수, 필트레이션

1.1 정의

확률공간은

\[(\Omega,\mathcal F,\mathbb P)\]

이다. 여기서

\(\Omega\): 가능한 세계의 집합
\(\mathcal F\): 사건(event)의 집합, σ-대수
\(\mathbb P\): 확률측도

필트레이션은

\[\mathcal F_s \subseteq \mathcal F_t \subseteq \mathcal F, \qquad s \le t,\]

을 만족하는 증가하는 σ-대수들의 모음이다. 이는 “시간이 지날수록 정보가 늘어난다”는 뜻이다.

1.2 AHFT 9장과의 연결

AHFT 9장에서는

내 거래속도 \(\nu_t\)가 현재까지의 정보에만 의존해야 하고,
volume rate \(\mu_t\) 또는 cumulative volume \(V_t\)가 상태변수로 들어가며,
probabilistic representation은 조건부기댓값 \(\mathbb E[\cdot\mid \mathcal F_t]\) 형태로 나타난다.

따라서 admissible control은 필트레이션에 대해 적응(adapted)되어야 한다.

1.3 적응성의 정의

과정 \((Y_t)\)가 \((\mathcal F_t)\)-적응이라는 것은

\[Y_t \text{ is } \mathcal F_t\text{-measurable for every } t.\]

즉 시각 \(t\)의 값은 시각 \(t\)까지의 정보로 알 수 있다는 뜻이다.

제어 \(\nu_t\)가 적응이 아니면 미래 정보를 미리 보고 거래하는 꼴이 되므로 문제 자체가 무너진다.

2. 조건부기댓값

2.1 정의

적분가능한 확률변수 \(X \in L^1\)와 부분 σ-대수 \(\mathcal G \subseteq \mathcal F\)가 주어졌다고 하자. 조건부기댓값 \(\mathbb E[X\mid \mathcal G]\)는 다음 두 조건을 만족하는 \(\mathcal G\)-가측 확률변수 \(Y\)이다.

\(Y\)는 \(\mathcal G\)-measurable,
모든 \(A \in \mathcal G\)에 대해 \[ \int_A Y \, d\mathbb P = \int_A X \, d\mathbb P. \]

2.2 존재성과 구성

\(\mathcal G\) 위에 새로운 signed measure \(\nu\)를

\[\nu(A) = \int_A X \, d\mathbb P, \qquad A \in \mathcal G\]

로 정의하자. 그러면 \(X\in L^1\)이므로 \(\nu\)는 유한 signed measure이다. 또한 \(\mathbb P|_{\mathcal G}(A)=0\)이면 당연히 \(\nu(A)=0\)이므로

\[\nu \ll \mathbb P|_{\mathcal G}.\]

따라서 Radon–Nikodym theorem에 의해 어떤 \(\mathcal G\)-가측 함수 \(Y\)가 존재하여

\[\nu(A) = \int_A Y \, d\mathbb P, \qquad \forall A\in\mathcal G.\]

이 \(Y\)를 \(\mathbb E[X\mid \mathcal G]\)라 부른다.

2.2.1 존재성 정리

정리 6.1 \(X\in L^1(\Omega,\mathcal F,\mathbb P)\), \(\mathcal G\subseteq \mathcal F\)이면 \(\mathbb E[X\mid \mathcal G]\)가 존재한다.

증명

조건부기댓값의 정의를 다시 적어 보자. 우리가 찾고 싶은 것은 다음 두 조건을 동시에 만족하는 함수 \(Y\)이다.

\(Y\)는 \(\mathcal G\)-가측이다.
모든 \(A\in\mathcal G\)에 대해 \[ \int_A Y\,d\mathbb P = \int_A X\,d\mathbb P. \]

즉 \(\mathcal G\)가 허용하는 사건들에 대해서는 \(Y\)가 \(X\)와 정확히 같은 적분값을 가져야 한다. 이 조건을 만족하는 \(Y\)의 존재를 보이기 위해, 먼저 \(\mathcal G\) 위에 signed measure를 하나 정의한다.

\[\nu(A):=\int_A X\,d\mathbb P, \qquad A\in\mathcal G.\]

이제 해야 할 일은 세 단계다.

\(\nu\)가 정말 \(\mathcal G\) 위의 signed measure인지 확인한다.
\(\nu\)가 \(\mathbb P|_{\mathcal G}\)에 대해 절대연속임을 보인다.
Radon--Nikodym 정리를 적용하여 밀도함수 \(Y\)를 얻는다.

먼저 가산가법성을 확인하자. 서로소인 집합열 \((A_n)_{n\ge1}\subset\mathcal G\)를 잡으면

\[\nu\Big(\bigcup_{n=1}^\infty A_n\Big) =\int_{\cup_{n\ge1}A_n} X\,d\mathbb P.\]

서로소이므로 지시함수는

\[1_{\cup_{n\ge1}A_n}=\sum_{n=1}^\infty 1_{A_n}\]

가 점별로 성립한다. 따라서

\[\int_{\cup_{n\ge1}A_n} X\,d\mathbb P =\int \Big(\sum_{n=1}^\infty 1_{A_n}\Big)X\,d\mathbb P.\]

여기서 \(X\)가 부호를 가질 수 있으므로 \(X=X^+-X^-\)로 분해한다. \(X\in L^1\)이므로 \(X^+,X^-\)는 각각 적분가능하고, 따라서 적분의 가산가법성을 각 부분에 적용할 수 있다. 그 결과

\[\int \Big(\sum_{n=1}^\infty 1_{A_n}\Big)X\,d\mathbb P =\sum_{n=1}^\infty \int_{A_n}X\,d\mathbb P =\sum_{n=1}^\infty \nu(A_n).\]

즉 \(\nu\)는 countably additive이다.

다음으로 유한성을 보자. 임의의 \(A\in\mathcal G\)에 대해

\[|\nu(A)|=\Big|\int_A X\,d\mathbb P\Big| \le \int_A |X|\,d\mathbb P \le \int_\Omega |X|\,d\mathbb P < \infty.\]

따라서 \(\nu\)는 유한 signed measure이다.

이제 절대연속성을 확인하자. \(A\in\mathcal G\)가 \(\mathbb P(A)=0\)를 만족하면

\[|\nu(A)| =\Big|\int_A X\,d\mathbb P\Big| \le \int_A |X|\,d\mathbb P =0.\]

즉

\[\nu\ll \mathbb P|_{\mathcal G}.\]

그러므로 Radon--Nikodym 정리에 의해 어떤 \(\mathcal G\)-가측 함수 \(Y\)가 존재하여

\[\nu(A)=\int_A Y\,d\mathbb P, \qquad \forall A\in\mathcal G\]

가 성립한다. 그런데 \(\nu(A)\)의 정의가 이미

\[\nu(A)=\int_A X\,d\mathbb P\]

였으므로, 결국

\[\int_A Y\,d\mathbb P = \int_A X\,d\mathbb P, \qquad \forall A\in\mathcal G.\]

이다. 또한 \(Y\)는 construction에 의해 \(\mathcal G\)-가측이다. 따라서 \(Y\)는 바로 \(X\)의 \(\mathcal G\)-조건부기댓값의 정의를 만족한다.

\[Y = \mathbb E[X\mid\mathcal G].\]

즉 조건부기댓값의 존재는 “사건 \(A\in\mathcal G\)마다 \(\int_A Xd\mathbb P\)라는 값을 주는 적분 기능을, \(\mathcal G\)-가측 함수의 적분으로 표현할 수 있는가?”라는 질문이고, Radon--Nikodym 정리가 그 질문에 정확히 답을 준다. □

2.3 유일성

정리 6.2 조건부기댓값은 almost surely 유일하다.

증명

\(Y_1,Y_2\)가 모두 \(X\)의 \(\mathcal G\)-조건부기댓값이라고 하자. 그러면 정의에 의해

\(Y_1,Y_2\)는 둘 다 \(\mathcal G\)-가측이고,
모든 \(A\in\mathcal G\)에 대해 \[ \int_A Y_1\,d\mathbb P = \int_A X\,d\mathbb P = \int_A Y_2\,d\mathbb P \] 이다.

따라서 모든 \(A\in\mathcal G\)에 대해

\[\int_A (Y_1-Y_2)\,d\mathbb P = 0\]

가 성립한다. 이제 차이를

\[D:=Y_1-Y_2\]

라고 두자. \(Y_1,Y_2\)가 \(\mathcal G\)-가측이므로 \(D\)도 \(\mathcal G\)-가측이다. 우리가 보여야 할 것은 \(D=0\) almost surely라는 사실이다.

먼저

\[A_+ := \{\omega : D(\omega)>0\}\]

를 잡자. \(D\)가 \(\mathcal G\)-가측이므로 \(A_+\in\mathcal G\)이다. 위 적분식에 \(A=A_+\)를 대입하면

\[\int_{A_+} D\,d\mathbb P = 0.\]

그런데 \(A_+\) 위에서는 \(D>0\)이므로 적분함수 \(D1_{A_+}\)는 음이 아닌 함수이다. 음이 아닌 적분가능 함수의 적분이 0이면 그 함수는 거의확실히 0이어야 하므로

\[D1_{A_+}=0 \quad\text{a.s.}\]

이다. 따라서

\[\mathbb P(A_+)=\mathbb P(Y_1>Y_2)=0.\]

같은 논리로

\[A_- := \{\omega : D(\omega)<0\} = \{Y_1<Y_2\}\]

를 잡으면 역시 \(A_-\in\mathcal G\)이고,

\[\int_{A_-} D\,d\mathbb P = 0.\]

이때는 \(A_-\) 위에서 \(D<0\)이므로 부호를 바꿔

\[\int_{A_-} (-D)\,d\mathbb P = 0\]

로 쓰면 \((-D)1_{A_-}\ge 0\)이다. 따라서

\[\mathbb P(A_-)=\mathbb P(Y_1<Y_2)=0.\]

이제

\[\{Y_1\neq Y_2\}=\{Y_1>Y_2\}\cup\{Y_1<Y_2\}\]

이므로

\[\mathbb P(Y_1\neq Y_2) \le \mathbb P(Y_1>Y_2)+\mathbb P(Y_1<Y_2)=0.\]

따라서

\[Y_1=Y_2 \qquad \text{a.s.}\]

이다. 즉 조건부기댓값은 대표함수 수준에서는 여러 개처럼 보일 수 있지만, 확률론에서 의미 있는 수준인 almost sure equality에서는 하나로 정해진다. □

2.4 Tower property

정리 6.3 \(\mathcal H \subseteq \mathcal G \subseteq \mathcal F\), \(X\in L^1\)이면

\[\mathbb E[\mathbb E[X\mid\mathcal G]\mid\mathcal H] = \mathbb E[X\mid\mathcal H].\]

증명

이 정리는 조건부기댓값을 두 번 취했을 때 더 거친 정보 수준 \(\mathcal H\)만 남는다는 사실이다. 정의를 직접 확인하는 방식으로 보자.

먼저

\[Y:=\mathbb E[X\mid\mathcal G]\]

라고 두자. 그러면 정의에 의해

\(Y\)는 \(\mathcal G\)-가측이고,
모든 \(B\in\mathcal G\)에 대해 \[ \int_B Y\,d\mathbb P = \int_B X\,d\mathbb P \] 이다.

이제 \(\mathbb E[Y\mid\mathcal H]\)가 \(X\)의 \(\mathcal H\)-조건부기댓값임을 보이면 충분하다. 첫째, \(\mathbb E[Y\mid\mathcal H]\)는 정의상 \(\mathcal H\)-가측이다. 둘째, 임의의 \(A\in\mathcal H\)를 잡자. \(\mathcal H\subseteq\mathcal G\)이므로 \(A\in\mathcal G\)이기도 하다. 따라서

\[\int_A Y\,d\mathbb P = \int_A X\,d\mathbb P.\]

한편 \(\mathbb E[Y\mid\mathcal H]\)는 \(Y\)의 \(\mathcal H\)-조건부기댓값이므로

\[\int_A \mathbb E[Y\mid\mathcal H] \,d\mathbb P = \int_A Y\,d\mathbb P, \qquad \forall A\in\mathcal H.\]

두 식을 결합하면

\[\int_A \mathbb E[Y\mid\mathcal H] \,d\mathbb P = \int_A X\,d\mathbb P, \qquad \forall A\in\mathcal H.\]

즉 \(\mathbb E[Y\mid\mathcal H]\)는 \(X\)의 \(\mathcal H\)-조건부기댓값의 defining property를 만족한다. 유일성 정리에 의해

\[\mathbb E[Y\mid\mathcal H]=\mathbb E[X\mid\mathcal H]\qquad\text{a.s.}\]

이다. 다시 \(Y=\mathbb E[X\mid\mathcal G]\)를 넣으면

\[\mathbb E[\mathbb E[X\mid\mathcal G]\mid\mathcal H]=\mathbb E[X\mid\mathcal H].\]

이 정리는 이후 DPP, Markov property, Feynman--Kac 표현에서 반복해서 등장한다. 미래를 한 번 \(\mathcal G\) 수준으로 압축한 뒤 다시 \(\mathcal H\) 수준으로 압축해도, 처음부터 \(\mathcal H\) 수준만 남기는 것과 같다는 뜻이다. □

2.5 Pull-out property

\(Z\)가 bounded \(\mathcal G\)-measurable이면

\[\mathbb E[ZX\mid \mathcal G]=Z\,\mathbb E[X\mid\mathcal G].\]

증명

이 성질은 “\(\mathcal G\) 수준에서 이미 알고 있는 정보는 조건부기댓값 밖으로 뺄 수 있다”는 문장이다. 결론을 미리 쓰지 않고 정의에서부터 보이자.

우선

\[Y := Z\,\mathbb E[X\mid\mathcal G]\]

라고 두자. \(Y\)가 \(ZX\)의 \(\mathcal G\)-조건부기댓값임을 보이면 충분하다. 그러려면

\(Y\)가 \(\mathcal G\)-가측이고,
모든 \(A\in\mathcal G\)에 대해 \[ \int_A Y\,d\mathbb P = \int_A ZX\,d\mathbb P \] 가 성립하면 된다.

첫째는 자명하다. \(Z\)도 \(\mathcal G\)-가측이고 \(\mathbb E[X\mid\mathcal G]\)도 \(\mathcal G\)-가측이므로 곱도 \(\mathcal G\)-가측이다.

둘째를 위해 먼저 \(Z\)가 bounded simple function인 경우를 보자.

\[Z = \sum_{i=1}^n z_i1_{B_i}, \qquad B_i\in\mathcal G, \qquad z_i\in\mathbb R.\]

임의의 \(A\in\mathcal G\)에 대해

\[\int_A Y\,d\mathbb P = \int_A Z\,\mathbb E[X\mid\mathcal G] \,d\mathbb P = \sum_{i=1}^n z_i \int_{A\cap B_i} \mathbb E[X\mid\mathcal G] \,d\mathbb P.\]

각 \(A\cap B_i\)도 \(\mathcal G\)-가측이므로 defining property를 적용하면

\[\int_{A\cap B_i} \mathbb E[X\mid\mathcal G] \,d\mathbb P = \int_{A\cap B_i} X\,d\mathbb P.\]

따라서

\[\int_A Y\,d\mathbb P = \sum_{i=1}^n z_i \int_{A\cap B_i} X\,d\mathbb P = \int_A ZX\,d\mathbb P.\]

즉 simple case에서는 성립한다.

이제 일반 bounded \(\mathcal G\)-가측 함수 \(Z\)로 확장하자. 표준 근사정리에 의해 \(\mathcal G\)-가측 simple function들의 열 \((Z_n)\)를 잡아

\[Z_n\to Z \quad\text{a.s.}, \qquad |Z_n|\le \|Z\|_\infty\]

가 되게 할 수 있다. simple case에서 이미

\[\mathbb E[Z_nX\mid\mathcal G] = Z_n\mathbb E[X\mid\mathcal G]\]

를 알고 있다. 임의의 \(A\in\mathcal G\)에 대해

\[\int_A Z_n\mathbb E[X\mid\mathcal G] \,d\mathbb P = \int_A Z_nX\,d\mathbb P\]

가 성립한다. 좌변에서는

\[|Z_n\mathbb E[X\mid\mathcal G]| \le \|Z\|_\infty |\mathbb E[X\mid\mathcal G]|\]

이고 \(\mathbb E[X\mid\mathcal G]\in L^1\)이므로 우세수렴정리를 쓸 수 있다. 우변에서도

\[|Z_nX|\le \|Z\|_\infty |X|,\]

이며 \(|X|\in L^1\)이므로 역시 우세수렴정리를 적용할 수 있다. 따라서 \(n\to\infty\)를 보내면

\[\int_A Z\mathbb E[X\mid\mathcal G] \,d\mathbb P = \int_A ZX\,d\mathbb P, \qquad \forall A\in\mathcal G.\]

이미 \(Z\mathbb E[X\mid\mathcal G]\)의 \(\mathcal G\)-가측성을 확인했으므로, 정의에 의해

\[\mathbb E[ZX\mid\mathcal G]=Z\mathbb E[X\mid\mathcal G] \qquad\text{a.s.}\]

이다. AHFT 9장에서 이 정리는 조건부기댓값 안에 들어 있는 현재 상태 기반 계수들을 정리할 때 매우 자주 사용된다. □

2.6 AHFT 9장과의 연결

probabilistic representation은 본질적으로 어떤 선형 PDE/PIDE 해를 조건부기댓값으로 쓰는 일이다.
state augmentation을 한 뒤 value function 안의 보조함수 \(h_1,h_2\)를 기대값 표현으로 적는 논리도 여기에 선다.
"현재 상태만 알면 충분하다"는 Markov성도 결국 조건부기댓값을 축약하는 진술이다.

3. 마팅게일

3.1 정의

적분가능한 적응과정 \((M_t)\)가 \((\mathcal F_t)\)-martingale이라는 것은

\(M_t \in L^1\),
\(M_t\) adapted,
\(s\le t\)이면 \[ \mathbb E[M_t\mid \mathcal F_s]=M_s. \]

3.2 핵심 예시

Brownian motion \(W_t\)
compensated Poisson process \(N_t-\lambda t\)
Itô integral \(\int_0^t \phi_s dW_s\) (적절한 적분가능성 하)

3.3 compensated Poisson martingale의 증명

\(N_t\)가 rate \(\lambda\) Poisson process라 하자. 그러면

\[M_t := N_t - \lambda t\]

가 martingale임을 보이자.

증명

마팅게일임을 보이려면 세 가지를 확인해야 한다.

\(M_t\in L^1\)일 것,
\(M_t\)가 \(\mathcal F_t\)-적응적일 것,
\(s\le t\)에 대해 \(\mathbb E[M_t\mid\mathcal F_s]=M_s\)일 것.

적응성은 자명하다. \(N_t\)는 counting process이므로 \(\mathcal F_t\)-가측이고, \(\lambda t\)는 결정론적이므로 \(M_t\)도 \(\mathcal F_t\)-가측이다. 적분가능성 역시

\[\mathbb E[|M_t|]\le \mathbb E[N_t]+\lambda t = 2\lambda t < \infty\]

이므로 성립한다.

이제 핵심인 martingale property를 보자. 시간 \(0\le s\le t\)를 고정한다. Poisson process의 가장 중요한 성질은 독립증분성이다. 즉

\[N_t - N_s\]

는 \(\mathcal F_s\)와 독립이며, 분포는 \(\mathrm{Poisson}(\lambda(t-s))\)이다. 따라서 평균은

\[\mathbb E[N_t-N_s] = \lambda(t-s)\]

이다.

이제

\[N_t = N_s + (N_t-N_s)\]

를 이용해 조건부기댓값을 계산하자.

\[\mathbb E[M_t\mid\mathcal F_s] = \mathbb E[N_t-\lambda t\mid\mathcal F_s] = \mathbb E[N_s+(N_t-N_s)-\lambda t\mid\mathcal F_s].\]

조건부기댓값의 선형성을 쓰면

\[\mathbb E[M_t\mid\mathcal F_s] = \mathbb E[N_s\mid\mathcal F_s] + \mathbb E[N_t-N_s\mid\mathcal F_s] - \lambda t.\]

여기서 첫 항은 \(N_s\)가 \(\mathcal F_s\)-가측이므로 그냥 \(N_s\)이고, 둘째 항은 독립성 때문에 ordinary expectation으로 내려온다.

\[\mathbb E[N_t-N_s\mid\mathcal F_s] = \mathbb E[N_t-N_s] = \lambda(t-s).\]

따라서

\[\mathbb E[M_t\mid\mathcal F_s] = N_s + \lambda(t-s)-\lambda t = N_s-\lambda s = M_s.\]

즉 \((M_t)_{t\ge0}\)는 martingale이다.

이 결과의 해석은 분명하다. \(N_t\) 자체는 평균적으로 시간당 \(\lambda\)만큼 증가하는 과정을 포함하므로 마팅게일이 아니다. 그 predictable한 평균성장분 \(\lambda t\)를 빼 주면, 남는 것은 순수한 fluctuation part이고, 그 fluctuation part가 바로 compensated Poisson martingale \(N_t-\lambda t\)이다. AHFT에서 jump volume을 다룰 때 이 분해가 기본 도구가 된다. □

3.4 AHFT 9장과의 연결

AHFT 9.3.1의 cumulative volume을 compound Poisson으로 모델링하면, 그 점프누적과정은 보상된(compensated) 형태에서 martingale decomposition을 갖는다. jump DPE와 Dynkin formula, expectation representation에 이 구조가 들어간다.

4. Brownian motion

표준 Brownian motion \((W_t)\)는 다음을 만족한다.

\(W_0=0\) a.s.
독립증분
\(W_t-W_s \sim N(0,t-s)\)
경로연속성

AHFT 9장에서는 주로 mean-reverting stochastic trading rate를 diffusion으로 둘 때 Brownian motion이 들어간다.

예:

\[d\mu_t = \kappa(\bar\mu-\mu_t)dt + \eta dW_t.\]

이는 Ornstein–Uhlenbeck형 mean reversion이다.

5. Itô 적분과 Itô isometry

5.1 단순 적분과 확장

먼저 단순 적응과정

\[\phi_t = \sum_{i=0}^{n-1} \xi_i 1_{(t_i,t_{i+1}]}(t), \qquad \xi_i \in \mathcal F_{t_i}\]

에 대해

\[\int_0^T \phi_t dW_t := \sum_{i=0}^{n-1} \xi_i (W_{t_{i+1}}-W_{t_i}).\]

이제 \(L^2\)-완비화를 통해 일반 제곱적분가능 적응과정으로 확장한다.

5.2 Itô isometry

정리 9.1 단순 적응과정 \(\phi\)에 대해

\[\mathbb E\Big[\Big(\int_0^T \phi_t dW_t\Big)^2\Big] = \mathbb E\Big[\int_0^T \phi_t^2 dt\Big].\]

증명

Itô isometry는 stochastic integral의 \(L^2\)-구조를 보여 주는 핵심 정리다. 이 정리 덕분에 단순과정에서 정의한 Itô 적분을 일반적인 제곱적분가능 적응과정으로 연속적으로 확장할 수 있다.

단순 적응과정

\[\phi_t = \sum_{i=0}^{n-1} \xi_i 1_{(t_i,t_{i+1}]}(t), \qquad \xi_i\in\mathcal F_{t_i}\]

를 잡고,

\[\Delta W_i := W_{t_{i+1}}-W_{t_i}\]

라고 쓰자. 그러면 정의에 의해

\[I:=\int_0^T \phi_t\,dW_t = \sum_{i=0}^{n-1} \xi_i\Delta W_i.\]

이제 \(I^2\)를 전개하면

\[I^2 = \sum_i \xi_i^2(\Delta W_i)^2 + 2\sum_{i<j}\xi_i\xi_j\Delta W_i\Delta W_j.\]

기댓값을 취하면

\[\mathbb E[I^2] = \sum_i \mathbb E\big[\xi_i^2(\Delta W_i)^2\big] +2\sum_{i<j}\mathbb E\big[\xi_i\xi_j\Delta W_i\Delta W_j\big].\]

따라서 교차항과 대각항을 각각 계산하면 된다.

5.2.1 교차항이 사라지는 이유

\(i<j\)를 고정하자. 그러면 \(\xi_i\), \(\xi_j\), \(\Delta W_i\)는 모두 시각 \(t_j\) 이전 정보에 의해 결정되므로 \(\mathcal F_{t_j}\)-가측이다. 따라서 tower property를 쓰면

\[\mathbb E[\xi_i\xi_j\Delta W_i\Delta W_j] = \mathbb E\Big[\mathbb E\big[\xi_i\xi_j\Delta W_i\Delta W_j\mid\mathcal F_{t_j}\big]\Big].\]

안쪽 조건부기댓값에서 \(\xi_i\xi_j\Delta W_i\)는 \(\mathcal F_{t_j}\)-가측이므로 밖으로 빼서

\[\mathbb E[\xi_i\xi_j\Delta W_i\Delta W_j] = \mathbb E\Big[\xi_i\xi_j\Delta W_i\,\mathbb E[\Delta W_j\mid\mathcal F_{t_j}]\Big].\]

그런데 Brownian increment \(\Delta W_j\)는 \(\mathcal F_{t_j}\)와 독립이고 평균이 0이므로

\[\mathbb E[\Delta W_j\mid\mathcal F_{t_j}] = 0.\]

따라서

\[\mathbb E[\xi_i\xi_j\Delta W_i\Delta W_j]=0.\]

즉 서로 다른 구간에서 온 stochastic increments는 \(L^2\)에서 서로 직교한다.

5.2.2 대각항 계산

이제 남는 것은

\[\mathbb E[I^2] = \sum_i \mathbb E\big[\xi_i^2(\Delta W_i)^2\big].\]

여기서 \(\xi_i\)와 \(\Delta W_i\)를 단순히 독립이라고 쓰는 대신, 조건부기댓값으로 정확하게 계산하자.

\[\mathbb E\big[\xi_i^2(\Delta W_i)^2\big] = \mathbb E\Big[\mathbb E\big[\xi_i^2(\Delta W_i)^2\mid\mathcal F_{t_i}\big]\Big].\]

\(\xi_i^2\)는 \(\mathcal F_{t_i}\)-가측이므로 pull-out property를 사용하면

\[\mathbb E\big[\xi_i^2(\Delta W_i)^2\big] = \mathbb E\Big[\xi_i^2\,\mathbb E\big[(\Delta W_i)^2\mid\mathcal F_{t_i}\big]\Big].\]

브라운운동의 독립증분성에 의해 \(\Delta W_i\)의 분포는 \(N(0,t_{i+1}-t_i)\)이고, 따라서 그 제곱의 평균은

\[\mathbb E\big[(\Delta W_i)^2\mid\mathcal F_{t_i}\big] = t_{i+1}-t_i.\]

따라서

\[\mathbb E\big[\xi_i^2(\Delta W_i)^2\big] = \mathbb E[\xi_i^2](t_{i+1}-t_i).\]

5.2.3 최종 정리

이제 이를 합치면

\[\mathbb E[I^2] = \sum_{i=0}^{n-1} \mathbb E[\xi_i^2](t_{i+1}-t_i).\]

한편 단순과정의 정의상

\[\int_0^T \phi_t^2dt = \sum_{i=0}^{n-1} \xi_i^2(t_{i+1}-t_i).\]

따라서 기댓값을 취하면

\[\mathbb E\Big[\int_0^T \phi_t^2dt\Big] = \sum_{i=0}^{n-1} \mathbb E[\xi_i^2](t_{i+1}-t_i).\]

결국

\[\mathbb E\Big[\Big(\int_0^T \phi_t dW_t\Big)^2\Big] = \mathbb E\Big[\int_0^T \phi_t^2 dt\Big].\]

이 정리가 보여 주는 것은 stochastic integral이 단순히 기호적인 적분이 아니라, \(L^2\)의 기하구조를 정확히 보존하는 연산이라는 사실이다. AHFT에서 Itô calculus를 generator 형태로 다룰 수 있는 이유도 바로 이 \(L^2\) 구조 덕분이다. □

5.3 AHFT 9장과의 연결

AHFT 9장의 probabilistic representation이나 generator 계산에서 diffusion term을 다루려면 최소한 Itô calculus가 필요하다.

6. Itô 공식

6.1 1차원 버전

\[dX_t = b_t dt + \sigma_t dW_t\]

이고 \(f \in C^{1,2}\)이면

\[df(t,X_t) = \partial_t f(t,X_t)dt + \partial_x f(t,X_t)dX_t + \frac12 \partial_{xx}f(t,X_t)(dX_t)^2.\]

여기서 Itô 계산규칙은

\[(dt)^2=0,\qquad dt\, dW_t =0,\qquad (dW_t)^2 = dt.\]

따라서

\[df(t,X_t) = \Big(\partial_t f + b_t\partial_x f + \frac12 \sigma_t^2 \partial_{xx}f\Big)dt + \sigma_t \partial_x f \, dW_t.\]

6.2 핵심 증명 아이디어

엄밀한 Itô 공식의 증명은 분할, Taylor 전개, 나머지항 제어, quadratic variation의 수렴을 모두 점검해야 한다. 여기서는 그 논리를 압축하지 않고, 왜 \(\tfrac12\sigma^2 f_{xx}\) 항이 살아남는지를 중심으로 단계적으로 보자.

과정

\[dX_t = b_tdt + \sigma_t dW_t\]

를 생각하고, \(f\in C^{1,2}\)라고 하자. 분할

\[0=t_0<t_1<\cdots<t_n=T\]

을 잡고

\[\Delta t_i := t_{i+1}-t_i, \qquad \Delta X_i := X_{t_{i+1}}-X_{t_i}\]

라고 쓰자. 그러면 망원합에 의해

\[f(T,X_T)-f(0,X_0) =\sum_{i=0}^{n-1}\big(f(t_{i+1},X_{t_{i+1}})-f(t_i,X_{t_i})\big)\]

이다.

이제 각 항에 대해 \((t_i,X_{t_i})\) 주변에서 2변수 Taylor 전개를 하면

\[\begin{aligned} f(t_{i+1},X_{t_{i+1}})-f(t_i,X_{t_i}) &= f_t(t_i,X_{t_i})\Delta t_i + f_x(t_i,X_{t_i})\Delta X_i \\ &\quad + \frac12 f_{xx}(t_i,X_{t_i})(\Delta X_i)^2 + R_i, \end{aligned}\]

여기서 \(R_i\)는 higher-order remainder다.

고전 미적분에서는 \((\Delta X_i)^2\) 항이 2차미소량이라 사라진다고 생각한다. 그런데 확률미분방정식에서는 상황이 다르다. 왜냐하면 Brownian increment의 크기는 \(\Delta t_i\)가 아니라 \(\sqrt{\Delta t_i}\) order이기 때문이다. 실제로

\[\Delta X_i = b_{t_i}\Delta t_i + \sigma_{t_i}\Delta W_i + \text{작은 오차}\]

이고, \(\Delta W_i\sim N(0,\Delta t_i)\)이므로 \(|\Delta W_i|\)는 전형적으로 \(\sqrt{\Delta t_i}\) 크기다. 따라서

\[(\Delta X_i)^2 \approx \sigma_{t_i}^2(\Delta W_i)^2 \approx \sigma_{t_i}^2\Delta t_i.\]

즉 \((\Delta X_i)^2\)가 전체 합에서 사라지지 않고 정확히 1차 오더로 남는다.

이를 좀 더 직접 전개해 보자.

\[(\Delta X_i)^2 = \big(b_{t_i}\Delta t_i + \sigma_{t_i}\Delta W_i + o_p(\sqrt{\Delta t_i})\big)^2.\]

전개하면

\[(\Delta X_i)^2 = b_{t_i}^2(\Delta t_i)^2 +2b_{t_i}\sigma_{t_i}\Delta t_i\Delta W_i +\sigma_{t_i}^2(\Delta W_i)^2 +\text{더 작은 항}.\]

각 항의 규모를 보면

\((\Delta t_i)^2\)는 너무 작아서 사라지고,
\(\Delta t_i\Delta W_i\)는 \(\Delta t_i^{3/2}\) order라 역시 사라지며,
오직 \((\Delta W_i)^2\)만이 \(\Delta t_i\) order로 살아남는다.

따라서 본질적으로

\[(\Delta X_i)^2 = \sigma_{t_i}^2\Delta t_i + o_p(\Delta t_i)\]

로 볼 수 있다.

이제 Taylor 전개를 전체 합에 넣으면

\[\begin{aligned} f(T,X_T)-f(0,X_0) &= \sum_i f_t(t_i,X_{t_i})\Delta t_i + \sum_i f_x(t_i,X_{t_i})\Delta X_i \\ &\quad + \frac12\sum_i f_{xx}(t_i,X_{t_i})(\Delta X_i)^2 + \sum_i R_i. \end{aligned}\]

둘째 항에 \(\Delta X_i = b_{t_i}\Delta t_i + \sigma_{t_i}\Delta W_i + o_p(\Delta t_i)\)를 넣으면

\[\sum_i f_x(t_i,X_{t_i})\Delta X_i \to \int_0^T f_x(t,X_t)b_t\,dt + \int_0^T f_x(t,X_t)\sigma_t\,dW_t.\]

셋째 항은 quadratic variation 때문에

\[\frac12\sum_i f_{xx}(t_i,X_{t_i})(\Delta X_i)^2 \to \frac12\int_0^T f_{xx}(t,X_t)\sigma_t^2\,dt.\]

나머지항들의 합은 smoothness와 확률적 추정에 의해 0으로 간다. 결국

\[\begin{aligned} f(T,X_T)-f(0,X_0) &= \int_0^T f_t(t,X_t)\,dt + \int_0^T f_x(t,X_t)b_t\,dt \\ &\quad + \int_0^T f_x(t,X_t)\sigma_t\,dW_t + \frac12\int_0^T f_{xx}(t,X_t)\sigma_t^2\,dt. \end{aligned}\]

미분형식으로 쓰면

\[df(t,X_t) = \Big(f_t + b_tf_x + \frac12\sigma_t^2f_{xx}\Big)dt + \sigma_t f_x\,dW_t.\]

즉 Itô 공식은 “브라운운동의 quadratic variation이 0이 아니라 시간과 같은 크기로 누적된다”는 사실을 해석학적으로 정리한 공식이다. AHFT에서 generator 항 \(\tfrac12\sigma^2 f_{xx}\)가 등장하는 이유도 바로 이 계산 때문이다.

6.3 다변수 generator 형식

\(X_t \in \mathbb R^n\),

\[dX_t = b(X_t,u_t)dt + \Sigma(X_t,u_t)dW_t\]

이면 smooth \(f\)에 대해

\[df(t,X_t) = \Big(\partial_t f + \mathcal L^u f\Big)(t,X_t)dt + (\nabla f)^\top \Sigma dW_t,\]

여기서 생성자(generator)는

\[\mathcal L^u f(x) = b(x,u)\cdot \nabla f(x) + \frac12 \operatorname{Tr}\big(\Sigma\Sigma^\top(x,u) D^2 f(x)\big).\]

이 생성자는 AHFT 9장의 DPE에 그대로 들어간다.

7. Poisson process

rate \(\lambda>0\) Poisson process \((N_t)\)는

\(N_0=0\),
독립증분,
stationary increments,
\(N_t-N_s \sim \text{Poisson}(\lambda(t-s))\)

를 만족한다.

7.1 기대값과 분산

\[\mathbb E[N_t]=\lambda t, \qquad \operatorname{Var}(N_t)=\lambda t.\]

7.2 증명 스케치

Poisson(\(m\)) 변수의 평균과 분산이 모두 \(m\)이라는 사실을 쓰면 즉시 따라온다.

8. Compound Poisson process

8.1 정의

\(N_t\)가 rate \(\lambda\) Poisson process, \((Y_i)\)가 i.i.d. jump size, \(N\)과 독립이면

\[J_t := \sum_{i=1}^{N_t} Y_i\]

를 compound Poisson process라 한다.

AHFT 9.3.1에서 volume의 누적을 discrete trade arrivals의 합으로 잡으면 바로 이 구조가 나온다.

8.2 기대값

\[\mathbb E[J_t] = \lambda t \, \mathbb E[Y_1].\]

증명

조건부기댓값을 써서

\[\mathbb E[J_t] = \mathbb E\big[\mathbb E[J_t\mid N_t]\big].\]

\(N_t=n\)이면

\[J_t = Y_1+\cdots+Y_n, \qquad \mathbb E[J_t\mid N_t=n]=n\mathbb E[Y_1].\]

따라서

\[\mathbb E[J_t\mid N_t] = N_t \mathbb E[Y_1].\]

다시 기댓값을 취해

\[\mathbb E[J_t] = \mathbb E[N_t]\mathbb E[Y_1] = \lambda t \mathbb E[Y_1].\]

□

8.3 generator

jump size law를 \(F(dy)\)라 하면 compound Poisson process의 generator는 smooth \(f\)에 대해

\[\mathcal L f(x) = \lambda \int \big(f(x+y)-f(x)\big)F(dy).\]

만약 drift/diffusion이 같이 있으면

\[\mathcal L f(x) = b(x)f'(x) + \frac12 \sigma^2(x)f''(x) + \lambda \int \big(f(x+y)-f(x)\big)F(dy).\]

8.4 generator의 직관적 유도

짧은 시간 \(\Delta t\) 동안

jump 0개일 확률: \(1-\lambda \Delta t + o(\Delta t)\)
jump 1개일 확률: \(\lambda \Delta t + o(\Delta t)\)
jump 2개 이상일 확률: \(o(\Delta t)\)

이므로

\[\mathbb E[f(X_{t+\Delta t})-f(X_t)\mid X_t=x]\]

는 1-jump 경우만 1차 오더로 남아

\[\lambda \Delta t \int (f(x+y)-f(x))F(dy) + o(\Delta t)\]

가 된다. 이를 \(\Delta t\)로 나누고 극한을 보내면 generator가 나온다.

9. 상태증강과 Markov화

AHFT 9장에서 가장 중요한 구조적 아이디어는 이것이다.

원래 non-Markov처럼 보이는 volume 추적 문제를, 적절한 상태변수를 추가하면 Markov control problem으로 닫을 수 있다.

예를 들어,

instantaneous market speed를 추적하면 상태에 \(\mu_t\)를 넣고,
cumulative volume을 추적하면 상태에 \(V_t\)를 넣고,
다른 참가자의 효과를 넣으면 \(\mu_t\) 또는 order-flow state를 더 넣는다.

즉 value function은 단순히 \(H(t,Q_t)\)가 아니라

\[H(t,q,\mu,v,\ldots)\]

가 된다.

9.1 Markov property

상태과정 \(X_t\)가 Markov라는 것은

\[\mathbb E[g(X_T)\mid \mathcal F_t] = \mathbb E[g(X_T)\mid X_t] = u(t,X_t)\]

형태로 과거 전체가 현재 상태 하나로 축약된다는 뜻이다.

AHFT 9장에서 probabilistic representation이 먹히는 이유가 정확히 이것이다.

10. 제어문제의 기본 구조

상태방정식이

\[dX_t = b(X_t,u_t)dt + \Sigma(X_t,u_t)dW_t\]

또는 jump를 포함해

\[dX_t = b(X_t,u_t)dt + \Sigma(X_t,u_t)dW_t + dJ_t\]

라 하자. admissible control 집합을 \(\mathcal A\)라 하고, 목적함수를

\[J(t,x;u) = \mathbb E\Big[\int_t^T f(s,X_s,u_s)ds + g(X_T) \; \Big|\; X_t=x\Big]\]

로 둔다.

가치함수는

\[H(t,x)=\sup_{u\in\mathcal A} J(t,x;u)\]

또는 minimisation이면 inf로 정의한다.

10.1 AHFT 9장의 상태변수

전형적으로

\[X_t = (Q_t, \mu_t, V_t, S_t, X_t^{\text{cash}})\]

중 일부가 들어간다.

재고 dynamics는 보통

\[dQ_t = -\nu_t dt\]

이다. 즉 \(\nu_t>0\)는 sell speed다.

누적거래량은

\[dV_t = \mu_t dt\]

또는 jump volume이면

\[dV_t = d\Big(\sum_{i=1}^{N_t}Y_i\Big)\]

이다.

10.2 목적함수의 전형적 형태

AHFT 9장의 tracking 문제는 전형적으로 다음 꼴이다.

\[\mathbb E\Big[ \int_t^T \Big( \text{temporary impact cost} + \text{tracking penalty} + \text{inventory penalty} \Big)du + \text{terminal penalty} \Big].\]

예를 들면

\[\int_t^T \big( a\nu_u^2 + \phi (\nu_u - p\mu_u)^2 + \varphi Q_u^2 \big)du + \alpha Q_T^2.\]

여기서

\(a\nu^2\): trading too fast의 cost
\(\phi(\nu-p\mu)^2\): 시장 거래속도의 \(p\)-비율을 추적하려는 벌점
\(\varphi Q^2\): inventory risk
\(\alpha Q_T^2\): 마감 inventory 처벌

이다.

11. Dynamic Programming Principle (DPP)

11.1 비형식적 진술

현재 최적으로 행동한다는 것은, 아주 짧은 시간 \([t,t+\Delta t]\) 동안 최적으로 행동하고, 그 이후부터도 다시 최적으로 행동하는 것과 같다.

즉

\[H(t,x) = \sup_u \mathbb E\Big[ \int_t^{t+\Delta t} f(s,X_s,u_s)ds + H(t+\Delta t, X_{t+\Delta t}) \mid X_t=x\Big].\]

이것이 DPP다.

11.2 해석

control의 조각붙이기(concatenation)가 가능하고, Markov state가 충분하며, admissibility가 시간절단 후에도 유지되기 때문이다.

11.3 DPP에서 HJB로의 전개

위 식에서 Taylor/Itô 전개를 하면

\[H(t+\Delta t,X_{t+\Delta t}) = H(t,x) + \partial_t H\,\Delta t + \mathcal L^u H\,\Delta t + \text{martingale term} + o(\Delta t).\]

조건부기댓값을 취하면 martingale term은 0이므로

\[0 = \sup_u \{ f(t,x,u) + \partial_t H(t,x)+\mathcal L^u H(t,x)\}.\]

이것이 HJB/DPE다.

11.3.1 보다 상세한 전개

DPP는

\[H(t,x)=\sup_u \mathbb E\Big[\int_t^{t+h} f(s,X_s,u_s)ds + H(t+h,X_{t+h})\mid X_t=x\Big]\]

라는 식으로 쓸 수 있다. 이 식의 의미는 명확하다. 현재 시점의 최적가치는 “아주 짧은 첫 구간에서 얻는 보상”과 “그 다음 시점에서 다시 시작했을 때의 최적가치”를 합친 것의 최댓값이다.

이제 이 식으로부터 HJB가 어떻게 나오는지를 한 단계씩 전개하자. 먼저 양변에서 \(H(t,x)\)를 빼면

\[0 = \sup_u \mathbb E\Big[\int_t^{t+h} f(s,X_s,u_s)ds + H(t+h,X_{t+h})-H(t,x)\mid X_t=x\Big].\]

문제는 마지막 차이항

\[H(t+h,X_{t+h})-H(t,x)\]

을 짧은 시간 \(h\)에 대한 1차 근사로 바꾸는 것이다. 이를 위해 \(H\)가 충분히 smooth하다고 가정하고 Itô 공식을 적용한다. 상태과정이 control \(u\) 아래에서

\[dX_s = b(X_s,u_s)ds + \Sigma(X_s,u_s)dW_s\]

를 따른다고 하면

\[H(t+h,X_{t+h})-H(t,x) = \int_t^{t+h}(\partial_s H + \mathcal L^u H)(s,X_s)ds + M_{t+h}-M_t,\]

여기서 \(M\)은 martingale part다.

이를 DPP 식에 대입하면

\[\begin{aligned} 0 &= \sup_u \mathbb E\Big[\int_t^{t+h} f(s,X_s,u_s)ds \\ &\qquad + \int_t^{t+h}(\partial_s H+\mathcal L^uH)(s,X_s)ds \\ &\qquad + M_{t+h}-M_t \mid X_t=x\Big]. \end{aligned}\]

적분들을 하나로 묶으면

\[0 = \sup_u \mathbb E\Big[\int_t^{t+h}(f+\partial_sH+\mathcal L^uH)(s,X_s,u_s)ds + M_{t+h}-M_t\mid X_t=x\Big].\]

이제 martingale 증가분의 조건부기댓값이 0이라는 사실을 쓰면

\[\mathbb E[M_{t+h}-M_t\mid X_t=x]=0\]

이므로 식은

\[0 = \sup_u \mathbb E\Big[\int_t^{t+h}(f+\partial_sH+\mathcal L^uH)(s,X_s,u_s)ds \mid X_t=x\Big]\]

로 단순화된다.

이제 양변을 \(h\)로 나누고 \(h\downarrow0\)를 보낸다. 연속성 가정 아래에서는 적분구간이 한 점으로 수축하므로

\[\frac1h\mathbb E\Big[\int_t^{t+h}\Psi(s,X_s,u_s)ds\mid X_t=x\Big] \to \Psi(t,x,u)\]

가 된다. 여기서 \(\Psi=f+\partial_tH+\mathcal L^uH\)이다. 따라서 극한에서

\[0 = \sup_u \{f(t,x,u)+\partial_tH(t,x)+\mathcal L^uH(t,x)\}\]

를 얻는다. 이것이 바로 HJB 또는 DPE다.

즉 HJB는 갑자기 등장하는 PDE가 아니라,

DPP로부터 출발해,
미래가치 항에 Itô 공식을 적용하고,
martingale part의 평균이 0이라는 사실을 사용하며,
짧은 시간 극한을 보내 얻는 국소적 최적화 방정식이다.

이 구조를 이해해야 AHFT 9장에서 generator, target penalty, control minimisation이 한 식 안에 왜 함께 들어가는지 자연스럽게 읽을 수 있다. □

12. Verification theorem

HJB를 푼 후보해(candidate) \(\hat H\)가 진짜 가치함수인지 확인하는 정리다.

12.1 정리(비공식 버전)

어떤 smooth 함수 \(\hat H\)가 terminal condition을 만족하고,

\[0 = \sup_u \{ f + \partial_t \hat H + \mathcal L^u \hat H\}\]

를 만족한다고 하자. 또한 적절한 적분가능성과 admissibility가 성립한다고 하자. 그러면

모든 admissible \(u\)에 대해 \(\hat H \ge J^u\) 또는 \(\le\) (문제 부호에 따라)
HJB의 supremum을 달성하는 feedback control \(u^*\)가 존재하면 \(\hat H = H\)

이다.

12.2 증명 구조

verification theorem의 핵심은 다음 한 문장으로 요약된다.

HJB를 만족하는 candidate 함수에 Itô 공식을 적용하면, 그 함수가 실제 성과함수보다 항상 크거나 작다는 비교식이 나온다. 그리고 HJB의 최적값을 실제로 달성하는 control이 있으면 그 비교식이 equality가 되어 candidate가 진짜 가치함수로 확인된다.

여기서는 최대화 문제의 부호로 설명하겠다. 즉

\[H(t,x)=\sup_{u\in\mathcal A}\mathbb E\Big[\int_t^T f(s,X_s^u,u_s)ds + g(X_T^u)\Big]\]

라고 하자. 후보해 \(\hat H\)가 terminal condition

\[\hat H(T,x)=g(x)\]

과 HJB

\[0 = \sup_u\{f(t,x,u)+\partial_t\hat H(t,x)+\mathcal L^u\hat H(t,x)\}\]

를 만족한다고 하자.

이제 임의의 admissible control \(u\)를 하나 고정한다. 그 control 아래의 상태과정을 \(X_s^u\)라고 쓰면, Itô 공식에 의해

\[d\hat H(s,X_s^u) = (\partial_s\hat H + \mathcal L^u\hat H)(s,X_s^u)ds + dM_s\]

가 된다. 여기서 \(M_s\)는 martingale part다.

그런데 HJB가 supremum 형태라는 것은, 특정한 하나의 control \(u\)를 대입했을 때는 항상

\[f(s,X_s^u,u_s)+\partial_s\hat H(s,X_s^u)+\mathcal L^u\hat H(s,X_s^u) \le 0\]

가 성립한다는 뜻이다. 따라서

\[\partial_s\hat H(s,X_s^u)+\mathcal L^u\hat H(s,X_s^u) \le -f(s,X_s^u,u_s).\]

이를 Itô 공식에 넣으면

\[d\hat H(s,X_s^u) \le -f(s,X_s^u,u_s)ds + dM_s.\]

이제 \(t\)부터 \(T\)까지 적분하면

\[\hat H(T,X_T^u)-\hat H(t,x) \le -\int_t^T f(s,X_s^u,u_s)ds + M_T-M_t.\]

항을 옮기면

\[\hat H(t,x) \ge \hat H(T,X_T^u)+\int_t^T f(s,X_s^u,u_s)ds -(M_T-M_t).\]

기댓값을 취하면 martingale 증가분의 기댓값은 0이므로

\[\hat H(t,x) \ge \mathbb E\Big[\hat H(T,X_T^u)+\int_t^T f(s,X_s^u,u_s)ds\Big].\]

말단조건을 대입하면

\[\hat H(t,x) \ge \mathbb E\Big[g(X_T^u)+\int_t^T f(s,X_s^u,u_s)ds\Big].\]

이 부등식은 임의의 admissible control \(u\)에 대해 성립하므로

\[\hat H(t,x) \ge H(t,x).\]

즉 candidate는 실제 가치함수의 upper bound가 된다.

이제 어떤 feedback control \(u^*\)가 존재하여 HJB의 supremum을 점wise로 달성한다고 하자. 즉

\[f(t,x,u^*)+\partial_t\hat H(t,x)+\mathcal L^{u^*}\hat H(t,x)=0\]

가 성립한다고 하자. 그러면 위 부등식은 equality가 된다.

\[d\hat H(s,X_s^{u^*}) = -f(s,X_s^{u^*},u_s^*)ds + dM_s.\]

이를 적분하고 기대값을 취하면

\[\hat H(t,x) = \mathbb E\Big[g(X_T^{u^*})+\int_t^T f(s,X_s^{u^*},u_s^*)ds\Big].\]

즉 \(u^*\)는 \(\hat H\)가 주는 값을 실제로 달성한다. 그런데 \(H\)는 admissible controls 전체의 supremum이므로

\[H(t,x) \ge \mathbb E\Big[g(X_T^{u^*})+\int_t^T f(s,X_s^{u^*},u_s^*)ds\Big] = \hat H(t,x).\]

이미 \(\hat H\ge H\)였으므로 양쪽을 합치면

\[\hat H(t,x)=H(t,x)\]

이다. 따라서 \(u^*\)가 최적제어다.

이 정리는 AHFT 9장에서 quadratic ansatz나 exponential utility ansatz로 계산한 후보해가 단순한 algebraic guess가 아니라, 실제 stochastic control 문제의 진짜 해라는 사실을 정당화하는 핵심 도구다. □

12.3 jump가 있을 때

jump가 들어가면 Itô 공식의 generator에 적분형 jump term이 추가될 뿐, verification의 논리 구조 자체는 변하지 않는다. 예를 들어 jump size law가 \(\Pi(dz)\)인 경우 생성자는 대략

\[\mathcal L^u f(x) = b(x,u)\cdot\nabla f(x) + \frac12\operatorname{Tr}(\Sigma\Sigma^\top D^2f)(x,u) + \int \big(f(x+z)-f(x)\big)\Pi(dz)\]

형태를 갖는다. 이에 대응하는 Itô--Dynkin 공식을 candidate에 적용하면, drift 부분에 이 jump 적분항이 함께 나타난다. 이후 HJB 부등식을 대입하여 모든 admissible control에 대한 비교부등식을 얻고, 최적 feedback에서 equality를 얻는 과정은 완전히 동일하다.

즉 jump가 추가된다고 해서 verification의 철학이 바뀌는 것은 아니다. 바뀌는 것은 오직 generator의 모양뿐이다.

13. Mean-reverting trading rate

AHFT 9.2.2 및 9.3.2에서 핵심으로 쓰이는 상태과정은 보통 다음 꼴이다.

\[d\mu_t = \kappa(\bar\mu-\mu_t)dt + \eta dW_t.\]

이는 Ornstein–Uhlenbeck(OU) 과정이다.

13.1 해의 명시형

적분인자를 이용하면

\[d\mu_t + \kappa \mu_t dt = \kappa \bar\mu dt + \eta dW_t.\]

양변에 \(e^{\kappa t}\)를 곱하면

\[d(e^{\kappa t}\mu_t) = \kappa\bar\mu e^{\kappa t}dt + \eta e^{\kappa t}dW_t.\]

적분하여

\[e^{\kappa t}\mu_t - \mu_0 = \bar\mu(e^{\kappa t}-1) + \eta\int_0^t e^{\kappa s}dW_s.\]

따라서

\[\mu_t = \bar\mu + (\mu_0-\bar\mu)e^{-\kappa t} + \eta \int_0^t e^{-\kappa(t-s)}dW_s.\]

13.2 조건부기댓값

\[\mathbb E[\mu_t\mid \mathcal F_s] = \bar\mu + (\mu_s-\bar\mu)e^{-\kappa(t-s)}, \qquad s\le t.\]

증명

OU 과정의 핵심은 “현재값과 장기평균의 차이가 지수적으로 감쇠한다”는 것이다. 이 문장을 수식으로 쓰면 바로 위의 조건부기댓값 공식이 된다.

먼저 SDE를 다시 적자.

\[d\mu_t = \kappa(\bar\mu-\mu_t)dt + \eta dW_t.\]

이를 정리하면

\[d\mu_t + \kappa\mu_tdt = \kappa\bar\mu dt + \eta dW_t.\]

적분인자 \(e^{\kappa t}\)를 곱하면

\[e^{\kappa t}d\mu_t + \kappa e^{\kappa t}\mu_tdt = \kappa\bar\mu e^{\kappa t}dt + \eta e^{\kappa t}dW_t.\]

좌변은 정확히 곱의 미분으로 묶여

\[d(e^{\kappa t}\mu_t) = \kappa\bar\mu e^{\kappa t}dt + \eta e^{\kappa t}dW_t\]

가 된다. 이제 \(s\)부터 \(t\)까지 적분하면

\[e^{\kappa t}\mu_t - e^{\kappa s}\mu_s = \int_s^t \kappa\bar\mu e^{\kappa u}du + \eta\int_s^t e^{\kappa u}dW_u.\]

첫 적분은 결정론적이므로 바로 계산된다.

\[\int_s^t \kappa\bar\mu e^{\kappa u}du = \bar\mu(e^{\kappa t}-e^{\kappa s}).\]

따라서

\[e^{\kappa t}\mu_t - e^{\kappa s}\mu_s = \bar\mu(e^{\kappa t}-e^{\kappa s}) + \eta\int_s^t e^{\kappa u}dW_u.\]

양변을 \(e^{\kappa t}\)로 나누면 explicit representation

\[\mu_t = \bar\mu + (\mu_s-\bar\mu)e^{-\kappa(t-s)} + \eta\int_s^t e^{-\kappa(t-u)}dW_u\]

를 얻는다.

이제 \(\mathcal F_s\)-조건부기댓값을 취하자. 첫 두 항은 이미 \(\mathcal F_s\)-가측이므로 그대로 남는다. 마지막 Itô 적분은 적분구간이 \([s,t]\)이고 integrand가 결정론적이므로, 그 \(\mathcal F_s\)-조건부기댓값은 0이다.

\[\mathbb E\Big[\int_s^t e^{-\kappa(t-u)}dW_u\,\Big|\,\mathcal F_s\Big]=0.\]

따라서

\[\mathbb E[\mu_t\mid\mathcal F_s] = \bar\mu + (\mu_s-\bar\mu)e^{-\kappa(t-s)}.\]

이 식의 해석은 명확하다. 현재값 \(\mu_s\)가 장기평균보다 크면 그 초과분은 시간에 따라 \(e^{-\kappa(t-s)}\) 배로 줄어들고, 반대로 작으면 부족분 역시 같은 속도로 메워진다. \(\kappa\)가 클수록 mean reversion이 빠르다는 사실도 여기서 바로 읽힌다.

AHFT 9장에서 이 공식이 중요한 이유는, 미래 누적거래량 기대값

\[\mathbb E\Big[\int_t^T \mu_u\,du\,\Big|\,\mathcal F_t\Big]\]

을 explicit하게 계산할 때 가장 바닥에 놓이는 building block이 바로 이 conditional mean이기 때문이다. □

13.3 AHFT 9장과의 연결

probabilistic representation에서 미래 volume rate의 conditional mean이 닫힌형으로 나오기 때문에, AHFT는 보조함수 \(h_1\)를 explicit하게 쓴다.

14. Cumulative volume

순간 market trading rate가 \(\mu_t\)이면 cumulative volume은

\[V_t = V_0 + \int_0^t \mu_u du.\]

따라서 상태벡터를 \((Q_t,\mu_t,V_t)\)로 잡으면 Markov state가 된다.

14.1 generator

\[dQ_t = -\nu_t dt, \qquad d\mu_t = \kappa(\bar\mu-\mu_t)dt + \eta dW_t, \qquad dV_t = \mu_t dt\]

이면 smooth \(f(t,q,\mu,V)\)에 대해 generator는

\[\mathcal L^{\nu} f = -\nu \partial_q f + \kappa(\bar\mu-\mu)\partial_\mu f + \mu \partial_V f + \frac12 \eta^2 \partial_{\mu\mu}f.\]

이 식은 AHFT 9.2–9.4 DPE에 직접 등장한다.

15. POV, POCV, VWAP

15.1 POV (Percentage of Volume)

시장 순간 거래속도 \(\mu_t\)의 \(p\)비율을 따라가는 것이다. 이상적이면

\[\nu_t \approx p\mu_t.\]

이를 hard constraint로 둘 수도 있고 soft penalty로 둘 수도 있다.

15.2 POCV (Percentage of Cumulative Volume)

누적거래량의 \(p\)비율을 따라가는 것이다. 누적 내 거래량이

\[Q_0-Q_t\]

이고 시장 누적거래량이 \(V_t\)이면, 추적 대상은

\[Q_0-Q_t \approx pV_t.\]

즉

\[Q_t + pV_t \approx Q_0\]

같은 구조가 상태에 들어간다.

15.3 VWAP

구간 \([0,T]\) 동안 거래가격의 volume-weighted average는

\[\text{VWAP} = \frac{\int_0^T P_t\, dV_t}{V_T-V_0}\]

로 정의된다.

실전에서는 discrete version

\[\text{VWAP} = \frac{\sum_i P_i \Delta V_i}{\sum_i \Delta V_i}\]

를 쓴다.

15.4 quadratic tracking penalty

수학적으로는 HJB를 닫고 explicit ansatz를 가능하게 하기 위해서다. 경제적으로는 target deviation의 크기를 대칭적으로 벌주려는 것이다.

16. 9.2 Targeting Percentage of Market’s Speed of Trading

16.1 문제 설정

시장 순간 거래속도 \(\mu_t\)의 일정 비율 \(p\)를 목표로 삼아 자신의 거래속도 \(\nu_t\)를 결정한다.

16.2 상태와 제어

상태변수: \((Q_t,\mu_t)\) 또는 \((Q_t,\mu_t,S_t,X_t)\)
제어변수: \(\nu_t\)
inventory dynamics: \[ dQ_t = -\nu_t dt \]
market speed:
- deterministic function 혹은
- OU diffusion: \[ d\mu_t = \kappa(\bar\mu-\mu_t)dt + \eta dW_t \]

16.3 목적함수

예시로

\[J^{\nu}(t,q,\mu) = \mathbb E\Big[ \int_t^T \Big(a\nu_u^2 + \phi(\nu_u-p\mu_u)^2 + \varphi Q_u^2\Big)du + \alpha Q_T^2 \, \Big|Q_t=q,\mu_t=\mu\Big].\]

이를 최소화한다고 하자.

16.4 DPE 유도

가치함수

\[H(t,q,\mu) = \inf_{\nu} J^{\nu}(t,q,\mu)\]

를 두면 generator는

\[\mathcal L^{\nu} H = -\nu H_q + \kappa(\bar\mu-\mu)H_\mu + \frac12 \eta^2 H_{\mu\mu}.\]

따라서 DPE는

\[0 = H_t + \kappa(\bar\mu-\mu)H_\mu + \frac12\eta^2 H_{\mu\mu} + \inf_{\nu}\Big\{ -\nu H_q + a\nu^2 + \phi(\nu-p\mu)^2 + \varphi q^2 \Big\}.\]

terminal condition:

\[H(T,q,\mu)=\alpha q^2.\]

16.5 1차조건

minimand를 전개하면

\[-\nu H_q + a\nu^2 + \phi(\nu^2 -2p\mu\nu + p^2\mu^2) + \varphi q^2\]

즉

\[(a+\phi)\nu^2 - (H_q + 2\phi p\mu)\nu + \phi p^2 \mu^2 + \varphi q^2.\]

\(\nu\)에 대한 볼록함수이므로 1차조건으로 최적제어:

\[2(a+\phi)\nu^* - (H_q + 2\phi p\mu)=0.\]

따라서

\[\boxed{\nu^* = \frac{H_q + 2\phi p\mu}{2(a+\phi)}}.\]

부호 관례에 따라 AHFT 표기와 약간 다르게 보일 수 있으나 핵심은 동일하다. 즉 optimal speed는

inventory gradient \(H_q\)에 반응하고,
시장 거래속도 \(\mu\)에도 반응한다.

16.6 quadratic ansatz

tracking과 terminal penalty가 quadratic이고 state equation이 affine이므로

\[H(t,q,\mu)=h_0(t,\mu)+h_1(t,\mu)q+h_2(t)q^2\]

또는 경우에 따라

\[H(t,q,\mu)=A_t q^2 + B_t q\mu + C_t \mu^2 + D_t q + E_t \mu + F_t\]

형태의 ansatz가 자연스럽다.

16.6.1 quadratic ansatz의 구조

DPE 안에서

terminal condition이 \(q^2\),
running penalty가 \(q^2\), \(\nu^2\), \((\nu-p\mu)^2\),
optimal \(\nu^*\)가 \(H_q\)에 선형으로 의존

하므로 닫힘성(closedness)을 위해 value function의 \(q\)-의존성이 quadratic여야 한다.

17. 9.2.3 Probabilistic Representation

이 절을 이해하기 위해서는 다음이 필요하다.

Markov property
generator
Feynman–Kac류 representation
OU conditional mean 계산

17.1 선형 PDE representation

\[\partial_t u + \mathcal L u + f =0, \qquad u(T,x)=g(x)\]

라 하자. 적절한 regularity 하에

\[u(t,x) = \mathbb E_{t,x}\Big[g(X_T)+\int_t^T f(s,X_s)ds\Big]\]

이다.

17.2 증명

\(X_s\)가 generator \(\mathcal L\)를 따른다고 하자.

\[M_s := u(s,X_s)+\int_t^s f(r,X_r)dr\]

를 정의하면 Itô 공식으로

\[dM_s = \big(u_t+\mathcal L u + f\big)(s,X_s)ds + dN_s.\]

PDE 때문에 drift가 0이므로 \(M_s\)는 local martingale이다. 적분가능성 하에 martingale. 따라서

\[u(t,x)=M_t = \mathbb E[M_T\mid X_t=x] = \mathbb E\Big[g(X_T)+\int_t^T f(r,X_r)dr \mid X_t=x\Big].\]

□

17.3 AHFT 9장과의 연결

AHFT는 quadratic ansatz로 분해한 뒤 보조함수 \(h_1,h_0\)에 대해 선형 PDE를 얻고, 이를 expectation form으로 읽는다. 즉 closed form을 직접 ODE로 풀거나 expectation form으로 해석한다.

18. 9.3 Percentage of Cumulative Volume

이번에는 추적 대상이 순간 거래속도 \(p\mu_t\)가 아니라 누적거래량 \(pV_t\)이다.

18.1 상태변수

\(dQ_t=-\nu_tdt\)
\(dV_t = \mu_tdt\) 또는 compound Poisson increment

tracking quantity는 전형적으로

\[Q_0 - Q_t - pV_t\]

또는 동치인 변형이다.

즉 state에 \(V_t\)가 반드시 들어가야 한다.

18.2 목적함수

\[J^{\nu}(t,q,v,\mu) = \mathbb E\Big[ \int_t^T \Big(a\nu_u^2 + \phi\big((Q_0-Q_u)-pV_u\big)^2 + \varphi Q_u^2\Big)du + \alpha Q_T^2 \Big].\]

18.3 generator

diffusion volume rate이면

\[\mathcal L^{\nu}f = -\nu f_q + \mu f_v + \kappa(\bar\mu-\mu)f_\mu + \frac12\eta^2 f_{\mu\mu}.\]

jump cumulative volume이면 jump part가 추가된다.

19. 9.3.1 Compound Poisson Model of Volume

이 절의 핵심은 cumulative volume을 연속적 누적이 아니라 discrete market trades의 누적으로 본다는 점이다.

예를 들어

\[V_t = \sum_{i=1}^{N_t} Y_i,\]

여기서

\(N_t\): 거래 도착 수
\(Y_i\): 각 거래의 size

이다.

19.1 jump generator

smooth \(H(t,q,v)\)에 대해 짧은 시간 동안

jump 없음: \(v\) 유지
jump 1개: \(v\mapsto v+Y\)

이므로 DPE의 jump contribution은

\[\lambda \mathbb E_Y\big[H(t,q,v+Y)-H(t,q,v)\big]\]

형태가 된다.

19.2 jump DPE의 구조

\[0 = H_t + \inf_{\nu}\{ -\nu H_q + a\nu^2 + \cdots \} + \lambda \mathbb E[H(t,q,V+Y)-H(t,q,V)].\]

19.3 관련 선수지식

Poisson process / compound Poisson
compensated martingale
jump Itô/Dynkin formula
PIDE(적분항 포함 HJB)

19.4 jump Dynkin formula

jump-diffusion \(X_t\)와 smooth \(f\)에 대해

\[\mathbb E[f(X_T)] = f(X_t)+\mathbb E\Big[\int_t^T \mathcal L f(X_s)ds\Big]\]

이며 \(\mathcal L\)에는 jump integral term이 들어간다. 이 공식이 verification의 핵심이다.

20. 9.3.2 Stochastic Mean-Reverting Volume Rate

이 절은 사실 9.2와 9.3.1의 합성이다.

volume rate는 diffusion OU
cumulative volume은 그 적분

즉 상태가 \((Q_t,\mu_t,V_t)\)로 커진다.

20.1 문제의 구조

9.2에서는 target이 순간값 \(p\mu_t\)였고, 9.3에서는 target이 누적값 \(pV_t\)다.

따라서 현재의 최적제어는 현재 \(\mu_t\)뿐 아니라 누적 상태 \(V_t\)에도 의존한다.

20.2 ansatz의 형태

tracking source term이 \(V\)에 선형으로 들어가면 보조함수 \(h_1(t,V)\)를 선형 ansatz

\[h_1(t,V)=f_0(t)+f_1(t)V\]

로 두는 것이 자연스럽다.

이 구조는 AHFT가 explicit ODE system으로 환원하는 핵심이다.

21. 9.4 Including Impact of Other Traders

여기서는 다른 참가자의 거래가 단순 target process가 아니라 내 비용이나 가격 dynamics에 직접 영향을 준다.

즉 시장 volume을 따라간다에서 더 나아가

다른 참가자들의 거래흐름이 나의 execution problem 자체를 바꾼다.

21.1 수학적 의미

\(\mu_t\)가 state variable일 뿐 아니라,
running cost나 target path에 coupling되어 들어간다.

예를 들어

\[\text{cost term} = a\nu_t^2 + b\nu_t\mu_t + c(Q_t,V_t,\mu_t)\]

꼴이 될 수 있다.

21.2 probabilistic representation의 역할

linear source term이 많아지면 PDE를 सीधे ODE로 푸는 것보다 expectation representation으로 먼저 읽는 것이 구조를 파악하기 쉽다.

22. 9.5 Utility Maximiser

여기서는 quadratic penalty minimisation 대신 효용최대화가 들어온다.

전형적으로 exponential utility를 많이 쓴다.

\[U(x) = -e^{-\gamma x}.\]

22.1 exponential utility

CARA(constant absolute risk aversion)
cash와 risky part의 분리가 깔끔함
종종 ansatz로 상태차원을 줄일 수 있음

22.2 전형적 ansatz

현금 \(X_t\), 재고 \(Q_t\), price \(S_t\)가 있을 때 terminal wealth \(W_T\)에 대해

\[H(t,x,s,q,\ldots) = -\exp\big(-\gamma(x+qs+h(t,q,\ldots))\big)\]

와 같은 ansatz를 두면 HJB가 \(h\)에 대한 reduced equation으로 내려간다.

22.3 reduced HJB

exponential function의 도함수는 자기 자신이므로

\[H_x = -\gamma H, \qquad H_{xx}=\gamma^2 H,\]

등이 되어 공통인자 \(H\)가 factor out된다.

이것이 9.5.1을 이해하는 핵심이다.

23. Quadratic control의 최적 피드백

다음 minimisation을 보자.

\[\inf_{\nu}\Big\{ A\nu^2 - B\nu + C\Big\}, \qquad A>0.\]

23.1 문제의 위치

AHFT 9장의 HJB에서 control variable \(\nu\)는 거의 항상 2차식 안에 들어간다. temporary impact 비용이 \(\nu^2\)를 만들고, target penalty \((\nu-p\mu)^2\)도 다시 \(\nu^2\)를 만든다. 따라서 HJB 안에서 \(\nu\)에 대한 최적화는 결국 위와 같은 “볼록한 2차식의 최소화”로 떨어진다. 최적 피드백이 왜 선형으로 나오는지 이해하려면 이 계산을 완전히 익혀야 한다.

23.2 미분법

함수를

\[F(\nu)=A\nu^2-B\nu+C\]

라고 두자. \(A>0\)이므로 \(F\)는 위로 볼록한 포물선이다. 따라서 임계점이 존재하면 그것이 곧 유일한 전역 최소점이다.

도함수는

\[F'(\nu)=2A\nu-B\]

이고, 최소점에서는 1차 조건 \(F'(\nu)=0\)가 성립해야 하므로

\[2A\nu-B=0.\]

이를 풀면

\[\nu^*=\frac{B}{2A}.\]

이 점이 실제로 최소점인지 확인하려면 2차 도함수를 보면 된다.

\[F''(\nu)=2A>0.\]

따라서 \(\nu^*=\tfrac{B}{2A}\)는 유일한 전역 최소점이다.

23.3 완전제곱법

같은 결론을 더 구조적으로 보이려면 완전제곱을 하자.

\[\begin{aligned} A\nu^2-B\nu+C &= A\Big(\nu^2-\frac{B}{A}\nu\Big)+C \\ &= A\Big[\nu^2-\frac{B}{A}\nu+\Big(\frac{B}{2A}\Big)^2\Big] + C - A\Big(\frac{B}{2A}\Big)^2 \\ &= A\Big(\nu-\frac{B}{2A}\Big)^2 + C - \frac{B^2}{4A}. \end{aligned}\]

첫 항은 제곱항이므로 항상 0 이상이고, 정확히

\[\nu=\frac{B}{2A}\]

일 때만 0이 된다. 따라서 최소값은

\[C-\frac{B^2}{4A}\]

이고, 최소점은

\[\nu^*=\frac{B}{2A}\]

이다.

23.4 AHFT 9장과의 연결

HJB 안의 control part는 보통

\[A(t,x)\nu^2 - B(t,x)\nu + C(t,x)\]

형태로 정리된다. 여기서

\(A(t,x)\)는 impact cost와 tracking penalty를 합친 양이고,
\(B(t,x)\)는 value gradient \(H_q\), inventory 관련 항, market volume 항 등을 묶은 양이다.

그러므로 최적제어는 자동으로

\[\nu^*(t,x)=\frac{B(t,x)}{2A(t,x)}\]

형태의 affine feedback이 된다. AHFT에서 최적거래속도가 “남은 inventory를 정리하는 TWAP/AC형 항 + volume target correction 항”으로 분해되는 것은 결국 이 완전제곱 계산의 직접적인 결과다.

24. OU conditional expectation와 누적평균

\[d\mu_t = \kappa(\bar\mu-\mu_t)dt + \eta dW_t\]

이라 하자.

24.1 미래 평균

이미 보였듯

\[\mathbb E[\mu_u\mid \mathcal F_t] = \bar\mu + (\mu_t-\bar\mu)e^{-\kappa(u-t)}.\]

24.2 누적평균

이제

\[\mathbb E\Big[\int_t^T \mu_u du \Big| \mathcal F_t\Big]\]

를 계산한다.

Fubini와 위 conditional mean을 쓰면

\[\mathbb E\Big[\int_t^T \mu_u du \mid \mathcal F_t\Big] = \int_t^T \mathbb E[\mu_u\mid \mathcal F_t]du.\]

따라서

\[= \int_t^T \Big(\bar\mu + (\mu_t-\bar\mu)e^{-\kappa(u-t)}\Big)du.\]

적분하면

\[= \bar\mu(T-t) + (\mu_t-\bar\mu)\int_t^T e^{-\kappa(u-t)}du.\]

변수변환 \(r=u-t\)로

\[\int_0^{T-t} e^{-\kappa r}dr = \frac{1-e^{-\kappa(T-t)}}{\kappa}.\]

따라서

\[\boxed{ \mathbb E\Big[\int_t^T \mu_u du \mid \mathcal F_t\Big] = \bar\mu(T-t) + (\mu_t-\bar\mu)\frac{1-e^{-\kappa(T-t)}}{\kappa} }.\]

이 식은 volume-targeting closed form의 핵심 building block이다.

25. 선형 PDE의 probabilistic representation

다음 PDE를 보자.

\[\partial_t u + b(x)u_x + \frac12\sigma^2(x)u_{xx} + f(t,x)=0, \qquad u(T,x)=g(x).\]

상태과정

\[dX_s = b(X_s)ds + \sigma(X_s)dW_s, \qquad X_t=x\]

를 두자.

25.1 진술

\[u(t,x)=\mathbb E\Big[g(X_T)+\int_t^T f(s,X_s)ds \Big].\]

25.2 증명

이 정리는 Feynman--Kac의 가장 기본적인 형태다. 핵심 아이디어는 단순하다. PDE의 좌변을 drift로 만들어 주는 과정을 설계하면, 그 과정이 martingale이 되고, martingale의 현재값과 미래값의 관계가 곧 확률표현이 된다.

이를 위해

\[Y_s := u(s,X_s)+\int_t^s f(r,X_r)dr, \qquad s\in[t,T]\]

를 정의한다. 이제 \(Y_s\)의 drift를 계산해 보자.

Itô 공식을 \(u(s,X_s)\)에 적용하면

\[\begin{aligned} du(s,X_s) &= u_t(s,X_s)ds + u_x(s,X_s)dX_s + \frac12u_{xx}(s,X_s)(dX_s)^2 \\ &= u_t(s,X_s)ds + u_x(s,X_s)\big(b(X_s)ds+\sigma(X_s)dW_s\big) \\ &\quad + \frac12u_{xx}(s,X_s)\sigma^2(X_s)ds. \end{aligned}\]

따라서

\[du(s,X_s) = \big(u_t + b u_x + \tfrac12\sigma^2u_{xx}\big)(s,X_s)ds + u_x(s,X_s)\sigma(X_s)dW_s.\]

이제 \(Y_s\)의 미분은

\[dY_s = du(s,X_s) + f(s,X_s)ds\]

이므로,

\[dY_s = \big(u_t + bu_x + \tfrac12\sigma^2u_{xx} + f\big)(s,X_s)ds + u_x(s,X_s)\sigma(X_s)dW_s.\]

그런데 \(u\)가 PDE

\[u_t + bu_x + \frac12\sigma^2u_{xx} + f = 0\]

를 만족하므로 drift 부분은 정확히 0이 된다. 따라서

\[dY_s = u_x(s,X_s)\sigma(X_s)dW_s.\]

적절한 적분가능성 하에 이 stochastic integral은 martingale이므로 \(Y\) 자체가 martingale이다. 따라서

\[Y_t = \mathbb E[Y_T\mid\mathcal F_t].\]

이제 양 끝을 계산하자. 시작시각에서는 \(X_t=x\)이므로

\[Y_t = u(t,X_t)+\int_t^t f(r,X_r)dr = u(t,x).\]

종료시각에서는 terminal condition 때문에

\[Y_T = u(T,X_T)+\int_t^T f(r,X_r)dr = g(X_T)+\int_t^T f(r,X_r)dr.\]

따라서

\[u(t,x) = \mathbb E\Big[g(X_T)+\int_t^T f(r,X_r)dr\,\big|\,\mathcal F_t\Big].\]

Markov setting에서 시각 \(t\)의 상태가 \(x\)로 주어지면 우변은 \((t,x)\)의 함수로만 결정되므로 보통

\[u(t,x)=\mathbb E_{t,x}\Big[g(X_T)+\int_t^T f(r,X_r)dr\Big]\]

라고 쓴다.

즉 probabilistic representation은 “PDE를 만족하는 함수의 drift를 0으로 만들어 martingale을 만든다”는 논리에서 나온다. AHFT 9장에서 \(h_1,h_0\) 같은 보조함수를 조건부기댓값으로 표현하는 과정도 정확히 이 틀 위에 서 있다.

25.3 jump 확장

jump generator가 있으면 Itô 공식에 jump term이 추가되고, PDE가 PIDE로 바뀔 뿐 논리는 동일하다. 예를 들어 jump size law가 \(\Pi(dz)\)이면 생성자는

\[\mathcal L u = bu_x + \frac12\sigma^2u_{xx} + \int \big(u(x+z)-u(x)\big)\Pi(dz)\]

처럼 적분항을 갖는다. 이 경우에도

\[Y_s := u(s,X_s)+\int_t^s f(r,X_r)dr\]

를 잡으면 jump-Itô 공식에 의해 drift가 사라져 martingale이 되고, 그 결과는 그대로 조건부기댓값 표현으로 내려온다.

26. Verification theorem의 증명 골격

최소화 문제라고 하자.

\[H(t,x)=\inf_{u\in\mathcal A} \mathbb E\Big[\int_t^T f(s,X_s^u,u_s)ds + g(X_T^u)\Big].\]

후보 \(\hat H\in C^{1,2}\)가 terminal condition

\[\hat H(T,x)=g(x)\]

과 HJB

\[0 = \inf_u\{\partial_t\hat H + \mathcal L^u\hat H + f(\cdot,u)\}\]

를 만족한다고 하자.

26.1 비교 부등식

최소화 문제에서는 후보함수가 실제 가치함수보다 작아지는지 커지는지 부호를 매우 조심해서 추적해야 한다. 따라서 식을 직접 밀어 보자.

임의의 admissible control \(u\)를 고정하고, 그 control 아래의 상태과정을 \(X_s^u\)라고 쓰자. Itô 공식에 의해

\[d\hat H(s,X_s^u) = (\partial_s\hat H + \mathcal L^u\hat H)(s,X_s^u)ds + dM_s\]

가 된다. 여기서 \(M_s\)는 martingale part다.

HJB가 inf 형태라는 것은, 특정한 control \(u\)를 대입했을 때 항상

\[\partial_s\hat H + \mathcal L^u\hat H + f(s,X_s^u,u_s) \ge 0\]

가 된다는 뜻이다. 따라서

\[\partial_s\hat H + \mathcal L^u\hat H \ge -f(s,X_s^u,u_s).\]

이를 Itô 공식에 넣으면

\[d\hat H(s,X_s^u) \ge -f(s,X_s^u,u_s)ds + dM_s.\]

이제 \(t\)부터 \(T\)까지 적분하면

\[\hat H(T,X_T^u)-\hat H(t,x) \ge -\int_t^T f(s,X_s^u,u_s)ds + M_T-M_t.\]

정리하면

\[\hat H(t,x) \le \hat H(T,X_T^u)+\int_t^T f(s,X_s^u,u_s)ds -(M_T-M_t).\]

기댓값을 취하면 martingale 증가분의 기대값은 0이므로

\[\hat H(t,x) \le \mathbb E\Big[\hat H(T,X_T^u)+\int_t^T f(s,X_s^u,u_s)ds\Big].\]

말단조건을 넣으면

\[\hat H(t,x) \le \mathbb E\Big[g(X_T^u)+\int_t^T f(s,X_s^u,u_s)ds\Big].\]

이 부등식이 모든 admissible \(u\)에 대해 성립하므로 inf를 취하면

\[\hat H(t,x) \le H(t,x).\]

즉 candidate는 실제 가치함수의 lower bound가 된다.

26.2 equality 달성

이제 어떤 feedback \(u^*(t,x)\)가 존재하여 HJB의 inf를 점wise로 달성한다고 하자. 즉

\[\partial_t\hat H + \mathcal L^{u^*}\hat H + f(\cdot,u^*)=0\]

가 성립한다고 하자. 그러면 위의 부등식이 equality가 되어

\[d\hat H(s,X_s^{u^*}) = -f(s,X_s^{u^*},u_s^*)ds + dM_s.\]

이를 적분하면

\[\hat H(T,X_T^{u^*})-\hat H(t,x) = -\int_t^T f(s,X_s^{u^*},u_s^*)ds + M_T-M_t.\]

즉

\[\hat H(t,x) = \hat H(T,X_T^{u^*})+\int_t^T f(s,X_s^{u^*},u_s^*)ds -(M_T-M_t).\]

기댓값을 취하면

\[\hat H(t,x) = \mathbb E\Big[g(X_T^{u^*})+\int_t^T f(s,X_s^{u^*},u_s^*)ds\Big].\]

즉 \(u^*\)는 candidate가 주는 값을 실제로 달성한다. 그런데 가치함수는 admissible controls 전체의 inf이므로

\[H(t,x) \le \mathbb E\Big[g(X_T^{u^*})+\int_t^T f(s,X_s^{u^*},u_s^*)ds\Big] = \hat H(t,x).\]

앞서 \(\hat H\le H\)를 이미 보였으므로, 양쪽을 합치면

\[\hat H(t,x)=H(t,x)\]

이다. 따라서 \(u^*\)는 최적제어다.

Part B — AHFT Chapter 9 본문

9.1 서론

집행 알고리즘은 대규모 주문이 유발하는 시장충격을 최소화하도록 설계된다. 앞선 장들에서 논의했듯이, 모(母)주문(parent order)을 여러 개의 자(子)주문(child order)으로 잘게 나누어 집행하는 것은 대부분의 알고리즘이 기대고 있는 핵심 원리이다. 각 자주문의 시장충격을 결정하는 불확실성의 한 원천은, 그 자주문의 거래량이 그 시점에 시장이 감당할 수 있는 거래량에 비해 얼마나 큰가 하는 점이다. 왜 그런지 보려면, 하나의 자주문을 집행하는 상황을 생각하면 된다. 자주문의 크기가 작다면, 그 주문은 지정가호가집합(limit order book, LOB)에서 최우선 호가(best quotes)를 넘어가지 않으며 일시적 시장충격도 거의 없거나 아주 작다. 반대로 주문 크기가 상당하다면, 주문은 LOB의 여러 층을 관통할 수 있고, 따라서 중간가격(midprice)에 비해 불리한 체결가격을 받게 된다. 더 나아가 주문 크기와 거래량의 관계를 제대로 설명하려면, 그 자주문이 도착하는 바로 그 시점이나 그 직전에 다른 주문들도 동시에 시장에 도달하고 있는지까지 함께 물어야 한다.

짧은 시간척도(수 초)에서는 시장가주문(market order, MO)의 충격이 여러 요인에 의해 결정되며, 그중에서도 LOB에 표시되어 있는 물량에 비한 주문 크기가 핵심적이다. 그러나 트레이더가 LOB에서 보는 정보는 자신의 주문이 시장에 도달할 때쯤이면 이미 바뀌어 있을 수 있다. 초고속 기술에 접근할 수 있는 트레이더라 하더라도 MO를 전송한 시점과 실제 체결 시점 사이에는 지연이 존재하므로, 그 사이 지정가주문(limit order, LO)이 표시하던 수량과 가격이 바뀔 위험에 노출된다. 이런 변화는 유동성 공급의 변화와 유동성 수요자의 활동 때문에 발생한다. 기존 LOs가 취소될 수도 있고 새로운 LOs가 추가될 수도 있으므로, 최우선 호가와 LOB의 깊이(depth)가 바뀐다. 마찬가지로 다른 MOs가 에이전트의 주문보다 먼저 도착하여 LOB에 쌓여 있던 유동성을 소진할 수도 있다. 따라서 에이전트의 자주문 크기는, 시장의 유동성 수요 측면에서 다른 모든 MOs가 에이전트의 주문과 합쳐졌을 때 LOB가 실제로 감당할 수 있는 양에 대해 상대적으로 결정된다.

긴 시간척도(수 분~수 시간)에서는 에이전트가 누적해서 보낸 주문들이 비정상적으로 한쪽 방향의 압력을 형성할 수 있고, 그 결과 추가적인 불리한 시장충격이 발생할 수 있다. 이상적으로는 에이전트가 자신의 주문을 위장(camouflage)하는 알고리즘을 설계함으로써, 시장가주문 흐름을 한쪽으로 과도하게 기울이는 일을 피할 수 있어야 한다. 이를 위한 한 방법은, 전략의 거래 구간 전체에 걸쳐 거래되는 총거래량의 일정 비율을 목표로 하는 거래속도를 선택하는 것이다.

여기에는 다음 두 가지 전략이 있다. 이들은 각각 아래의 일정 비율에 해당하는 주식 수를 집행하는 것을 목표로 한다.

다른 참여자들이 MOs를 보내는 속도(rate)
전체 거래 구간 동안 체결된 총거래량(total volume)

속도와 총거래량은 총거래량이 거래속도의 시간적 누적합이라는 점에서 서로 연결되어 있다. 그러나 이 둘을 목표로 할 때의 최적 집행전략은 상당히 다를 수 있다. (i)를 단순하게 겨냥하는 한 가지 방법은 직전 몇 초 또는 몇 분 동안 거래된 거래량을 관측하고, 이어지는 몇 초 또는 몇 분 동안 그 거래량의 일정 비율만큼 거래하는 것이다. 그러나 이 접근은 최적이 아니다. 에이전트의 주문이 다른 주문들과 합쳐질 때 발생하는 시장충격 문제를 다루지 못하기 때문이다.

(ii)를 목표로 하는 것은 더 어렵다. 계획된 집행 구간 전체에서 얼마만큼의 거래량이 체결될지는 사전에 알 수 없기 때문이다. 물론 직전 몇 초 동안 거래된 거래량의 일정 비율만큼 계속 거래하면 자연스럽게 (ii)도 어느 정도 따라가게 되지만, 그것이 최적인지는 별개의 문제다.

더 나아가, (i)와 (ii) 어느 쪽도 거래 구간이 끝날 때까지 에이전트가 목표로 한 물량을 전부 매수 또는 매도하는 목적과 완전히 양립하지 않는다. 거래량의 비율들을 시간에 걸쳐 합산한 값이 애초에 에이전트가 취득하거나 청산하려 했던 총주식 수와 정확히 일치할 것이라는 보장이 없기 때문이다.

거래량 벤치마크를 목표로 하는 거래 알고리즘은 실제로 매우 널리 사용된다. 가장 대표적인 벤치마크 중 하나가 거래량가중평균가격(Volume Weighted Average Price), 즉 VWAP 이다. 이 벤치마크는 이름 그대로 다음과 같이 계산된다.

\[\operatorname{VWAP}(T_1,T_2) = \frac{\int_{T_1}^{T_2} S_t\,dV_t}{\int_{T_1}^{T_2} dV_t}, \tag{9.1}\]

여기서 \(V_t\)는 시각 \(t\)까지 체결된 총거래량이고, \(S_t\)는 중간가격이며, \([T_1,T_2]\)는 VWAP를 측정하는 구간이다.

VWAP를 추적하는 것은 쉽지 않다. 어떤 기간 동안 실제로 얼마나 많은 주식이 거래될지를 미리 알기 어렵기 때문이다. 투자자들이 VWAP를 목표로 삼는 이유는, 대규모 포지션을 매수하거나 청산할 때 자신이 얻는 평균가격이 같은 기간 시장 전체가 거래한 평균가격에 가깝기를 원하기 때문이다. VWAP를 추적하는 한 가지 방법은 전략 (i)를 따르는 것이다. 매 순간 시장 전체 거래속도의 일정 비율을 추적하면, 곧 시장의 평균가격을 따라가게 되기 때문이다. 이상적으로, 에이전트의 전략이 계획된 거래 구간 전체에 걸쳐 집행 물량을 매끈하게 분산시키는 동시에 다른 시장참가자들의 거래속도의 일정 비율을 집요하게 추적한다면, 그녀가 집행한 주식들의 평균비용은 VWAP에 매우 가까워질 것이다.

이 장에서는 (i)와 (ii)를 목표로 하는 에이전트의 청산 문제를, 전체 물량을 완전히 또는 부분적으로 청산한다는 궁극적 목표와 양립하도록 정식화하고 푸는 방법을 보인다. (i)를 목표로 하는 전략은 흔히 거래량 비율 전략(percentage of volume, POV) 이라 불리고, (ii)를 목표로 하는 전략은 여기서 누적거래량 비율 전략(percentage of cumulative volume, POCV) 이라고 부르겠다.

POV와 POCV를 목표로 할 때의 중요한 위험원은, 다른 트레이더들의 MOs가 언제 어떤 크기로 도착할지를 미리 알 수 없다는 점이다. 이 불확실성은 집행 문제에 또 하나의 위험 차원을 추가한다. 그림 9.1은 2013년 4분기 동안 INTC(Intel Corporation)의 매수·매도 양측 전체 거래량을 5분 구간으로 집계하여 보여준다. 왼쪽 패널은 데이터의 히트맵과 중앙값(제2사분위수), 제1사분위수, 제3사분위수 추정치를 함께 보여준다. 거래가 전혀 없는 5분 구간도 존재하여 거래량이 0인 경우가 있기 때문에, 그림에서는 \(\log(1+\text{volume})\)를 사용한다. 오른쪽 패널은 함수적 데이터 분석(functional data analysis, FDA) 방식으로 데이터를 본 것으로, 거래량을 Legendre 다항식에 회귀한 결과(얇은 선들)를 보여준다. 그 회귀들의 평균이 파란 실선으로 표시되어 있는데, 이는 해당 종목의 하루 중 기대 거래량, 즉 평균적인 거래량 패턴을 나타낸다. 점들은 실제 데이터이다. 두 그림을 보면 거래량이 하루 중 시가와 장 마감 부근에서 높고 중간 시간대에서는 낮은 전형적인 U자형 패턴을 보이지만, 실제 실현 거래량은 이 일중 패턴에서 이탈하는 날들도 존재함을 알 수 있다.

그림 9.2는 그림 9.1과 동일한 데이터를 사용하지만, 거래량 대신 매수·매도 양측의 거래강도(intensity)를 보여준다. 각 5분 구간에서 강도 \(\lambda\)는 그 구간 동안 발생한 거래 건수로 계산한다. 역시 거래가 없는 구간이 있으므로 \(\log(1+\lambda)\)를 표시한다. 왼쪽 패널은 히트맵과 중앙값, 제1사분위수, 제3사분위수를 보여준다. 오른쪽 패널은 거래강도를 Legendre 다항식에 회귀한 FDA 그림으로, 파란 실선은 하루 전체에 걸친 기대 거래강도, 즉 평균적인 거래강도 곡선을 나타낸다. 점들은 실제 데이터이다. 예상대로 거래강도도 그림 9.1의 거래량과 유사한 패턴을 따른다.

이 장의 구성은 다음과 같다. 9.2절에서는 에이전트의 전략이 시장 전체 거래속도의 일정 비율을 목표로 할 때, 어떻게 최적으로 주식을 청산할 수 있는지 보인다. 시뮬레이션을 통해 POV의 일정 비율을 목표로 하는 전략이 평균 집행가격을 VWAP에 매우 가깝게 만들 수 있음을 확인한다. 9.3절에서는 에이전트가 POCV를 목표로 하면서 청산하는 경우를 다룬다. 9.4절에서는 에이전트 자신의 거래와 다른 시장참가자들의 거래가 모두 중간가격에 영구적 영향을 미치는 경우로 전략을 수정한다. 마지막으로 9.5절에서는 에이전트가 POV를 목표로 하면서도 지수가효용(exponential utility)을 통해 가격위험을 관리하는 방법을 보인다.

9.2 시장 전체 거래속도의 일정 비율을 목표로 하기

이 절에서는 에이전트의 집행전략이 다른 시장참가자들의 거래속도의 일정 비율을 목표로 한다고 가정하고, 오직 MOs만을 사용한 청산전략에 집중한다. 매수 문제도 거의 동일한 방식으로 설정된다. 청산 문제에서 에이전트는 최적 청산속도 \(v_t\)를 선택하여, 에이전트를 제외한 시장 전체가 거래하는 속도의 일정 비율 \(p\)를 목표로 한다. 이는 최적 청산속도를 단지 다른 시장참가자들의 거래속도의 일정 비율 이하로 상한 제약하는 전략과는 다르다. 아래의 성과기준을 쓰면 그 차이가 분명해진다. 에이전트의 재고과정 \(Q_t^v\)는

\[dQ_t^v=-v_t\,dt, \qquad Q_0^v=q\]

를 만족한다고 하자.

에이전트를 제외한 다른 모든 시장참가자들이 MOs로 주식을 매도하는 속도를 \(\mu_t\)라 하자. 이 매도속도는 짧은 시간 구간 동안 체결된 전체 주식 수를 합한 뒤 시간창 길이로 나누어 추정할 수 있다. 여기서는 \(\mu_t\)를 계산할 때 에이전트 자신의 거래속도는 포함하지 않는다고 가정한다. 에이전트 자신의 거래까지 포함한 전체 주문흐름의 일정 비율을 목표로 하는 경우는 연습문제 E.9.3으로 남겨 둔다. 따라서 에이전트의 목적이 매 순간 시장 거래속도 \(p\mu_t\)를 추적하는 최적 청산속도 \(v_t\)를 찾는 것이라면, \(0<p<1\) 아래에서 성과기준과 가치함수는 각각

\[H^v(t,x,S,\mu,q) = \mathbb E_{t,x,S,\mu,q} \left[ X_T^v+Q_T^v\bigl(S_T^v-\alpha Q_T^v\bigr) -\phi\int_t^T (v_u-p\mu_u)^2\,du \right], \tag{9.2}\]

및

\[H(t,x,S,\mu,q)=\sup_{v\in\mathcal A} H^v(t,x,S,\mu,q) \tag{9.3}\]

로 주어진다.

여기서 \(X_T^v\)는 만기 현금, \(\alpha\ge 0\)는 청산 미완료에 대한 벌점, \(\phi\ge 0\)는 목표 추적 벌점 계수이다. 이 설정에서는 목표로부터의 이탈이 \(\phi\int_t^T(v_u-p\mu_u)^2du\)에 의해 벌점화되지만, 이 벌점은 현금과정 자체를 바꾸지는 않는다. \(\phi\)가 크면 전략은 매 순간 목표 \(p\mu_t\)를 매우 가깝게 추적하도록 강하게 제약되고, \(\phi\)가 작으면 POV 목표를 덜 엄격하게 따라가게 된다.

에이전트의 거래속도 \(v_t\)는 자산가격에 일시적 충격과 영구적 충격을 모두 준다. 이 충격들이 \(v_t\)에 선형이라고 가정하면

\[dS_t^v=-b v_t\,dt+\sigma\,dW_t, \qquad S_0^v=S, \tag{9.4a}\]

\[\widehat S_t^v=S_t^v-kv_t, \qquad \widehat S_0^v=S, \tag{9.4b}\]

\[dX_t^v=\widehat S_t^v v_t\,dt, \qquad X_0^v=x, \tag{9.4c}\]

가 된다. 여기서 \(b\ge 0\), \(k\ge 0\)이다. 이 절에서는 다른 에이전트의 주문흐름 \(\mu_t\)는 중간가격에 영향을 주지 않는다고 가정한다. 9.4절에서는 모든 에이전트의 주문흐름이 중간가격에 영향을 미치는 경우를 다룬다.

9.2.1 거래속도 목표의 DPE 풀기

다른 에이전트들의 주문흐름 \(\mu_t\)가 마르코프이며, 다른 모든 과정, 특히 중간가격을 움직이는 브라운운동 \(W_t\)와 독립이라고 하자. 또한 그 무한소 생성자를 \(\mathcal L^{\mu}\)라 쓰자. 동적계획원리(dynamic programming principle)는 가치함수 \(H\)가 다음의 동적계획방정식(DPE)을 만족할 것임을 시사한다.

\[0 = \left(\partial_t+\tfrac12\sigma^2\partial_{SS}+\mathcal L^{\mu}\right)H +\sup_v\Bigl\{(S-kv)v\,\partial_x H-v\,\partial_qH-bv\,\partial_S H-\phi(v-p\mu)^2\Bigr\}, \tag{9.5}\]

경계조건은

\[H(T,x,S,\mu,q)=x+q(S-\alpha q)\]

이며, 극대화는

\[v^*= \frac{S\partial_xH-\partial_qH-b\partial_S H+2\phi p\mu}{2(k+\phi)} \tag{9.6}\]

에서 달성된다.

(9.5)를 풀기 위해 다음의 안자츠를 쓴다.

\[H(t,x,s,\mu,q)=x+qs+h(t,\mu,q). \tag{9.7}\]

이 식은 각각 지금까지 누적된 현금, 현재 중간가격으로 평가한 재고의 장부가치(mark-to-market book value), 그리고 남은 주식을 최적으로 청산함으로써 얻는 추가가치 \(h(t,\mu,q)\)를 뜻한다.

이 안자츠를 (9.5)에 대입하면 \(h(t,\mu,q)\)는 다음 방정식을 만족해야 한다.

\[0= \left(\partial_t+\mathcal L^{\mu}\right)h + \frac{1}{4(k+\phi)}\bigl(\partial_q h+bq-2\phi p\mu\bigr)^2 -\phi p^2\mu^2, \tag{9.8}\]

경계조건은

\[h(T,\mu,q)=-\alpha q^2\]

이다. 경계조건과 DPE가 모두 \(q\)에 대해 최대 이차식임을 관찰하면 다음 안자츠를 사용하는 것이 자연스럽다.

\[h(t,\mu,q)=h_0(t,\mu)+q\,h_1(t,\mu)+q^2 h_2(t,\mu). \tag{9.9}\]

그러면 최적 거래속도는 피드백 형태에서 크게 단순화되어

\[v_t^*=-\frac{h_1(t,\mu_t)}{2(k+\phi)}+\frac{Q_t^v}{(T-t)+\gamma}, \tag{9.12}\]

로 쓸 수 있다. 여기서 상수

\[\gamma=\frac{k+\phi}{\alpha-\tfrac12 b}\]

를 도입했다.

또한 이 안자츠를 DPE에 다시 대입하고, 다소 길지만 곧바른 계산을 수행한 뒤, \(q\)의 같은 차수 항들을 모아 각각 0으로 두면 문제는 다음의 결합된 PDE 계를 순차적으로 푸는 것으로 환원된다.

\[0=(\partial_t+\mathcal L^{\mu})h_2+ \frac{1}{k+\phi}\left(h_2+\tfrac12 b\right)^2, \qquad h_2(T,\mu)=-\alpha, \tag{9.10a}\]

\[0=(\partial_t+\mathcal L^{\mu})h_1+ \frac{1}{k+\phi}\left(h_2+\tfrac12 b\right)(h_1-2\phi p\mu), \qquad h_1(T,\mu)=0, \tag{9.10b}\]

\[0=(\partial_t+\mathcal L^{\mu})h_0+ \frac{1}{4(k+\phi)}(h_1-2\phi p\mu)^2-\phi p^2\mu^2, \qquad h_0(T,\mu)=0. \tag{9.10c}\]

각 방정식은 사실 비선형 원천항을 갖는 선형 PDE이며, 그 원천항은 다른 PDE들의 해로 주어진다. 또한 의존관계가 순차적이어서, \(h_2\)는 다른 함수들과 무관하게 먼저 풀 수 있고, \(h_1\)은 \(h_2\)만 알면 풀 수 있으며, \(h_0\)는 \(h_1\)만 알면 된다. 따라서 순서대로 해결하면 된다.

이제 (9.10a)를 보면 \(h_2\)의 방정식에는 \(\mu\)에 의존하는 원천항이 없고, 말단조건도 \(\mu\)와 무관하므로, 해 역시 \(\mu\)와 무관해야 한다. 그 해는

\[h_2(t)= -\bigl((T-t)+\gamma\bigr)^{-1}-\tfrac12 b \tag{9.11}\]

이다. 최적 거래속도는 \(h_0\)에는 의존하지 않으므로, 실제로는 (9.10c)를 풀 필요가 없다. 남은 핵심은 \(h_1(t,\mu)\)를 푸는 일이다. 여기서는 우선 그것이 주어졌다고 가정하고, 최적 거래속도와 최적 재고경로를 먼저 도출한다. 그런 다음 뒤의 절들에서 구체적인 모형 가정을 두어 \(h_1\)을 명시적으로 계산하고, 나아가 일반적인 경우의 확률표현도 제시한다.

(9.12)에 따르면 최적 거래속도는 두 항으로 분해된다. 오른쪽 두 번째 항은 6장에서 보았던 최적 청산 문제와 매우 유사한 TWAP형 전략이다. 예를 들어 6장의 식 (6.27)에서 실행 중 재고 패널티 계수를 0으로 두면, 정확히 (9.12) 오른쪽의 두 번째 항이 나온다. 그러므로 이 항은 TWAP류 전략이라고 볼 수 있다. \((\gamma=0)\)일 때만 정확한 TWAP가 되므로, 보다 정확히는 TWAP-유사(TWAP-like) 전략이라 부르는 편이 맞다. 오른쪽 첫 번째 항은 이 TWAP-유사 전략에 거래량 정보를 반영하는 보정항이다. 이 보정은 POV 목표 \(p\mu_t\)와, 거래량 과정의 동학을 주어졌을 때 최적전략이 어떻게 반응하는지를 인코딩하는 함수 \(h_1(t,\mu)\)에 의해 결정된다.

특정한 거래량 과정 \(\mu_t\)를 지정하기 전에, POV 전략의 일반적인 성질 몇 가지를 먼저 살펴보자. 경계조건 \(h_1(T,\mu)=0\)에 의해 만기 근방 \((T-t)\ll 1\)에서는 최적전략이

\[v_t^*=\frac{\phi p}{k+\phi}\mu_t+\frac{Q_t^v}{(T-t)+\gamma}+\text{(높은 차수의 작은 항)}\]

처럼 거동한다. 이로부터 두 개의 흥미로운 극한을 살펴볼 수 있다.

첫째, \(\alpha\to\infty\)로 보내어 에이전트가 거래 종료 시점까지 반드시 모든 주식을 집행해야 한다고 하자. 그러면 \(\gamma\to 0\)이다. 재고가 고정되어 있다고 보면, 만기가 가까워질수록 식의 두 번째 항이 지배적이 된다. 따라서 이 경우 에이전트는 POV 제약을 무시하고, 만기 부근에서는 TWAP에 가까운 방식으로 재고를 소진하는 데 집중한다. 물론 실제로는 재고 \(Q_t^v\) 자체도 시간에 따라 함께 변하므로, 그 항이 정말 지배적인지는 즉시 분명하지 않다. 아래에서 \(Q_t^v\)를 명시적으로 구하면, 실제로 만기 근처에서는 POV 제약이 무시된다는 사실을 확인하게 된다.

둘째, \(\alpha\)는 유한하게 두되 \(\phi\to\infty\)로 보내어 POV 목표에서 벗어나는 거래를 매우 강하게 벌점화하자. 그러면 \(\gamma\to\infty\)가 되어 TWAP-유사 항은 무시되고, 전략은 예상한 대로 거의 정확히 \(p\mu_t\)의 속도로 거래한다. 이 두 극한은 서로 교환 가능하지 않다. 둘은 본질적으로 서로 충돌하는 목적이기 때문이다. 다만 거래하려는 총물량이 실행 구간 전체에서 거래되는 총물량의 정확히 \(p\)%와 일치하는 경우에만 양립 가능하다.

이제 (9.12)의 최적 거래속도를 이용하여 최적 재고 \(Q_t^*\)의 표현을 얻자. \(dQ_t^*=-v_t^*dt\)이므로 적분인자법을 쓰면

\[Q_t^* = \frac{T-t+\gamma}{T+\gamma} \left( q+ \frac{1}{2(k+\phi)} \int_0^t \frac{T+\gamma}{T-s+\gamma}\,h_1(s,\mu_s)\,ds \right). \tag{9.13}\]

시각 \(t\)에서 보유해야 할 최적 재고 역시 두 성분으로 이루어진다. 첫 번째 항은 TWAP-유사 전략이고, 두 번째 항은 시장의 거래속도 변동을 반영하여 그 경로를 수정한다. 이제 이 일반적 틀을 바탕으로 거래량 동학을 구체적으로 설정하고, 최적 거래속도와 최적 재고경로에 대한 명시적 공식을 도출한다.

9.2.2 평균회귀적 확률 거래속도

그림 9.3은 2011년 1월 5일 10:00부터 10:30까지 AAPL의 분당 거래량 속도를 보여준다. 이 추정치는 30초 창과 10초 창에서 거래량을 세고 이를 1분 단위로 스케일하여 얻었다. 그림에서 보듯이, 거래량은 일정 시간 동안 burst처럼 급증했다가 다시 0을 향해 감쇠하는 경향을 보이므로, 짧은 시간 구간에서 거래속도를 추적하려는 에이전트에게는 다음과 같은 평균회귀적 모형이 자연스럽다.

\[d\mu_t=-\kappa\mu_t\,dt+\eta_{1+N_t}\,dN_t, \tag{9.14}\]

여기서 \(\kappa\ge 0\)는 평균회귀 속도, \(N_t\)는 강도 \(\lambda\)를 갖는 동질 포아송과정이고, \(\{\eta_1,\eta_2,\dots\}\)는 분포함수 \(F\)를 갖는 음이 아닌 i.i.d. 확률변수들로, 유한한 1차 모멘트를 가지며 \(N_t\)와 독립이다.

이 SDE의 해는

\[\mu_t=e^{-\kappa t}\mu_0+\int_0^t e^{-\kappa(t-u)}\eta_{1+N_u}\,dN_u = e^{-\kappa t}\mu_0+\sum_{m=1}^{N_t}e^{-\kappa(t-\tau_m)}\eta_m, \tag{9.15}\]

이다. 여기서 \(\tau_m\)은 포아송과정의 \(m\)번째 도착시각이다. 그림 9.2에서 보았듯이 거래 도착은 U자형 패턴을 따르므로, 더 정교하게는 드리프트에 결정론적 함수 성분을 추가하여 이 패턴을 반영할 수도 있다. 그러나 여기서는 단순화를 위해 거래속도가 항상 0으로 평균회귀한다고 가정한다. 다만 평균회귀점이 0이라고 해서 장기 기대값까지 0인 것은 아니다. 실제로 (9.15)로부터

\[\mathbb E[\mu_t]=e^{-\kappa t}\mu_0+\lambda\mathbb E[\eta]\frac{1-e^{-\kappa t}}{\kappa}\]

를 얻는다.

이 모형 하에서 주문흐름의 무한소 생성자는 가치함수에 다음과 같이 작용한다.

\[\mathcal L^{\mu}H(t,S,\mu,q) = -\kappa\mu\,\partial_{\mu}H +\lambda\mathbb E\bigl[H(t,S,\mu+\eta,q)-H(t,S,\mu,q)\bigr]. \tag{9.16}\]

이제 이 모형 가정 아래에서 (9.10b)를 푸는 함수 \(h_1\)을 구한다. 이 모형은 affine형이고 (9.10b)는 \(\mu\)에 대해 선형이므로, \(h_1(t,\mu)\) 역시 \(\mu\)에 대해 선형일 것으로 예상된다. 따라서

\[h_1(t,\mu)=\ell_0(t)+\ell_1(t)\mu\]

라고 두자. 말단조건 \(h_1(T,\mu)=0\)은 \(\ell_0(T)=\ell_1(T)=0\)을 뜻한다. 생성자 (9.16)를 \(h_1\)에 작용시키면 \(\psi=\lambda\mathbb E[\eta]\)를 두었을 때, 문제는 \(\ell_0\)와 \(\ell_1\)에 대한 두 개의 상미분방정식을 푸는 것으로 환원된다. 먼저 \(\ell_1\)의 방정식을 적분인자법으로 풀면

\[\ell_1(t)=2\phi p\left((T-t)+\gamma-\frac{1-e^{-\kappa(T-t)}}{\kappa}\right).\]

그 다음 이 결과를 다시 이용하여 \(\ell_0\)를 풀 수 있고, 계산을 마치면 최적 거래속도는

\[v_t^*= \frac{\phi p}{k+\phi}\mu_t + \frac{Q_t^*}{(T-t)+\gamma} + \frac{\ell_0(t)+\ell_1(t)\mu_t}{2(k+\phi)} \tag{9.17}\]

의 형태를 갖는다.

9.2.3 확률표현

이 절에서는 거래속도 \(\mu_t\)의 구체적 형태를 지정하지 않고, 다만 그것이 마르코프이고 중간가격을 움직이는 브라운운동과 독립이라는 일반적인 가정만으로 최적 청산전략을 구하는 방법을 보인다. 핵심은 Feynman--Kac 정리를 (9.10b)에 적용하여 \(h_1\)을 확률표현으로 쓰는 것이다. 그러면

\[h_1(t,\mu) = -\frac{2\phi p}{k+\phi} \,\mathbb E_{t,\mu} \left[ \int_t^T \exp\left\{\frac{1}{k+\phi}\int_t^u\left(h_2(s)+\tfrac12 b\right)ds\right\} \left(h_2(u)+\tfrac12 b\right)\mu_u\,du \right]\]

가 된다. 이후 적분인자 안에서 일어나는 상쇄를 정리하면 \(h_1\)은 더 간결하게

\[h_1(t,\mu) = 2\phi p\left[ \mu- \frac{1}{(T-t)+\gamma} \mathbb E_{t,\mu}\left[\int_t^T \mu_u\,du\right] \right] \tag{9.18}\]

로 쓸 수 있다.

여기서 나타나는 적분은 남은 거래구간 동안의 기대 총거래량과 정확히 일치한다. 즉 미래의 거래속도 \(\mu_u\)를 \(t\)부터 \(T\)까지 적분한 것이므로, 이 식은 남은 시간 전체에 걸친 예상 거래량을 의미한다. 또한 이 적분을 \(((T-t)+\gamma)^{-1}\)로 나눈 항은 남은 구간의 기대 평균 거래속도에 해당한다. 만약 \(k=\phi=0\)이거나 혹은 \(\alpha\to\infty\)라면, 이 값은 정확히 남은 구간의 평균 기대 거래속도와 일치한다.

이 일반형의 \(h_1\)을 이용하면 에이전트의 최적 거래속도는

\[v_t^* = \frac{\phi p}{k+\phi}\mu_t - \frac{\phi p}{k+\phi}\frac{1}{(T-t)+\gamma} \mathbb E\left[\int_t^T \mu_u\,du\mid\mathcal F_t^{\mu}\right] + \frac{Q_t^*}{(T-t)+\gamma} \tag{9.19}\]

로 표현된다. 여기서 조건부기댓값은 \(\mu\)가 생성하는 필트레이션 \(\mathcal F_t^{\mu}\)에 대해 취한다. 최적 재고 역시

\[Q_t^* = \frac{T-t+\gamma}{T+\gamma} q - \frac{\phi p}{k+\phi} \frac{1}{T+\gamma} \int_0^t \mathbb E\left[\int_s^T \mu_u\,du\mid\mathcal F_s^{\mu}\right]ds \tag{9.20}\]

처럼 간결하게 쓸 수 있다.

이 전략의 직관을 이해하려면, 성과기준 (9.2)에 서로 경쟁하는 두 목표가 들어 있다는 점을 보아야 한다. 한편으로 전략은 \(T\)까지 \(q\)주를 모두 청산하려 하고, 다른 한편으로는 다른 시장참가자들의 거래속도의 일정 비율을 따라가려 한다. 오직 초기 재고가 거래구간 전체에서 거래될 총거래량의 정확히 \(p\)%에 해당할 때만 이 두 목표가 서로 양립한다.

최적 거래속도를 다시 쓰면

\[v_t^*= \underbrace{\frac{\phi p}{k+\phi}\mu_t}_{\text{현재 POV 목표를 따르는 항}} + \underbrace{\frac{1}{(T-t)+\gamma}\left(Q_t^*- \frac{\phi p}{k+\phi} \mathbb E\left[\int_t^T \mu_u\,du\mid\mathcal F_t^{\mu}\right] \right)}_{\text{남은 재고를 균등하게 소진하는 TWAP형 보정 항}}. \tag{9.21}\]

첫 번째 항은 일시적 충격비용 \(k\)와 POV 미준수 벌점 \(\phi\) 사이의 절충을 반영하여, 현재 시점의 POV 목표를 어느 정도 강도로 따라가야 하는지를 보여준다. \(\phi\to\infty\)이거나 \(k\to 0\)이면 이 계수는 정확히 \(p\)에 가까워진다. 두 번째 항은 TWAP류 전략이지만, 이미 첫 번째 항을 통해 앞으로 POV 목표의 일부가 달성될 것임을 감안하여, 남은 재고에서 앞으로 POV 목표를 통해 자연스럽게 소화될 것으로 기대되는 물량을 차감한 뒤 균등하게 배분하는 역할을 한다.

극한을 보면 더 분명해진다. \(\phi\to\infty\)이면

\[v_t^*\to p\mu_t,\]

즉 전략은 오로지 POV만을 추적한다. 이 경우 실제로 청산되는 주식 수는 초기 목표보다 많을 수도 적을 수도 있다. 남거나 부족한 재고는 만기에 시장가주문으로 정리되며 유한한 말단 벌점만 부담한다. 반대로 \(\alpha\to\infty\)로 보내어 완전 청산을 강제하면 \(\gamma\to 0\)이므로, 전략은 POV를 완벽히 맞추는 것보다 남은 물량을 끝까지 소진하는 것을 우선시한다. 특히 다른 참여자들의 거래속도가 상수라면, POV 보정항들이 서로 상쇄되어 전략은 정확히 TWAP가 된다.

9.2.4 시뮬레이션

이 절에서는 9.2.2절의 평균회귀 거래속도 모형에 대해 최적전략을 시뮬레이션한다. 특히 먼저 \(\alpha\to\infty\)로 보내어 재고가 반드시 모두 청산되도록 하고, 이어서 \(\phi\to\infty\)로 보내어 전략이 POV에 매우 가깝게 거래하도록 만드는 이중 극한에 초점을 맞춘다. 이 경우 최적 거래속도는

\[v_t^*=p\left[ \mu_t- \frac{1-e^{-\kappa(T-t)}}{\kappa(T-t)}\left(\mu_t-\frac{\psi}{\kappa}\right)+\frac{\psi}{\kappa} \right]+ \frac{Q_t^*}{T-t},\]

와 같은 형태를 갖는다. 여기서 \(\psi=\lambda\mathbb E[\eta]\)이므로, 장기 기대 거래속도는 \(\mathbb E[\mu_t]=\psi/\kappa\)이다.

시뮬레이션에서는 다음의 모형 파라미터를 사용한다.

\[S_0=20, \qquad \sigma=0.5, \qquad T=1,\]

\[\mu_0=\psi/\kappa, \qquad \eta\sim \mathrm{Exp}(10), \qquad \lambda=50, \qquad \kappa=20,\]

\[k=0.1, \qquad b=0.1, \qquad p=0.05.\]

에이전트는 거래구간 전체에 시장에 도달할 것으로 기대되는 거래량의 \(p\)%를 청산하려 한다고 가정하므로,

\[q=pT\frac{\psi}{\kappa}=1.25\]

이다. 여기서 지수분포의 파라미터화는 \(\mathbb E[\eta]=10\)이 되도록 잡는다.

그림 9.4는 다른 시장참가자들의 거래속도 \(\mu_t\), 최적 거래속도 \(v_t^*\), 최적 거래속도와 목표속도의 차이 \(v_t^*-p\mu_t\), 그리고 에이전트 재고 \(Q_t^*\)의 세 개 표본경로를 보여준다. 좌하단 패널의 점선은 기대 거래속도 \(\psi/\kappa\)이고, 우하단 패널의 점선은 TWAP이다. 그림에서 보듯 \(v_t^*\)와 \(\mu_t\)는 매우 강하게 상관된다. 실제로 그림 9.5의 왼쪽 패널은 10,000개의 표본경로에 대해 시계열로 본 \(v_t^*\)와 \(\mu_t\)의 상관계수 히스토그램을 보여준다. 평균 상관계수는 0.88로 매우 높아, 전략이 주문흐름을 실제로 잘 추적함을 보여준다. 다만 목표속도 \(p\mu_t\)와 완전히 일치하지는 않는다. 이러한 편차는 특히 거래구간 말미에서 두드러지는데, 그때는 에이전트의 최우선 관심이 재고를 0으로 만드는 것이고, 다른 참여자들의 거래속도를 추적하는 목적은 상대적으로 뒤로 물러나기 때문이다.

또한 그림 9.5의 오른쪽 패널은 주당 평균 집행가격과 VWAP의 차이를 보여준다. 서론에서 설명했듯이, 거래량의 일정 비율 \(p\)를 면밀히 추적하면 평균적으로 VWAP를 잘 따라가는 전략이 된다. 실제로 VWAP 주위의 편차는 거의 대칭적이며(왜도 0.06), 평균은 \(-1.4\times 10^{-4}\), 표준오차는 \(\pm 3\times 10^{-4}\)이다.

그림 9.6은 에이전트 거래속도와 재고의 히트맵을 보여주며, 점선은 5%, 50%, 95% 분위수를 나타낸다. 흥미롭게도 재고의 중앙경로는 TWAP이지만, 에이전트는 POV 목표를 맞추려는 과정에서 그 경로보다 위나 아래로 벗어날 수 있다. 최적 거래속도의 중앙경로는 시간에 따라 거의 일정하지만, 그 모드(mode)는 만기에 가까워질수록 다소 증가하는 경향을 보인다. 이는 전략이 초반에는 TWAP보다 약간 느리게 거래하다가, 후반부에 따라잡기 위해 더 빠르게 거래하는 약한 편향을 가지고 있음을 시사한다.

9.3 누적거래량의 일정 비율을 목표로 하기

이 절에서는 에이전트의 집행전략이 누적거래량의 일정 비율, 즉 POCV를 목표로 하고, 청산전략은 오직 MOs에만 의존한다고 가정한다. 이제 에이전트를 제외한 다른 시장참가자들의 매도 주문의 누적거래량 \(V_t\)는

\[V_t=\int_0^t \mu_u\,du\]

로 주어진다. 여기서 역시 \(\mu_t\)는 다른 시장참가자들의 거래속도이다.

에이전트의 성과기준은 이제 다음과 같이 수정된다.

\[H^v(t,x,S,\mu,V,q) = \mathbb E_{t,x,S,\mu,V,q} \left[ X_T^v+Q_T^v\bigl(S_T^v-\alpha Q_T^v\bigr) -\phi\int_t^T \bigl((q-Q_u^v)-pV_u\bigr)^2du \right]. \tag{9.22}\]

여기서 \(q\)는 거래종료 시점 \(T\)까지 에이전트가 청산하고자 하는 총주식 수이다.

달리 말해, running target penalty

\[\phi\int_t^T \bigl((q-Q_u^v)-pV_u\bigr)^2du\]

는 에이전트가 실제로 지불하는 금융비용이 아니다. 그 목적은 시각 \(t\)까지 이미 청산한 주식 수 \(q-Q_t^v\)가, 시장 전체가 같은 시점까지 매도한 누적거래량의 \(p\)%인 \(pV_t\)에서 너무 멀어지지 않도록 최적 청산속도를 유도하는 데 있다. 예컨대 \(\phi\to\infty\)이면 최적전략은 모든 시점에서 이미 청산된 주식 수가 정확히 \(pV_t\)와 같아지도록 강제된다. 따라서 에이전트는 자기 자신의 누적 MOs가 시장 전체 누적 매도량의 일정 비율 \(0<p<1\)이 되도록 전략을 짜게 된다. 앞 절과 마찬가지로, 이 설정에서도 에이전트 자신의 거래는 누적거래량에 포함하지 않는다.

가치함수는

\[H(t,x,S,\mu,V,q)=\sup_{v\in\mathcal A}H^v(t,x,S,\mu,V,q) \tag{9.23}\]

이고, 현금과정 \(X_t^v\), 통제된 중간가격 \(S_t^v\), 집행가격 \(\widehat S_t^v\)는 앞의 (9.4)와 동일한 방정식을 따른다. 동적계획원리를 적용하면 가치함수는 다음 DPE를 만족해야 한다.

\[0= (\partial_t+\mathcal L^{S,\mu,V})H -\phi\bigl((q-Q)-pV\bigr)^2 + \sup_v\{-bv\partial_S H+(S-kv)v\partial_xH-v\partial_qH\}, \tag{9.24}\]

말단조건은

\[H(T,x,S,\mu,V,q)=x+q(S-\alpha q)\]

이다. 여기서 \(\mathcal L^{S,\mu,V}\)는 결합과정 \((S_t,\mu_t,V_t)\)의 무한소 생성자이다. 또한 거래속도 \(\mu_t\), 즉 총거래량 \(V_t\)는 자산의 중간가격과 독립이라고 가정한다.

1차 조건으로부터 최적 거래속도는 피드백 형태에서

\[v^*=\frac{1}{2k}\bigl(S\partial_xH-\partial_qH-b\partial_S H\bigr)\]

를 만족한다. 경계조건을 보면 다음 안자츠를 쓰는 것이 자연스럽다.

\[H(t,x,S,\mu,V,q)=x+qS+h(t,\mu,V,q). \tag{9.25}\]

그러면 \(h(t,\mu,V,q)\)는

\[0= (\partial_t+\mathcal L^{\mu,V})h+ \frac{1}{4k}\bigl(\partial_qh+bq\bigr)^2 -\phi\bigl((q-Q)-pV\bigr)^2, \tag{9.26}\]

를 만족해야 하며, 말단조건은 \(h(T,\mu,V,q)=-\alpha q^2\)이다. 여기서 \(\mathcal L^{\mu,V}\)는 중간가격을 제외한 과정 \((\mu_t,V_t)\)의 생성자이다.

이 비선형 방정식은 \(q\)에 관해 다시 이차 안자츠를 쓰면 더 줄일 수 있다.

\[h(t,\mu,V,q)=h_0(t,\mu,V)+h_1(t,\mu,V)q+h_2(t,\mu,V)q^2,\]

경계조건은

\[h_0(T,\mu,V)=h_1(T,\mu,V)=0, \qquad h_2(T,\mu,V)=-\alpha.\]

이를 (9.26)에 대입한 뒤 같은 차수의 \(q\)항들을 모아 정리하면, \(h_0,h_1,h_2\)는 다음의 결합된 PIDEs를 만족한다.

\[0=(\partial_t+\mathcal L^{\mu,V})h_2+ \frac{1}{k}\left(h_2+\tfrac12 b\right)^2-\phi, \tag{9.27a}\]

\[0=(\partial_t+\mathcal L^{\mu,V})h_1+ \frac{1}{k}\left(h_2+\tfrac12 b\right)h_1+2\phi(q-pV), \tag{9.27b}\]

\[0=(\partial_t+\mathcal L^{\mu,V})h_0+ \frac{1}{4k}h_1^2-\phi(q-pV)^2. \tag{9.27c}\]

앞 절과 마찬가지로 이 계 역시 순차적으로 풀린다. 특히 \(h_2\)의 식에는 \(V\)가 나타나지 않고 말단조건도 \(V\)와 무관하므로 \(h_2\) 역시 \(V\)와 무관해야 한다. 따라서 \(h_2\)는 리카티 방정식

\[0=\partial_t h_2+\frac1k\left(h_2+\tfrac12 b\right)^2-\phi\]

을 풀면 된다. 이 해는 6장의 유사한 계산과 같은 방식으로 다음과 같이 얻어진다.

\[h_2(t)=\zeta\frac{1+\xi e^{2\zeta(T-t)}}{1-\xi e^{2\zeta(T-t)}}-\tfrac12 b, \tag{9.28}\]

여기서

\[\zeta=\sqrt{k\phi}, \qquad \xi=\frac{\alpha-\tfrac12 b-\zeta}{\alpha-\tfrac12 b+\zeta}. \tag{9.29}\]

남은 것은 \(h_1\)을 푸는 일인데, 여기서는 우선 그 해가 주어졌다고 보고 최적 거래속도의 형태만 정리한다. 최적 거래속도는

\[v_t^*=-\frac{h_1(t,\mu_t,V_t)}{2k}-\frac{h_2(t)}{k}Q_t^*, \tag{9.30}\]

로 나타난다. 따라서 이 전략 역시 두 부분으로 분해된다. 두 번째 항은 Almgren--Chriss(AC)형 최적 청산과 유사한 항이고, 첫 번째 항은 그 경로를 거래량과 누적거래량 정보로 보정하는 역할을 한다. 이 보정의 구체적 형태는 \(\mu\)와 \(V\)의 모형에 따라 달라지지만, 언제나 \(h_1(T,\mu,V)=0\)이므로 만기가 가까워질수록 그 중요성은 줄어들고 전략은 점점 AC 해에 가까워진다.

재고방정식 \(dQ_t^*=-v_t^*dt\)를 적분인자법으로 풀면

\[Q_t^*=e^{-\int_0^t \frac{h_2(u)+\tfrac12 b}{k}du} \left( q+ \frac1{2k}\int_0^t e^{\int_0^u \frac{h_2(s)+\tfrac12 b}{k}ds}h_1(u,\mu_u,V_u)du \right). \tag{9.31}\]

(9.28)을 사용해 적분인자를 계산하면 보다 명시적인 표현이 나와, 결국

\[Q_t^*=\frac{e^{\zeta(T-t)}-\xi e^{-\zeta(T-t)}}{e^{\zeta T}-\xi e^{-\zeta T}}q + \frac1{2k}\int_0^t \frac{e^{\zeta(T-t)}-\xi e^{-\zeta(T-t)}}{e^{\zeta(T-u)}-\xi e^{-\zeta(T-u)}} h_1(u,\mu_u,V_u)\,du \tag{9.35}\]

를 얻는다. 이 표현에서 첫 번째 항은 AC류 최적 보유량이고, 두 번째 항은 거래량 변동에 따른 보정항이다. 특히 \(\alpha\to\infty\)이면 \(\xi\to 1\)이므로,

\[Q_t^*\to \frac{\sinh(\zeta(T-t))}{\sinh(\zeta T)}q + \frac1{2k}\int_0^t \frac{\sinh(\zeta(T-t))}{\sinh(\zeta(T-u))} h_1(u,\mu_u,V_u)\,du.\]

아래에서는 먼저 누적거래량이 compound Poisson 과정인 경우를 다루고, 이어서 거래속도 자체가 OU류 평균회귀 과정인 경우를 다룬다. 마지막으로 9.3.3절에서 특정 함수형을 가정하지 않는 일반형을 제시한다.

9.3.1 누적거래량의 compound Poisson 모형

앞 절에서 설명했듯이, 거래량은 burst 형태로 도착하는 경향이 있으므로 누적거래량을 marked point process로 모델링하는 것이 자연스럽다. 즉

\[V_t=\sum_{n=1}^{N_t}\eta_n, \tag{9.36}\]

라고 두자. 여기서 \(N_t\)는 강도 \(\lambda\)를 갖는 동질 포아송과정이고, \(\{\eta_1,\eta_2,\dots\}\)는 분포함수 \(F\)와 유한한 1차 모멘트를 갖는 음이 아닌 i.i.d. 확률변수들이다. 이들은 \(N_t\) 및 중간가격을 움직이는 브라운운동과 서로 독립이다. 이 경우에는 더 이상 별도의 거래속도 과정 \(\mu_t\)는 등장하지 않고, 가치함수는 \(t,x,S,V,q\)의 함수가 된다.

이 모형에서 \(V\)의 생성자는

\[\mathcal L^V H(t,x,S,V,q) = \lambda\mathbb E\bigl[H(t,x,S,V+\eta,q)-H(t,x,S,V,q)\bigr] \tag{9.37}\]

로 주어진다. 따라서 앞 절에서 얻은 최적전략의 일반형 가운데, 모형에 의존하는 부분은 \(h_1(t,V)\)를 푸는 일로 환원된다. 이 함수는

\[0= \partial_t h_1+ \lambda\mathbb E[h_1(t,V+\eta)-h_1(t,V)] + \frac{1}{k}\left(h_2+\tfrac12 b\right)h_1-2\phi(pV-q) \tag{9.38}\]

를 만족한다. 원천항이 \(V\)에 대해 선형이므로

\[h_1(t,V)=\rho_0(t)+\rho_1(t)V\]

라는 안자츠를 사용하면 된다. 말단조건은 \(h_1(T,V)=0\)이므로 \(\rho_0(T)=\rho_1(T)=0\)이다. 이를 대입하면 두 개의 ODE로 환원되고, 적분인자법으로 풀면 \(\rho_1(t)\), 나아가 \(\rho_0(t)\)를 명시적으로 얻을 수 있다. 이를 다시 (9.30)과 (9.35)에 대입하면 compound Poisson 거래량 하에서의 최적 거래속도와 최적 재고경로의 닫힌형식을 얻는다.

9.3.2 평균회귀적 확률 거래속도

이 절에서는 9.2.2절에서 사용한 평균회귀 거래속도 모형을 다시 채택한다. 즉 누적거래량은

\[V_t=\int_0^t \mu_u\,du, \tag{9.40}\]

이고, 거래속도는 다시

\[d\mu_t=-\kappa\mu_tdt+\eta_{1+N_t}dN_t\]

를 따른다. 앞에서 유도한 최적전략의 일반형에서 모형에 따라 달라지는 부분은 다시 \(h_1(t,\mu,V)\)이다. 지금의 생성자는 affine형이고 말단조건도 상수이므로, 다음과 같은 affine 안자츠가 자연스럽다.

\[h_1(t,\mu,V)=\varepsilon_0(t)+\varepsilon_1(t)\mu+\varepsilon_2(t)V, \tag{9.41}\]

말단조건은 \(\varepsilon_i(T)=0\)이다. 이를 (9.27b)에 대입하면 세 개의 ODE 계

\[0=\partial_t\varepsilon_1+\frac1k\left(h_2+\tfrac12 b\right)\varepsilon_1-2\phi p, \tag{9.42a}\]

\[0=\partial_t\varepsilon_2+\left(\frac1k\left(h_2+\tfrac12 b\right)-\kappa\right)\varepsilon_2+\varepsilon_1, \tag{9.42b}\]

\[0=\partial_t\varepsilon_0+\lambda\mathbb E[\eta]\,\varepsilon_2+ \frac1k\left(h_2+\tfrac12 b\right)\varepsilon_0+2\phi q \tag{9.42c}\]

를 얻는다. 9.3.1절과 같은 적분인자 계산을 반복하면 \(\varepsilon_1(t)\), \(\varepsilon_2(t)\), \(\varepsilon_0(t)\)를 순서대로 구할 수 있고, 다시 이를 최적 거래속도와 재고식에 대입하여 명시적 전략을 얻는다.

9.3.3 확률표현

앞의 두 절에서는 두 가지 구체적인 거래량 모형을 사용하여 명시적 해를 구했다. 그러나 실제로는 더 일반적인 설정에서도 \(h_1\)의 일반형을 얻을 수 있다. 다시 말해 \(h_1\)은 다음 선형 PIDE를 만족한다.

\[0=(\partial_t+\mathcal L^{\mu,V})h_1+ \frac1k\left(h_2+\tfrac12 b\right)h_1+2\phi(q-pV),\]

말단조건은 \(h_1(T,\mu,V)=0\)이다. 여기서 \(h_2\)는 시간에 대한 결정론적 함수로 이미 (9.28)에 의해 주어져 있다. 이 방정식은 유효 할인율(effective discount rate) \(h_2+\tfrac12 b\)와 원천항 \(2\phi(q-pV)\)를 갖는 선형 PIDE이므로, Feynman--Kac 정리에 의해 해는

\[h_1(t,\mu,V) = 2\phi\,\mathbb E_{t,\mu,V} \left[ \int_t^T \exp\left\{\frac1k\int_t^u\left(h_2(s)+\tfrac12 b\right)ds\right\} (q-pV_u) \,du \right]\]

로 표현된다. 적분인자를 정리하면

\[h_1(t,\mu,V) = 2\phi\int_t^T g(t,u)\bigl(q-p\,\mathbb E_{t,\mu,V}[V_u]\bigr)du, \tag{9.45}\]

여기서

\[g(t,u)= \frac{e^{\zeta(T-u)}-\xi e^{-\zeta(T-u)}}{e^{\zeta(T-t)}-\xi e^{-\zeta(T-t)}}\]

이다. 이 표현을 최적전략에 넣으면 POCV를 목표로 하는 에이전트의 최적 거래속도는

\[v_t^*= \frac{1}{2k} \left[ -h_1(t,\mu_t,V_t)-2h_2(t)Q_t^* \right] \tag{9.46}\]

이 되며, 그 안의 \(h_1\)은 위와 같이 기대 누적거래량으로 표현된다.

이 결과의 직관은 \(\alpha\to\infty\) 극한에서 특히 잘 드러난다. 이 경우 첫 번째 항은 고전적인 AC 전략이고, 두 번째 항은 현재까지의 누적거래량과 앞으로의 기대 누적거래량을 반영하여 그 경로를 위아래로 조정하는 역할을 한다.

9.4 다른 트레이더들의 영향을 포함하기

지금까지는 다른 트레이더들의 거래량은 중간가격을 움직이지 않고, 청산하는 에이전트 자신의 거래만 가격에 영향을 준다고 가정했다. 이는 다소 비일관적이다. 이 절에서는 에이전트를 포함한 모든 시장참가자들의 MOs가 중간가격에 영구적 영향을 준다고 가정한다. 즉 중간가격은

\[dS_t=b\bigl(\mu_t^+-(v_t+\mu_t^-)\bigr)dt+\sigma dW_t \tag{9.47}\]

를 따른다. 여기서 \(\mu_t^+\)와 \(\mu_t^-\)는 각각 다른 트레이더들이 보낸 매수·매도 시장가주문의 거래속도이고, \(v_t>0\)는 에이전트의 청산속도이다. 만약 에이전트가 매도 대신 매수를 하고 있었다면, 그녀의 거래속도는 드리프트에서 빼는 대신 더해졌을 것이다. 또한 \(b>0\)는 거래가 중간가격에 미치는 영구충격의 크기이다. 집행가격은 이전과 마찬가지로

\[\widehat S_t=S_t-kv_t\]

라고 가정한다.

이 절에서는 에이전트가 매도 측 거래속도의 일정 비율을 추적한다고 가정한다. 누적거래량을 목표로 하는 경우는 연습문제 E.9.3으로 남긴다. 이 경우 성과기준은

\[H^v(t,x,S,\mu,q) = \mathbb E_{t,x,S,\mu,q} \left[ X_T^v+Q_T^v(S_T-\alpha Q_T^v)-\phi\int_t^T (v_u-p\mu_u^-)^2du \right]\]

이고, 가치함수는

\[H(t,x,S,\mu,q)=\sup_{v\in\mathcal A}H^v(t,x,S,\mu,q)\]

이다. 동적계획원리에 따라 가치함수는 다음 DPE를 만족해야 한다.

\[0= \left(\partial_t+\tfrac12\sigma^2\partial_{SS}+\mathcal L^{\mu}\right)H + \sup_v\Bigl\{(S-kv)v\partial_xH-v\partial_qH+b(\mu^+-\mu^- -v)\partial_SH-\phi(v-p\mu^-)^2\Bigr\}.\]

이 DPE는 9.2절의 (9.5)와 비교하면 \(b(\mu^+-\mu^-)\partial_S H\) 항만 새로 추가된 것이다. 이 항은 피드백 최적화 자체의 1차조건을 직접 바꾸지는 않지만, 가치함수의 형태를 바꾸고 따라서 최적전략의 명시적 표현을 바꾼다.

다시

\[H(t,x,S,\mu,q)=x+qS+h(t,\mu,q)\]

라는 안자츠를 쓰면, \(h\)는

\[0=(\partial_t+\mathcal L^{\mu})h+b(\mu^+-\mu^-)q+ \frac{1}{4(k+\phi)}\bigl(\partial_q h+bq-2\phi p\mu^-\bigr)^2- \phi p^2(\mu^-)^2\]

를 만족한다. 9.2절의 경우와 비교하면 차이는 \(b(\mu^+-\mu^-)q\)가 추가되었다는 점이다. 즉 이제 에이전트는 단순히 매도 흐름만이 아니라 순주문흐름(order imbalance) 이 미래 가격에 어떤 방향성 압력을 줄지를 함께 고려해야 한다.

다시

\[h(t,\mu,q)=h_0(t,\mu)+h_1(t,\mu)q+h_2(t,\mu)q^2\]

라는 안자츠를 사용하면, \(h_i\)는 다음의 결합계

\[0=(\partial_t+\mathcal L^{\mu})h_2+\frac{1}{k+\phi}\left(h_2+\tfrac12 b\right)^2, \tag{9.50a}\]

\[0=(\partial_t+\mathcal L^{\mu})h_1+b(\mu^+-\mu^-)+ \frac{1}{k+\phi}\left(h_2+\tfrac12 b\right)(h_1-2\phi p\mu^-), \tag{9.50b}\]

\[0=(\partial_t+\mathcal L^{\mu})h_0+ \frac{1}{4(k+\phi)}(h_1-2\phi p\mu^-)^2-\phi p^2(\mu^-)^2 \tag{9.50c}\]

를 만족한다. \(h_2\)의 방정식은 앞과 완전히 동일하므로 해는 다시

\[h_2(t)= -((T-t)+\gamma)^{-1}-\tfrac12 b\]

이다. 따라서 새로운 효과는 전적으로 \(h_1\)에 압축된다.

9.4.1 확률표현

일반적인 경우에 대해서도 다시 Feynman--Kac를 사용할 수 있다. 그러면 (9.50b)의 해는

\[h_1(t,\mu) = \mathbb E_{t,\mu} \left[ \int_t^T \exp\left\{\frac{1}{k+\phi}\int_t^u\left(h_2(s)+\tfrac12 b\right)ds\right\} \bigl(-2\phi p(h_2(u)+\tfrac12 b)\mu_u^-+b(\mu_u^+-\mu_u^-)\bigr) \,du \right]\]

로 쓸 수 있다. 적분인자를 정리하면

\[h_1(t,\mu) = -\frac{2\phi p}{(T-t)+\gamma}\int_t^T \mathbb E_{t,\mu}[\mu_u^-]du + \frac{b}{(T-t)+\gamma}\int_t^T \bigl((T-u)+\gamma\bigr)\mathbb E_{t,\mu}[\mu_u^+-\mu_u^-]du.\]

이를 최적 거래속도에 대입하면

\[v_t^* = \frac{Q_t^*}{(T-t)+\gamma} + \frac{\phi p}{k+\phi}\left( \mu_t^--\frac{1}{(T-t)+\gamma}\int_t^T \mathbb E[\mu_u^-\mid\mathcal F_t^{\mu}]du \right) - \frac{b}{2(k+\phi)} \frac{1}{(T-t)+\gamma} \int_t^T ((T-u)+\gamma)\mathbb E[\mu_u^+-\mu_u^-\mid\mathcal F_t^{\mu}]du \tag{9.51}\]

를 얻는다.

이 식의 직관은 다음과 같다. 첫째 줄의 두 항은 다른 트레이더의 가격영향을 무시했던 9.2절의 경우와 동일한 구조이다. 둘째 줄의 새로운 항은 순주문흐름이 미래 중간가격을 밀어 올리거나 내리는 효과를 반영하는 보정이다. 현재 순매수 우위가 예상되면 가격이 상승할 가능성이 있으므로, 에이전트는 나중에 더 높은 가격에 팔 수 있도록 청산속도를 늦춘다. 반대로 순매도 우위가 예상되면 가격 하락 압력이 커지므로, 에이전트는 더 빨리 매도하여 손실을 줄이려 한다.

9.4.2 예시: 평균회귀적 확률 거래량

명시적인 닫힌형식 공식을 얻기 위해, 매수 측과 매도 측의 거래속도가 서로 독립인 jump OU 과정이라고 가정하자.

\[d\mu_t^{\pm}=-\kappa\mu_t^{\pm}dt+\eta_{1+N_t^{\pm}}^{\pm}dN_t^{\pm},\]

여기서 \(N_t^{\pm}\)는 강도 \(\lambda\)의 서로 독립인 포아송과정이고, \(\{\eta_n^{\pm}\}\)는 분포함수 \(F\)를 갖는 i.i.d. 점프크기이다. 이들은 모두 서로 독립이며, 브라운운동 \(W_t\)와도 독립이다. 즉 이 모형은 매수·매도 거래속도를 각각 독립적인 jump OU 과정으로 본다.

적분인자를 써서 해를 명시적으로 쓰면

\[\mu_s^{\pm}=e^{-\kappa(s-t)}\mu_t^{\pm}+\int_t^s e^{-\kappa(s-u)}\eta_{1+N_u^{\pm}}^{\pm}dN_u^{\pm}.\]

따라서 \(s>t\)에 대해 조건부기댓값은

\[\mathbb E_{t,\mu}[\mu_s^{\pm}] = e^{-\kappa(s-t)}\mu_t^{\pm}+\lambda\mathbb E[\eta]\frac{1-e^{-\kappa(s-t)}}{\kappa}\]

가 된다. 이를 (9.51)에 대입하면 최적 청산속도에 대한 간단한 닫힌형식 공식을 얻는다. 이 식은 현재의 매도 강도, 미래 기대 매도 누적량, 그리고 미래 기대 순주문불균형을 모두 반영한다.

9.5 효용극대화자

이 절에서는 에이전트의 목적을, 말단 부의 기대효용을 최대화하면서 동시에 POV를 추적하는 것으로 바꾼다. 설정은 9.2절과 동일하고, 선호는 지수가효용

\[U(x)=-e^{-\gamma x}\]

으로 표현한다. 에이전트가 POV 목표를 무시한다면 성과기준은 단순히

\[H^v(t,x,S,\mu,q)=\mathbb E_{t,x,S,\mu,q}\left[-e^{-\gamma(X_T^v+Q_T^v(S_T^v-\alpha Q_T^v))}\right]\]

가 된다.

이제 POV 벌점을 어떻게 넣을 것인가가 문제다. 가장 순진한 생각은 앞과 마찬가지로 선형 벌점을 직접 더하는 것이다. 즉

\[\mathbb E_{t,x,S,\mu,q}\left[-e^{-\gamma(X_T^v+Q_T^v(S_T^v-\alpha Q_T^v))}-\gamma\phi\int_t^T (v_u-p\mu_u)^2du\right]\]

같은 성과기준을 생각할 수 있다. 그러나 이 접근은 해석적으로 다루기 어렵다. 가장 큰 이유는 지수가효용과 선형 벌점이 서로 잘 맞지 않기 때문이다. 이 경우에는 현금과정조차 문제에서 깔끔하게 분리되지 않는다.

대신 여기서는 흔히 재귀적 시간가산 벌점(recursive intertemporally additive penalty) 이라 불리는 구조를 사용한다. 이 방식에서는 가치함수가 연속시간 재귀식의 극한으로 정의되며, 직관적으로는 시점별 효용수준 자체에 POV 편차를 곱하여 벌점을 주는 형태가 된다. 이렇게 하면 tractability를 유지하면서도 POV 목표를 포함할 수 있다. 따라서 에이전트의 성과기준은

\[H^v(t,x,S,\mu,q) = \mathbb E_{t,x,S,\mu,q} \left[ -e^{-\gamma(X_T^v+Q_T^v(S_T^v-\alpha Q_T^v))} +\gamma\phi\int_t^T (v_u-p\mu_u)^2 H^v(u,X_u^v,S_u^v,\mu_u,Q_u^v)\,du \right] \tag{9.52}\]

로 주어지고, 가치함수는

\[H(t,x,S,\mu,q)=\sup_{v\in\mathcal A}H^v(t,x,S,\mu,q)\]

이다. 벌점 앞에 플러스 부호가 있는 이유는 \(H\) 자체가 음수이기 때문이다. 따라서 이 항은 실제로는 벌점으로 작용한다. 즉 POV 목표에서 벗어날 때 그 벌점은 그 상태에서의 가치함수 크기에 의해 스케일된다. 가치가 큰 상태에서는 POV에서 이탈하는 것을 더 꺼리고, 가치가 작은 상태에서는 더 높은 가치를 얻기 위해 어느 정도 이탈을 허용한다.

동적계획원리에 따르면 가치함수는 다음 DPE를 만족해야 한다.

\[0= \left(\partial_t+\tfrac12\sigma^2\partial_{SS}+\mathcal L^{\mu}\right)H + \sup_v\Bigl\{(S-kv)v\partial_xH-v\partial_qH-bv\partial_S H+\gamma\phi(v-p\mu)^2H\Bigr\},\]

말단조건은

\[H(T,x,S,\mu,q)=-e^{-\gamma(x+q(S-\alpha q))}\]

이고, 최적 거래속도는

\[v^*= \frac{-S\partial_xH+\partial_qH+b\partial_S H+2\gamma\phi p\mu H}{-2k\partial_xH+2\gamma\phi H}\]

에서 달성된다.

말단조건의 형태를 보면 다음 안자츠를 쓰는 것이 자연스럽다.

\[H(t,x,S,\mu,q)=-e^{-\gamma(x+qS+h(t,\mu,q))}.\]

이를 대입하면 \(h(t,\mu,q)\)는

\[0=-\mathcal L^{\mu}(e^{-\gamma h})+ \left(\partial_q h+bq-2\phi p\mu\right)^2\frac{\gamma^2}{4(k+\phi e^{-\gamma h})} - \gamma\phi p^2\mu^2 e^{-\gamma h} - \frac12\sigma^2\gamma^2 q^2e^{-\gamma h} \tag{9.53}\]

와 동등한 비선형 방정식을 만족한다. 말단조건은 다시 \(h(T,\mu,q)=-\alpha q^2\)이다.

9.5.1 결정론적 거래량 하에서의 DPE 풀기

이제 다른 시장참가자들의 매도 거래속도가 시간의 결정론적 함수라고 가정하자. 즉 \(d\mu(t)=g(t)dt\)이므로 \(\mathcal L^{\mu}H=g(t)\partial_{\mu}H\)가 된다. 이 경우 에이전트는 사실상 9.2절 그림 9.2 오른쪽 파란 실선과 같은 예측 가능한 거래 패턴을 목표로 삼는 셈이다.

그러면 (9.53)은

\[0=(\partial_t+\mathcal L^{\mu})h+ \frac{(\partial_qh+bq-2\phi p\mu)^2}{4(k+\phi)} - \phi p^2\mu^2 - \frac12\sigma^2\gamma q^2 \tag{9.54}\]

의 형태로 정리된다. 이 방정식은 9.2절의 (9.8)과 거의 같고, 단지 추가로 \(-\tfrac12\sigma^2\gamma q^2\) 항이 들어간다. 따라서 같은 방식으로

\[h(t,\mu,q)=h_0(t,\mu)+q h_1(t,\mu)+q^2 h_2(t,\mu) \tag{9.55}\]

라는 안자츠를 쓸 수 있고, 계산을 정리하면 다음의 결합된 PDE 계가 나온다.

\[0=(\partial_t+\mathcal L^{\mu})h_2+ \frac{1}{k+\phi}\left(h_2+\tfrac12 b\right)^2-\frac12\sigma^2\gamma, \qquad h_2(T)=-\alpha, \tag{9.56a}\]

\[0=(\partial_t+\mathcal L^{\mu})h_1+ \frac{1}{k+\phi}\left(h_2+\tfrac12 b\right)(h_1-2\phi p\mu), \qquad h_1(T)=0, \tag{9.56b}\]

\[0=(\partial_t+\mathcal L^{\mu})h_0+ \frac{1}{4(k+\phi)}(h_1-2\phi p\mu)^2-\phi p^2\mu^2, \qquad h_0(T)=0. \tag{9.56c}\]

먼저 \(h_2\)의 방정식은 리카티 ODE이므로 6장의 계산과 마찬가지로 풀 수 있다. 해는

\[h_2(t)=w\frac{1+\chi e^{2w(T-t)}}{1-\chi e^{2w(T-t)}}-\tfrac12 b, \tag{9.57}\]

이며,

\[w=\sqrt{k\left(\phi+\frac12\sigma^2\gamma\right)}, \qquad \chi=\frac{\alpha-\tfrac12 b-w}{\alpha-\tfrac12 b+w}.\]

이제 \(h_1\)을 풀기 위해 선형 안자츠

\[h_1(t,\mu)=\Gamma_0(t)+\Gamma_1(t)\mu \tag{9.59}\]

를 쓰면 두 개의 ODE

\[0=\partial_t\Gamma_1+ \frac{1}{k+\phi}\left(h_2+\tfrac12 b\right)\Gamma_1-2\phi p, \tag{9.61}\]

\[0=\partial_t\Gamma_0-g(t)\Gamma_1+ \frac{1}{k+\phi}\left(h_2+\tfrac12 b\right)\Gamma_0 \tag{9.62}\]

를 얻는다. 적분인자법으로 이를 풀면 최종적으로 최적 거래속도는

\[v_t^*= -w\frac{1+\chi e^{2w(T-t)}}{1-\chi e^{2w(T-t)}}Q_t^* + \frac{\phi p}{k+\phi}\mu_t - \frac{\Gamma_1(t)}{2(k+\phi)}\mu_t - \frac{\Gamma_0(t)}{2(k+\phi)}. \tag{9.64}\]

이 된다. 첫 번째 항은 AC형 청산항이고, 나머지 항들은 POV 목표를 맞추기 위한 보정이다. 특히 위험회피계수 \(\gamma\to 0\)이면 효용극대화 문제는 위험중립 문제로 수렴하고, 전략은 9.2.1절에서 유도한 형태와 동일해진다.

'Financial Engineering > ALGORITHMIC AND HIGH-FREQUENCY TRADING' 카테고리의 다른 글

Chapter 11. Pairs Trading and Statistical Arbitrage Strategies (0)	2026.03.22
Chapter 10. Market Making (0)	2026.03.22
8 (0)	2026.03.22
Chapter 7. Optimal Execution with Continuous Trading II (0)	2026.03.22
Chapter 6. Optimal Execution with Continuous Trading I (0)	2026.03.22

9

Algorithmic and High-Frequency Trading — Chapter 9Targeting Volume

Part A — 선수지식

1. 확률공간, σ-대수, 필트레이션

1.1 정의

1.2 AHFT 9장과의 연결

1.3 적응성의 정의

2. 조건부기댓값

2.1 정의

2.2 존재성과 구성

2.2.1 존재성 정리

2.3 유일성

2.4 Tower property

2.5 Pull-out property

2.6 AHFT 9장과의 연결

3. 마팅게일

3.1 정의

3.2 핵심 예시

3.3 compensated Poisson martingale의 증명

3.4 AHFT 9장과의 연결

4. Brownian motion

5. Itô 적분과 Itô isometry

5.1 단순 적분과 확장

5.2 Itô isometry

5.2.1 교차항이 사라지는 이유

5.2.2 대각항 계산

5.2.3 최종 정리

5.3 AHFT 9장과의 연결

6. Itô 공식

6.1 1차원 버전

6.2 핵심 증명 아이디어

6.3 다변수 generator 형식

7. Poisson process

7.1 기대값과 분산

7.2 증명 스케치

8. Compound Poisson process

8.1 정의

8.2 기대값

8.3 generator

8.4 generator의 직관적 유도

9. 상태증강과 Markov화

9.1 Markov property

10. 제어문제의 기본 구조

10.1 AHFT 9장의 상태변수

10.2 목적함수의 전형적 형태

11. Dynamic Programming Principle (DPP)

11.1 비형식적 진술

11.2 해석

11.3 DPP에서 HJB로의 전개

11.3.1 보다 상세한 전개

12. Verification theorem

12.1 정리(비공식 버전)

12.2 증명 구조

12.3 jump가 있을 때

13. Mean-reverting trading rate

13.1 해의 명시형

13.2 조건부기댓값

13.3 AHFT 9장과의 연결

14. Cumulative volume

14.1 generator

15. POV, POCV, VWAP

15.1 POV (Percentage of Volume)

15.2 POCV (Percentage of Cumulative Volume)

15.3 VWAP

15.4 quadratic tracking penalty

16. 9.2 Targeting Percentage of Market’s Speed of Trading

16.1 문제 설정

16.2 상태와 제어

16.3 목적함수

16.4 DPE 유도

16.5 1차조건

16.6 quadratic ansatz

16.6.1 quadratic ansatz의 구조

17. 9.2.3 Probabilistic Representation

17.1 선형 PDE representation

17.2 증명

17.3 AHFT 9장과의 연결

18. 9.3 Percentage of Cumulative Volume

18.1 상태변수

18.2 목적함수

Algorithmic and High-Frequency Trading — Chapter 9
Targeting Volume