Algorithmic and High-Frequency Trading
Chapter 6 — Optimal Execution with Continuous Trading I

Part A — 선수지식

A.1 시장미시구조와 Execution Cost의 기초

최적집행 문제는 단순한 미분방정식 문제가 아니다. 먼저 왜 집행비용이 생기는지 이해해야 한다. 큰 주문을 한 번에 던지면 반대편 호가를 빠르게 소모하면서 평균체결가격이 악화된다. 반대로 천천히 나누어 거래하면 즉시 충격은 줄지만, 그 사이 가격이 불리하게 움직일 위험을 떠안는다. 제6장은 바로 이 두 비용, 즉 일시적 충격과 시간에 노출됨으로써 생기는 위험을 연속시간 제어문제로 만든다.

정의 A.1.1 — Temporary Impact와 Permanent Impact

거래속도(청산속도)를 $v_t$라 하자.

일시적 충격(temporary impact): 현재 체결가격만 악화시키는 효과다. 매도에서는 평균체결가격이 $S_t-f(v_t)$가 되고, $f(v_t)$는 주문이 호가창을 걷는 비용을 나타낸다.
영구적 충격(permanent impact): 나의 거래가 중간가격 자체의 미래 경로를 밀어버리는 효과다. 선형모형에서는 $dS_t = -g(v_t)dt + \sigma dW_t$, 특히 $g(v)=bv$ 꼴로 둔다.

정의 A.1.2 — Implementation Shortfall

초기 기준가격이 $S_0$, 초기재고가 $Q_0$, 최종현금이 $X_T$이면 implementation shortfall은

$$\mathrm{IS}=Q_0S_0-X_T$$

로 정의한다. 이는 도착가격(arrival price) 기준으로 보았을 때 실제 집행이 얼마나 불리했는가를 나타내는 대표 지표다.

선형 충격 모형의 가장 기본 형태

$$\widetilde S_t = S_t - f(v_t), \qquad f(v_t)=kv_t,\ k>0,$$ $$dS_t = -g(v_t)dt + \sigma dW_t, \qquad g(v_t)=bv_t,\ b\ge 0.$$

첫 식은 체결가격, 둘째 식은 중간가격 dynamics를 뜻한다. 제6장에서는 이 두 식의 조합이 어떻게 최적속도를 바꾸는지 단계적으로 본다.

A.2 확률공간, $\sigma$-대수, filtration, predictable control

정의 A.2.1 — 확률공간

확률공간은 삼중쌍 $(\Omega,\mathcal F,\mathbb P)$이다. $\Omega$는 가능한 결과의 집합, $\mathcal F$는 사건들의 $\sigma$-대수, $\mathbb P$는 확률측도다.

정의 A.2.2 — $\sigma$-대수

집합족 $\mathcal F\subseteq 2^{\Omega}$가 다음을 만족하면 $\sigma$-대수라 한다.

$\Omega\in\mathcal F$.
$A\in\mathcal F\Rightarrow A^c\in\mathcal F$.
$A_1,A_2,\dots\in\mathcal F\Rightarrow \bigcup_{n=1}^{\infty}A_n\in\mathcal F$.

명제 A.2.3 — $\sigma$-대수의 기본 성질과 증명

$\mathcal F$가 $\sigma$-대수이면 다음이 성립한다.

$\varnothing\in\mathcal F$,
유한합에 대해 닫혀 있다,
유한교집합에 대해 닫혀 있다,
차집합에 대해 닫혀 있다.

1단계. $\Omega\in\mathcal F$이고 여집합 닫힘성으로부터 $\Omega^c=\varnothing\in\mathcal F$.

2단계. 유한합은 가산합의 특수한 경우다. $A_1,\dots,A_n$ 뒤에 $\varnothing$를 붙이면 된다.

3단계. 드모르간 법칙으로 $\bigcap_{i=1}^n A_i=(\bigcup_{i=1}^n A_i^c)^c$. 각 $A_i^c\in\mathcal F$이고, 가산합 및 여집합 닫힘성으로 결론이 따른다.

4단계. $A\setminus B=A\cap B^c$를 이용하면 차집합 닫힘성도 즉시 따라온다.

∎

정의 A.2.4 — filtration과 adapted / predictable process

증가하는 $\sigma$-대수족 $\mathbb F=(\mathcal F_t)_{0\le t\le T}$를 filtration이라 한다. 과정 $(X_t)$가 adapted라는 것은 각 $t$마다 $X_t$가 $\mathcal F_t$-가측임을 뜻한다. 제어과정 $(v_t)$가 predictable이라는 것은 $v_t$가 시점 $t$ 직전 정보로 정해진다는 뜻이다. 최적집행 모형에서 predictable 조건은 미래 가격을 보고 거래속도를 정하는 비현실적 전략을 배제한다.

A.3 적분가능성, $L^p$ 공간, 균등적분가능성

정의 A.3.1 — $L^p$ 공간

$1\le p<\infty$에 대하여

$$L^p(\Omega,\mathcal F,\mathbb P)=\{X:\mathbb E[|X|^p]<\infty\}$$

로 정의한다. Chapter 6에서는 기대수익, 분산형 페널티, 지수효용을 다루므로 적어도 $L^1$과 $L^2$ 구조를 안정적으로 다뤄야 한다.

정의 A.3.2 — 균등적분가능성 (Uniform Integrability)

확률변수족 $\mathcal X\subset L^1$가 균등적분가능하다는 것은

$$\lim_{K\to\infty}\sup_{X\in\mathcal X}\mathbb E\big[|X|\mathbf 1_{\{|X|>K\}}\big]=0$$

를 만족함을 뜻한다. 조건부기대의 극한교환, 마팅게일 수렴, 측도변환 후 기대값의 안정성을 보일 때 필수로 등장한다.

정리 A.3.3 — $L^p$-bounded family는 $p>1$이면 균등적분가능하다

$p>1$이고 $\sup_{X\in\mathcal X}\mathbb E|X|^p\le C$이면 $\mathcal X$는 균등적분가능하다.

Hölder 부등식을 쓴다. $q=\frac{p}{p-1}$라 두면

$$\mathbb E\big[|X|\mathbf 1_{\{|X|>K\}}\big]\le (\mathbb E|X|^p)^{1/p}\,\mathbb P(|X|>K)^{1/q}.$$

다시 Markov 부등식으로

$$\mathbb P(|X|>K)\le \frac{\mathbb E|X|^p}{K^p}.$$

따라서

$$\mathbb E\big[|X|\mathbf 1_{\{|X|>K\}}\big]\le C^{1/p}\left(\frac{C}{K^p}\right)^{1/q}=C\,K^{-(p-1)}.$$

우변은 $X$에 무관하고 $K\to\infty$에서 0으로 간다. 따라서 균등적분가능하다.

∎

A.4 Radon–Nikodym 정리와 조건부기대의 존재

정의 A.4.1 — 절대연속과 동치측도

같은 가측공간 위의 두 측도 $\nu,\mu$에 대해 $\mu(A)=0\Rightarrow \nu(A)=0$이면 $\nu\ll\mu$라 쓴다. 서로 절대연속이면 $\nu\sim\mu$라 한다.

정리 A.4.2 — Radon–Nikodym 정리

$\sigma$-유한 측도 $\nu,\mu$가 있고 $\nu\ll\mu$이면, 어떤 비음수 가측함수 $f$가 존재하여

$$\nu(A)=\int_A f\,d\mu\qquad(\forall A\in\mathcal F)$$

를 만족한다. 이 $f$를 $\frac{d\nu}{d\mu}$라 쓴다.

정리 A.4.2 — Hilbert 공간 접근

유한측도인 경우를 먼저 보인다. $\lambda=\mu+\nu$라 두고 Hilbert 공간 $H=L^2(\lambda)$를 잡는다. 선형범함수 $\Phi:H\to\mathbb R$를

$$\Phi(g)=\int g\,d\nu$$

로 정의한다.

1단계: $\Phi$의 유계성. Cauchy–Schwarz로

$$|\Phi(g)|=\left|\int g\,d\nu\right|\le \int |g|\,d\nu\le \int |g|\,d\lambda\le \lambda(\Omega)^{1/2}\|g\|_{L^2(\lambda)}.$$

따라서 $\Phi$는 유계 선형범함수다.

2단계: Riesz 표현 정리. 어떤 $h\in L^2(\lambda)$가 존재하여

$$\Phi(g)=\langle g,h\rangle_{L^2(\lambda)}=\int gh\,d\lambda$$

가 모든 $g\in H$에 대해 성립한다. 즉

$$\int g\,d\nu=\int gh\,d\mu+\int gh\,d\nu.$$

정리하면

$$\int g(1-h)\,d\nu=\int gh\,d\mu \qquad (\forall g\in L^2(\lambda)). \tag{A.4.1}$$

3단계: $0\le h\le 1$ a.e. 증명. $g=\mathbf 1_{\{h<0\}}$를 대입하면 왼쪽은 양수, 오른쪽은 음수여야 하므로 둘 다 0이다. 따라서 $\lambda(h<0)=0$. 마찬가지로 $g=\mathbf 1_{\{h>1\}}$를 대입하면 $\lambda(h>1)=0$. 그래서 $0\le h\le 1$ a.e.

4단계: 밀도 구성. $f:=\frac{h}{1-h}$를 $h<1$에서 정의하고 $h=1$인 곳에서는 0으로 정한다. 식 $(A.4.1)$에 $g=\mathbf 1_A$를 대입하면

$$\int_A (1-h)\,d\nu=\int_A h\,d\mu,$$

즉 $\nu(A)=\int_A f\,d\mu$가 얻어진다. 유일성은 두 밀도 $f_1,f_2$에 대해 모든 $A$에서 $\int_A(f_1-f_2)d\mu=0$가 성립하면 $f_1=f_2$ a.e.임을 보이면 된다.

∎

$\sigma$-유한 경우는 공간을 유한측도 조각으로 분해한 뒤 조각별로 위 논증을 수행하여 붙이면 된다.

정의 A.4.3 — 조건부기대

$X\in L^1$, $\mathcal G\subseteq \mathcal F$일 때 $\mathcal G$-가측 확률변수 $Y$가

$$\int_A Y\,d\mathbb P = \int_A X\,d\mathbb P \qquad(\forall A\in\mathcal G)$$

를 만족하면 $Y=\mathbb E[X\mid \mathcal G]$라 한다.

정리 A.4.4 — 조건부기대의 존재와 유일성

$X\in L^1$이면 $\mathbb E[X\mid\mathcal G]$는 존재하며 a.s. 유일하다.

존재성. $\mathcal G$ 위에 signed measure $\nu(A)=\int_A Xd\mathbb P$를 정의한다. $\mathbb P(A)=0$이면 $\nu(A)=0$이므로 $\nu\ll \mathbb P|_{\mathcal G}$. RN 정리에 의해 어떤 $\mathcal G$-가측 함수 $Y$가 존재하여 $\nu(A)=\int_A Yd\mathbb P$를 만족한다. 이것이 조건부기대다.

유일성. $Y_1,Y_2$가 둘 다 조건부기대라면 모든 $A\in\mathcal G$에 대해 $\int_A(Y_1-Y_2)d\mathbb P=0$. $A=\{Y_1>Y_2\}\in\mathcal G$를 택하면 $\int_A(Y_1-Y_2)d\mathbb P\ge 0$이면서 0이므로 $\mathbb P(A)=0$. 반대 부등식도 마찬가지이므로 a.s. 동일하다.

∎

정리 A.4.5 — 조건부기대의 기본 성질과 증명

아래 성질들은 제어문제의 DPP와 HJB 유도에서 반복해서 쓰인다.

선형성

$a,b\in\mathbb R$, $X,Y\in L^1$이면

$$\mathbb E[aX+bY\mid\mathcal G]=a\mathbb E[X\mid\mathcal G]+b\mathbb E[Y\mid\mathcal G].$$

증명은 적분특성의 선형성에서 바로 나온다.

Pull-out property

$Z$가 $\mathcal G$-가측이고 $ZX\in L^1$이면

$$\mathbb E[ZX\mid\mathcal G]=Z\mathbb E[X\mid\mathcal G].$$

왜냐하면 오른쪽은 $\mathcal G$-가측이고, 모든 $A\in\mathcal G$에 대해 $ZA$도 $\mathcal G$-가측이므로

$$\int_A Z\mathbb E[X\mid\mathcal G]d\mathbb P=\int_A ZX\,d\mathbb P.$$

Tower property

$\mathcal H\subseteq \mathcal G\subseteq \mathcal F$이면

$$\mathbb E\big[\mathbb E[X\mid\mathcal G]\mid\mathcal H\big]=\mathbb E[X\mid\mathcal H].$$

모든 $A\in\mathcal H$에 대해 $A\in\mathcal G$이므로

$$\int_A \mathbb E[X\mid\mathcal G]d\mathbb P=\int_A Xd\mathbb P,$$

즉 $\mathbb E[X\mid\mathcal G]$는 $\mathcal H$에 대해 $X$의 조건부기대와 같은 적분특성을 가진다. 유일성으로 결론이 따른다.

∎

A.5 등가측도, 밀도과정, Bayes 공식, 뉴메레르 미분

정의 A.5.1 — 등가측도와 밀도과정

$\mathbb Q\sim\mathbb P$라 하자. 종단밀도를 $Z_T=\frac{d\mathbb Q}{d\mathbb P}$라 두면, 시간 $t$의 밀도과정은

$$Z_t:=\mathbb E^{\mathbb P}[Z_T\mid \mathcal F_t]$$

로 정의한다. $(Z_t)$는 $\mathbb P$-마팅게일이고 $Z_0=1$이다.

정리 A.5.2 — Bayes 공식

$X\in L^1(\mathbb Q)$이고 $s\le t$이면

$$\mathbb E^{\mathbb Q}[X\mid\mathcal F_s]=\frac{1}{Z_s}\,\mathbb E^{\mathbb P}[Z_t X\mid\mathcal F_s].$$

$A\in\mathcal F_s$에 대해

$$\mathbb E^{\mathbb P}[\mathbf 1_A Z_s \mathbb E^{\mathbb Q}[X\mid\mathcal F_s]] =\mathbb E^{\mathbb Q}[\mathbf 1_A\mathbb E^{\mathbb Q}[X\mid\mathcal F_s]] =\mathbb E^{\mathbb Q}[\mathbf 1_A X] =\mathbb E^{\mathbb P}[\mathbf 1_A Z_t X].$$

따라서 오른쪽 비율식이 $\mathcal F_s$-조건부기대의 적분특성을 만족한다.

∎

정의 A.5.3 — Numeraire와 numeraire derivative

항상 양수인 자산 $N_t$를 뉴메레르라 한다. 임의의 자산가치 $V_t$를 뉴메레르로 나눈 비율 $V_t/N_t$를 numeraire-denominated price라 한다. 이때 RN 미분은

$$\left.\frac{d\mathbb Q^N}{d\mathbb Q^B}\right|_{\mathcal F_t}=\frac{N_t/B_t}{N_0/B_0}$$

처럼 쓸 수 있다. 여기서 $B_t$는 은행계정(numeraire of the money market)이다. 사용자가 요청한 ‘뉴메레르 derivative’는 바로 이 뉴메레르 변경에 따른 Radon–Nikodym 도함수를 뜻한다.

정리 A.5.4 — 뉴메레르 변경 정리

$\mathbb Q^B$가 은행계정 $B$에 대한 위험중립측도라고 하자. 양의 자산 $N$을 새 뉴메레르로 택해

$$L_t:=\frac{N_t/B_t}{N_0/B_0}$$

가 $\mathbb Q^B$-마팅게일이면, $d\mathbb Q^N = L_T d\mathbb Q^B$로 정의한 측도 $\mathbb Q^N$ 아래에서 모든 거래가능자산의 $N$-표시가격 $V_t/N_t$는 마팅게일이다.

$\mathbb Q^B$ 아래에서 할인된 가격 $V_t/B_t$가 마팅게일이라고 하자. Bayes 공식으로

$$\mathbb E^{\mathbb Q^N}\!\left[\frac{V_u}{N_u}\mid\mathcal F_t\right] =\frac{1}{L_t}\mathbb E^{\mathbb Q^B}\!\left[L_u\frac{V_u}{N_u}\mid\mathcal F_t\right].$$

그런데 $L_u\frac{V_u}{N_u}=\frac{V_u/B_u}{N_0/B_0}$. 따라서

$$\mathbb E^{\mathbb Q^N}\!\left[\frac{V_u}{N_u}\mid\mathcal F_t\right] =\frac{1}{L_t}\frac{1}{N_0/B_0}\mathbb E^{\mathbb Q^B}\!\left[\frac{V_u}{B_u}\mid\mathcal F_t\right] =\frac{1}{L_t}\frac{1}{N_0/B_0}\frac{V_t}{B_t} =\frac{V_t}{N_t}. $$

즉 $V/N$는 $\mathbb Q^N$-마팅게일이다.

∎

Chapter 6 자체는 정석적인 은행계정 위험중립가격 장은 아니지만, 지수효용 절과 이후 장(특히 금리모형이나 duality 해석)으로 넘어갈 때 측도변환 언어가 반드시 필요하다.

A.6 Brownian motion, 확률적분, Itô 공식

정의 A.6.1 — Brownian motion

과정 $(W_t)_{t\ge0}$가 다음을 만족하면 표준 Brownian motion이다.

$W_0=0$ a.s.
독립증분: $0\le t_0<t_1<\cdots<t_n$이면 $W_{t_i}-W_{t_{i-1}}$들이 서로 독립.
정규증분: $W_t-W_s\sim N(0,t-s)$.
경로가 a.s. 연속.

정의 A.6.2 — Itô 적분

적절한 predictable 과정 $H$에 대해

$$\int_0^t H_s\,dW_s$$

를 Itô 적분이라 한다. 단순과정에서 먼저 정의한 뒤 $L^2$ 완비화로 일반화한다.

정리 A.6.3 — Itô 등거리식

$H\in L^2$이면

$$\mathbb E\left[\left(\int_0^T H_s dW_s\right)^2\right]=\mathbb E\left[\int_0^T H_s^2 ds\right].$$

단순과정 $H_s=\sum_i \xi_i \mathbf 1_{(t_i,t_{i+1}]}(s)$에 대해

$$\int_0^T H_s dW_s=\sum_i \xi_i(W_{t_{i+1}}-W_{t_i}).$$

증분들의 독립성과 평균 0을 이용하면 교차항의 기대값은 0이고,

$$\mathbb E\left[\left(\sum_i \xi_i\Delta W_i\right)^2\right]=\sum_i \mathbb E[\xi_i^2]\,(t_{i+1}-t_i)=\mathbb E\left[\int_0^T H_s^2 ds\right].$$

일반 $L^2$ 과정은 단순과정 근사와 완비성으로 확장한다.

∎

정리 A.6.4 — Itô 공식

$dX_t=\mu_tdt+\sigma_t dW_t$, $f\in C^{1,2}$이면

$$df(t,X_t)=\left(f_t+\mu_t f_x+\tfrac12\sigma_t^2 f_{xx}\right)dt+\sigma_t f_x dW_t.$$

최적집행에서는 $f(t,S_t,Q_t,X_t)$에 Itô를 적용해 HJB 검증식을 만든다. 특히 $Q_t$가 유한변동이므로 $[Q,S]=0$라는 사실이 Chapter 6에서 반복적으로 쓰인다.

보조정리 A.6.5 — 적분부분공식과 $[Q,S]=0$ 증명

연속 semimartingale $X,Y$에 대해

$$d(X_tY_t)=X_t dY_t + Y_t dX_t + d[X,Y]_t.$$

만약 $Q$가 절대연속 경로를 갖는 유한변동과정이면 $[Q,S]_t=0$이다.

이차변동은 미소차의 제곱합의 극한으로 정의된다. 유한변동과정은 증분 크기가 $O(\Delta t)$이므로 Brownian 성분이 가진 $O(\sqrt{\Delta t})$ 변동과 곱해도 합의 극한이 0이 된다. 그래서 교차이차변동이 사라진다.

∎

A.7 지수마팅게일, Novikov 조건, Girsanov 정리

정의 A.7.1 — Doléans exponential

적절한 predictable 과정 $\theta$에 대하여

$$\mathcal E_t\left(-\int_0^{\cdot}\theta_s dW_s\right)=\exp\left(-\int_0^t\theta_s dW_s-\frac12\int_0^t\theta_s^2 ds\right)$$

를 지수마팅게일이라 부른다.

정리 A.7.2 — Novikov 조건

만약

$$\mathbb E\left[\exp\left(\frac12\int_0^T\theta_s^2 ds\right)\right]<\infty,$$

이면 $Z_t=\mathcal E_t(-\int_0^{\cdot}\theta_s dW_s)$는 진마팅게일이며 $\mathbb E[Z_T]=1$이다.

정리 A.7.2 — Novikov 조건

완전한 기능해석학적 증명은 길지만, 제6장에서 필요한 핵심 논리는 다음과 같다.

1단계. 지역화한 뒤 $Z^{\tau_n}$가 양의 지역마팅게일임을 보이면 초과마팅게일이다. 따라서 $\mathbb E[Z_{t\wedge\tau_n}]\le 1$.

2단계. 지수형 Hölder 추정과 Novikov 적분가능성을 결합하면 $(Z_{t\wedge\tau_n})_n$가 균등적분가능함을 얻는다.

3단계. 균등적분가능성 때문에 지역화 극한을 expectation 안으로 통과시켜 $\mathbb E[Z_t]=1$을 얻는다. 따라서 $Z$는 지역마팅게일이 아니라 진마팅게일이다.

정리 A.7.3 — Girsanov 정리

위 Novikov 조건 아래 $d\mathbb Q = Z_T d\mathbb P$로 측도를 정의하면

$$W_t^{\mathbb Q}:=W_t+\int_0^t \theta_s ds$$

는 $\mathbb Q$ 아래 Brownian motion이다.

정리 A.7.3 — Girsanov 정리

1단계: 새 측도의 정의. Novikov 조건으로 $Z_t$가 진마팅게일이므로 $\mathbb Q(A)=\mathbb E^{\mathbb P}[Z_T\mathbf 1_A]$는 확률측도다.

2단계: 평균 0 증분 확인. 임의의 bounded $\mathcal F_s$-가측 $F$와 $t>s$에 대해 Bayes 공식으로

$$\mathbb E^{\mathbb Q}\big[(W_t^{\mathbb Q}-W_s^{\mathbb Q})F\big]=\mathbb E^{\mathbb P}\big[Z_t(W_t-W_s+\int_s^t\theta_u du)F\big].$$

Itô 곱공식을 $Z_t(W_t-W_s)$에 적용하면 드리프트 보정항이 정확히 $-\int_s^t\theta_u du$를 상쇄한다. 따라서 위 기대값은 0이 된다.

3단계: 공분산 구조. $[W^{\mathbb Q}]_t=[W]_t=t$이다. 드리프트를 더해도 이차변동은 변하지 않기 때문이다.

4단계: Lévy 특성화. 연속 adapted 과정 $W^{\mathbb Q}$가 시작값 0, 마팅게일, 이차변동 $t$를 가지면 $\mathbb Q$ 아래 Brownian motion이다. 따라서 결론이 성립한다.

∎

실무적으로 가장 많이 쓰는 형태

원래 $\mathbb P$ 아래에서

$$dS_t = \mu_t dt + \sigma_t dW_t$$

이고 $\theta_t=\mu_t/\sigma_t$라 두면, $\mathbb Q$ 아래에서는

$$dS_t = \sigma_t dW_t^{\mathbb Q}$$

처럼 드리프트를 제거할 수 있다. 지수효용 문제의 martingale/duality 해석은 결국 이런 측도변환 감각에 의존한다.

A.8 제어문제의 DPP, HJB, Verification

제6장의 수학적 핵심은 Chapter 5에서 이미 등장한 DPP와 HJB다. 하지만 제6장에서는 이를 실제로 닫힌형 해를 만드는 계산도구로 쓴다. 따라서 형식적 진술만으로는 부족하고, 왜 HJB가 나오는지, 그리고 candidate 해가 정말 최적인지까지 연결해야 한다.

정의 A.8.1 — 가치함수

상태 $(t,x)$에서 admissible control 집합 $\mathcal A_{t,T}$에 대해

$$V(t,x)=\sup_{u\in\mathcal A_{t,T}}\mathbb E_{t,x}\left[\int_t^T F(s,X_s^u,u_s)ds+G(X_T^u)\right]$$

를 가치함수라 한다.

정리 A.8.2 — DPP

결정론적 $h>0$에 대해

$$V(t,x)=\sup_{u\in\mathcal A_{t,t+h}}\mathbb E_{t,x}\left[\int_t^{t+h}F(s,X_s^u,u_s)ds+V(t+h,X_{t+h}^u)\right].$$

한 방향은 최적전략을 앞구간과 뒷구간으로 나누면 바로 나온다. 반대 방향은 $\varepsilon$-최적 제어를 $t+h$ 이후에 이어붙이는 ‘pasting’로 얻는다. 이때 제어의 admissibility와 filtration 적합성이 유지되어야 한다. 제6장에서는 이 DPP를 사용해 아주 짧은 시간 $[t,t+dt]$ 구간에서의 국소 최적조건을 얻고, 그것이 곧 HJB가 된다.

∎

정리 A.8.3 — HJB와 Verification 정리

제어된 확산

$$dX_t=b(t,X_t,u_t)dt+\Sigma(t,X_t,u_t)dW_t$$

의 생성자를

$$\mathcal L^u\varphi=b\cdot\nabla\varphi+\tfrac12\mathrm{Tr}(\Sigma\Sigma^{\top}\nabla^2\varphi)$$

라 하면, 충분히 매끈한 가치함수는 HJB

$$0=\partial_t V + \sup_u\{F(t,x,u)+\mathcal L^uV\},\qquad V(T,x)=G(x)$$

를 만족한다.

Verification. 어떤 매끈한 함수 $\widehat V$가 위 HJB와 terminal condition을 만족하고, $u^*(t,x)$가 supremum을 달성한다고 하자. Itô 공식을 $\widehat V(t,X_t^u)$에 적용하면 임의의 $u$에 대해 $\widehat V\ge J^u$가 나온다. 또 $u^*$에 대해서는 부등식이 등식이 되므로 $\widehat V=V$이고 $u^*$가 최적이다. 제6장의 closed-form 해는 모두 이 논리로 정당화된다.

∎

A.9 선형-이차 구조와 Riccati ODE

정의 A.9.1 — Quadratic ansatz

Chapter 6에서 반복적으로 쓰는 핵심 ansatz는

$$H(t,x,s,q)=x+qs+h(t,q),\qquad h(t,q)=A(t)q^2+B(t)q+C(t)$$

다. 현금의 장부가치 $x$와 재고의 장부가치 $qs$를 먼저 떼어낸 다음, 남는 ‘조정항’ $h$만 제어문제로 푸는 구조다.

보조정리 A.9.2 — Riccati 방정식의 출현

예를 들어 HJB가

$$0=h_t-\phi q^2+\sup_v\{-kv^2-(\beta q+h_q)v\}$$

라면 최적속도는

$$v^*= -\frac{\beta q+h_q}{2k}.$$

여기에 $h=Aq^2+Bq+C$를 대입하면

$$A' - \phi + \frac{(\beta+2A)^2}{4k}=0,$$ $$B' + \frac{(\beta+2A)B}{2k}=0,$$ $$C' + \frac{B^2}{4k}=0.$$

즉 계수들은 ODE 시스템으로 떨어진다. 이 중 $A$-방정식이 Riccati 방정식이다.

∎

A.10 볼록해석과 Legendre transform

정의 A.10.1 — convex conjugate / Legendre transform

볼록함수 $F$의 Legendre transform은

$$F^*(y)=\sup_{x\in\mathbb R}\{xy-F(x)\}$$

로 정의한다. 비선형 충격 $f(v)$를 다루는 6.7절에서 $F(v)=vf(v)$로 놓으면 HJB의 supremum 항이 정확히 $F^*$로 정리된다.

정리 A.10.2 — power-law 비용의 Legendre transform

$F(v)=k v^{1+a}$ $(k>0,a>0,v\ge0)$라 하자. 그러면

$$F^*(y)=\frac{a}{(1+a)^{1+1/a}}\,k^{-1/a}\,(y_+)^{1+1/a},\qquad y_+=\max(y,0).$$

$y\le0$이면 $v=0$이 최적이므로 값은 0이다. $y>0$이면 일계조건

$$0=\frac{d}{dv}(yv-kv^{1+a})=y-k(1+a)v^a$$

로부터

$$v^*(y)=\left(\frac{y}{k(1+a)}\right)^{1/a}.$$

이를 대입하면

$$F^*(y)=yv^*-k(v^*)^{1+a} =\frac{a}{(1+a)^{1+1/a}}k^{-1/a}y^{1+1/a}.$$

∎

A.11 지수효용, certainty equivalent, Gaussian exponential moment

정의 A.11.1 — 지수효용

위험회피계수 $\eta>0$에 대해 CARA 효용은

$$U(x)=-e^{-\eta x}$$

로 정의한다. CARA 효용의 장점은 확률변수에 확정적 금액을 더했을 때 구조가 보존된다는 점이다. 그래서 현금 $x$와 장부가치 $qs$를 지수 바깥으로 분리해 HJB를 단순화할 수 있다.

정리 A.11.2 — 정규분포에 대한 지수적률

$Z\sim N(0,1)$이면 모든 $\lambda\in\mathbb R$에 대해

$$\mathbb E[e^{\lambda Z}]=e^{\lambda^2/2}.$$

밀도함수를 이용해

$$\mathbb E[e^{\lambda Z}] = \frac{1}{\sqrt{2\pi}}\int_{\mathbb R} e^{\lambda z-z^2/2}\,dz =\frac{1}{\sqrt{2\pi}}\int_{\mathbb R} e^{-\frac12(z^2-2\lambda z)}dz.$$

완전제곱을 하면

$$z^2-2\lambda z=(z-\lambda)^2-\lambda^2.$$

따라서

$$\mathbb E[e^{\lambda Z}] = e^{\lambda^2/2}\frac{1}{\sqrt{2\pi}}\int_{\mathbb R} e^{-(z-\lambda)^2/2}dz = e^{\lambda^2/2}.$$

∎

이 결과 때문에 Brownian risk가 들어가는 지수효용 문제는 결국 분산항 $\frac12\eta\sigma^2 q^2$를 가진 위험중립형 문제와 같은 형태로 떨어진다. 이것이 6.6절의 핵심이다.

Part B — Chapter 6 본문

6.1 문제의식: 왜 연속시간 최적집행이 필요한가

제6장은 Part III의 출발점이다. 여기서 처음으로 독자는 ‘대형 주문을 주어진 시간 구간 안에서 어떻게 집행할 것인가’를 완전한 연속시간 제어문제로 본다. 핵심은 단순하다. 빨리 거래하면 가격충격이 커지고, 천천히 거래하면 가격위험이 커진다. 그런데 이 단순한 문장이 수학으로 쓰이는 순간, 상태변수와 제어변수, HJB, 검증정리, Riccati ODE가 한꺼번에 등장한다.

저자들은 이 장에서 여러 변형을 차례대로 쌓는다. 먼저 가장 단순한 경우, 즉 중간가격은 내 거래에 영향을 받지 않고, 내 체결가격만 일시적으로 악화되는 경우를 푼다. 다음에는 목표재고를 정확히 채우지 못한 경우 단말 패널티를 부과해 hard constraint를 soft penalty로 완화한다. 그 다음에는 내 거래가 중간가격의 드리프트를 움직이는 영구충격을 넣고, 더 나아가 효용함수와 비선형 충격함수를 도입한다. 수학적으로는 단순한 LQ 구조에서 비선형 HJB까지 올라간다.

Figure 6.1 — LOB와 일시적 충격의 구조

제6장의 출발점은 호가창이 유한한 심도(depth)를 갖는다는 사실이다. 시장가 주문이 커질수록 반대편 호가를 더 깊게 소모하게 되고, 그 결과 평균체결가격이 중간가격보다 더 불리해진다. 아래 그림은 그 논리를 한 장에 요약한 것이다. 왼쪽 위는 전형적 LOB 스냅샷, 오른쪽 위는 한 시점의 주문크기-충격 관계, 왼쪽 아래는 짧은 시간 동안의 초 단위 충격곡선들, 오른쪽 아래는 그 평균곡선과 선형근사다. 원문 6.2절에서 선형 temporary impact $f(v)=kv$를 두는 이유가 바로 여기 있다.

Figure 6.1. LOB 스냅샷과 temporary impact의 전형적 구조. 큰 시장가 주문은 호가창을 걸어가며 주당 체결가격을 악화시키고, 그 평균효과를 가장 단순하게 근사한 것이 선형 temporary impact 모형이다.

6.2 The Model

가장 먼저 모델의 부호 규약부터 분명히 하자. 청산(liquidation) 문제에서는 $v_t\ge 0$를 매도 속도로 둔다. 그러면 재고는

$$dQ_t=-v_t\,dt,\qquad Q_0=q_0>0$$

를 따른다. 즉 $v_t$가 클수록 재고가 빠르게 줄어든다. 현금은 매도대금이 쌓이므로

$$dX_t = \widetilde S_t v_t\,dt$$

이고, 실제 체결가격은 일시적 충격 때문에

$$\widetilde S_t = S_t-f(v_t)$$

로 쓴다. 여기서 $f(v)=kv$는 가장 기본적인 선형 비용이다.

중간가격은 외생적이거나, 혹은 자신의 주문에 의해 영구적으로 영향을 받을 수 있다. 외생적일 때는

$$dS_t = \sigma dW_t,$$

영구충격까지 넣으면

$$dS_t = -g(v_t)dt + \sigma dW_t,\qquad g(v)=bv$$

로 둔다. 매도 $v_t>0$는 드리프트를 음(-) 방향으로 밀어 중간가격을 낮춘다.

제6장의 기본 상태방정식

$$\boxed{\begin{aligned} dQ_t &= -v_t\,dt,\\ dX_t &= (S_t-f(v_t))v_t\,dt,\\ dS_t &= -g(v_t)dt + \sigma dW_t. \end{aligned}}$$

어떤 절에서는 $g\equiv 0$, 어떤 절에서는 $g(v)=bv$를 쓴다. 이 미묘한 차이가 최적속도의 형태를 크게 바꾼다.

모형 해석

$Q$는 내가 얼마나 더 팔아야 하는가, $X$는 지금까지 얼마를 벌었는가, $S$는 기준가격이 어디로 움직이는가를 뜻한다. 제어변수는 오직 $v_t$ 하나지만, 이 하나의 변수는 동시에 재고를 줄이고, 체결비용을 발생시키고, 때로는 기준가격의 미래까지 바꾼다.

6.3 Liquidation without Penalties: only Temporary Impact

이제 가장 단순한 경우를 푼다. 거래자는 $T$까지 $q$주를 모두 팔아야 하고, 중간가격은 자신의 거래에 영향을 받지 않는다. 즉 $g\equiv 0$, $f(v)=kv$, spread는 0으로 놓는다. 원문은 이 경우 가치함수를

$$H(t,S,q)=\sup_{v\in\mathcal A_t}\,\mathbb E_{t,S,q}\left[\int_t^T (S_u-kv_u)v_u\,du\right]$$

로 둔다. 모든 남은 재고를 $T$까지 반드시 처분해야 하므로 terminal inventory가 0이 아니면 사실상 무한대 패널티를 주는 것과 같다.

정의 6.3.1 — admissible liquidation strategy와 hard liquidation constraint

이 절에서 admissible strategy는 $\mathbb F$-predictable이고, 유계이며, 음이 아닌 liquidation rate 과정 $v=(v_t)_{0\le t\le T}$이다. 재고는 $dQ_t=-v_tdt$를 따르고, hard liquidation constraint는 만기에서 $Q_T=0$을 강제한다. 원문의 terminal behavior $H(T,S,q)=-\infty$ for $q>0$는 이 제약을 HJB 안에 박아 넣은 표현이다.

원문 DPE / HJB

$$\partial_t H + \frac12\sigma^2 \partial_{SS}H + \sup_v\{(S-kv)v - v\partial_q H\}=0. \tag{6.4}$$

terminal condition은 $q>0$에서 $H(T,S,q)=-\infty$, $H(T,S,0)=0$에 해당한다.

여기서 자연스럽게

$$H(t,S,q)=Sq+h(t,q)$$

를 넣는다. 왜 이 ansatz가 자연스러운가. 지금 들고 있는 $q$주의 장부가치는 일단 $Sq$로 보이고, 나머지 문제는 앞으로 어떻게 파느냐에서 생기는 ‘추가가치 또는 추가손실’를 $h$가 전부 흡수하게 만들겠다는 뜻이기 때문이다.

정리 6.3.1 — 일시충격만 있는 청산문제의 HJB 축소

증명. 이 절의 HJB는

$$\partial_t H + \frac12\sigma^2 \partial_{SS}H + \sup_v\{(S-kv)v - v\partial_q H\}=0$$

이고, terminal condition은 hard liquidation을 반영하여 $q>0$에서 $H(T,S,q)=-\infty$, $H(T,S,0)=0$이다. 여기서

$$H(t,S,q)=Sq+h(t,q)$$

를 대입한다. 이때 $Sq$는 현재 남아 있는 재고 $q$주의 장부가치이고, $h(t,q)$는 지금 이후의 집행 때문에 생기는 추가손실 또는 추가가치를 모두 흡수하는 항이다.

이 ansatz의 편미분을 하나씩 계산하면

$$\partial_t H(t,S,q)=h_t(t,q),$$ $$\partial_S H(t,S,q)=q,\qquad \partial_{SS}H(t,S,q)=0,$$ $$\partial_q H(t,S,q)=S+h_q(t,q).$$

이를 HJB에 대입하면

$$0=h_t+\frac12\sigma^2\cdot 0+\sup_v\{(S-kv)v-v(S+h_q)\}.$$

중괄호 안을 전개하면

$$ (S-kv)v-v(S+h_q) =Sv-kv^2-Sv-vh_q =-kv^2-vh_q. $$

따라서 PDE는

$$0=h_t+\sup_v\{-kv^2-vh_q\}.\tag{6.5}$$

이제 남은 것은 $v$에 대한 일변수 최대화 문제다. 함수

$$g(v):=-kv^2-vh_q$$

를 보면

$$g'(v)=-2kv-h_q,\qquad g''(v)=-2k<0$$

이므로 $k>0$ 아래에서 $g$는 엄밀히 오목하다. 따라서 일계조건을 만족하는 점이 있으면 그것이 전역최대점이다. 일계조건 $g'(v)=0$은

$$-2kv-h_q=0$$

이므로 최적속도 후보는

$$v^*=-\frac{h_q}{2k}.\tag{6.6}$$

청산문제에서는 재고가 많을수록 가치가 낮아지므로 통상 $h_q\le 0$이고, 따라서 $v^*\ge 0$가 되어 liquidation rate의 부호제약과도 정합적이다.

이제 최대값을 직접 계산한다.

$$ \begin{aligned} g(v^*) &=-k\left(-\frac{h_q}{2k}\right)^2-h_q\left(-\frac{h_q}{2k}\right)\\ &=-\frac{h_q^2}{4k}+\frac{h_q^2}{2k}\\ &=\frac{h_q^2}{4k}. \end{aligned} $$

이를 다시 PDE에 넣으면 $h$는

$$0=h_t+\frac{h_q^2}{4k}.\tag{6.7}$$

를 만족한다. 즉 원래의 3변수 HJB는 $S$가 완전히 소거된 2변수 비선형 PDE로 축소된다. 증명 끝.

∎

정리 6.3.2 — 닫힌형 해와 TWAP

증명. 앞 정리에서 $h$는

$$0=h_t+\frac{h_q^2}{4k}$$

를 만족해야 한다. 또한 hard liquidation 제약 때문에 만기 $T$까지 재고를 남기면 허용되지 않으므로, $q>0$에서는 $t\uparrow T$일 때 가치가 $-\infty$로 발산해야 한다. 이 terminal blow-up을 반영하는 가장 자연스러운 quadratic 후보는

$$h(t,q)=-\frac{kq^2}{T-t}.\tag{6.8}$$

이제 이 후보가 실제로 PDE를 만족하는지 항별로 검산한다. 먼저 시간미분은

$$ \begin{aligned} h_t(t,q) &=-kq^2\,\frac{d}{dt}(T-t)^{-1}\\ &=-kq^2(T-t)^{-2}\\ &=-\frac{kq^2}{(T-t)^2}. \end{aligned} $$

재고미분은

$$h_q(t,q)=-\frac{2kq}{T-t}.$$

따라서 비선형항은

$$ \frac{h_q^2}{4k} =\frac{1}{4k}\left(\frac{2kq}{T-t}\right)^2 =\frac{1}{4k}\cdot \frac{4k^2q^2}{(T-t)^2} =\frac{kq^2}{(T-t)^2}. $$

그러므로

$$h_t+\frac{h_q^2}{4k}=-\frac{kq^2}{(T-t)^2}+\frac{kq^2}{(T-t)^2}=0,$$

즉 후보해는 PDE를 정확히 만족한다.

또한 $q>0$를 고정하면 $t\uparrow T$일 때 $(T-t)^{-1}\uparrow\infty$이므로

$$h(t,q)=-\frac{kq^2}{T-t}\longrightarrow -\infty,$$

가 되어 hard liquidation이 요구하는 terminal behavior와도 일치한다.

이제 최적속도를 구한다. 앞 정리의 식 $v^*=-h_q/(2k)$에 $h_q=-2kq/(T-t)$를 대입하면

$$v_t^*=-\frac{1}{2k}\left(-\frac{2kq}{T-t}\right)=\frac{q}{T-t}.\tag{6.9}$$

최적경로 위에서는 $q$가 현재 재고 $Q_t$이므로 상태방정식 $dQ_t=-v_tdt$는

$$\frac{dQ_t}{dt}=-\frac{Q_t}{T-t}$$

가 된다. 이를 분리하면

$$\frac{dQ_t}{Q_t}=-\frac{dt}{T-t}.$$

초기조건 $Q_0=q_0$를 사용하여 $0$에서 $t$까지 적분하면

$$\int_{q_0}^{Q_t}\frac{dQ}{Q}=\int_0^t-\frac{du}{T-u}.$$

왼쪽은 $\log Q_t-\log q_0$이고, 오른쪽은

$$ \int_0^t-\frac{du}{T-u} =\Big[\log(T-u)\Big]_{u=0}^{u=t} =\log(T-t)-\log T. $$

따라서

$$ \log\frac{Q_t}{q_0}=\log\frac{T-t}{T}, \qquad Q_t=q_0\frac{T-t}{T}=q_0\left(1-\frac{t}{T}\right). $$

이를 다시 최적속도식에 넣으면

$$v_t^*=\frac{Q_t}{T-t}=\frac{q_0}{T}.\tag{6.10}$$

즉 최적속도는 시간에 따라 변하지 않는 상수이고, 재고는 직선적으로 감소한다. 이것이 바로 주문을 시간에 균등하게 나누는 TWAP 전략이다. 증명 끝.

∎

Figure 6.2 — running penalty와 terminal penalty에 따른 재고경로와 거래속도

아래 그림은 $k=10^{-3}$, $T=1$, $\phi\in\{0,0.001,0.01,0.1\}$에서의 전형적 재고경로와 거래속도를 그린 것이다. 왼쪽 열은 유한 terminal penalty $\alpha=0.01$, 오른쪽 열은 $\alpha\to\infty$인 hard liquidation 제약에 대응한다. $\phi=0$이면 재고경로가 직선이 되어 TWAP가 나오고, $\phi$가 커질수록 경로는 점점 더 앞쪽으로 휘어지며 초기 거래속도가 상승한다.

Figure 6.2. running penalty가 커질수록 agent는 재고위험을 더 빨리 줄이려고 하므로 inventory path가 더 볼록해지고 trading speed가 초기에 커진다. $\alpha\to\infty$에서는 만기 잔여재고가 허용되지 않는다.

이 절의 결론

일시충격만 있고 중간가격 동학이 외생적이며, 반드시 전량 청산해야 한다면 최적전략은 놀랄 만큼 단순하다. 균등하게 나누어 파는 것, 즉 TWAP가 수학적으로 최적이다. 제7장에서 order flow나 가격상한, dark pool이 들어오는 순간 이 단순성이 깨진다.

6.4 Optimal Acquisition with Terminal Penalty and Temporary Impact

이번에는 문제의 방향을 바꾼다. 거래자는 $Q_0=0$에서 시작해 $T$까지 목표수량 $\bar q$를 매수하려 한다. 그러나 6.3절처럼 무조건 terminal inventory를 정확히 맞추라고 강제하지 않고, 목표에 못 미친 만큼 마지막 순간에 일괄 매수하면서 패널티를 낸다고 본다. 이때 단말 패널티 계수를 $a>0$로 둔다. $a$가 커질수록 목표수량을 끝까지 맞추라는 압력이 커진다.

매수에서는 부호를 뒤집어 $dQ_t=v_tdt$, $v_t\ge0$로 두는 것이 자연스럽다. 중간가격은 여전히 외생적이고 일시충격만 존재한다고 하자.

정의 6.4.1 — soft terminal condition

soft terminal condition은 만기 목표를 정확히 달성하지 못해도 문제를 금지하지 않고, 대신 부족분에 quadratic penalty를 부과하는 구조다. 따라서 hard liquidation처럼 value function이 terminal blow-up을 갖지 않고, 유한 terminal condition을 갖는 Riccati형 문제가 된다.

전형적 목적함수

$$\sup_v\mathbb E\Big[X_T+Q_TS_T-a(\bar q-Q_T)^2\Big].\tag{6.11}$$

여기서 마지막 항은 부족재고(shortfall)에 대한 quadratic penalty다.

역시 $H=x+qs+h(t,q)$를 대입하면, $h$는 terminal condition

$$h(T,q)=-a(\bar q-q)^2$$

를 갖는다. HJB의 구조는 6.3절과 거의 같지만 hard constraint 대신 quadratic terminal condition이 들어간다. 이 때문에 해가 blow-up 대신 유한 terminal data를 갖는 Riccati형 ODE로 바뀐다.

정리 6.4.1 — 단말 패널티가 있는 매수문제의 최적속도

증명. 이 절의 $h$는 terminal condition

$$h(T,q)=-a(\bar q-q)^2$$

를 가지며, HJB는

$$0=h_t+\sup_{v\ge 0}\{-kv^2+vh_q\}$$

형태다. terminal data가 $q$에 대해 quadratic이므로 $h$도 quadratic일 것이라 예상하고

$$h(t,q)=A(t)q^2+B(t)q+C(t)$$

라고 둔다. 그러면

$$h_t=A'(t)q^2+B'(t)q+C'(t),\qquad h_q=2A(t)q+B(t).$$

이를 HJB에 대입하면

$$0=A'q^2+B'q+C'+\sup_{v\ge 0}\{-kv^2+(2Aq+B)v\}.$$

이제

$$g(v):=-kv^2+(2Aq+B)v$$

를 최대화한다. $g''(v)=-2k<0$이므로 $g$는 엄밀히 오목하고, 따라서 일계조건은 충분조건이다. 일계조건 $g'(v)=0$은

$$-2kv+(2Aq+B)=0$$

즉

$$v_t^*=\frac{2A(t)q+B(t)}{2k}.\tag{6.12}$$

를 준다. 최적값은 제곱완성으로 계산할 수 있다. 실제로

$$-kv^2+(2Aq+B)v=-k\left(v-\frac{2Aq+B}{2k}\right)^2+\frac{(2Aq+B)^2}{4k}.$$

따라서 supremum은

$$\sup_{v\ge0}g(v)=\frac{(2Aq+B)^2}{4k}.$$

이를 전개하면

$$\frac{(2Aq+B)^2}{4k}=\frac{4A^2q^2+4ABq+B^2}{4k}=\frac{A^2}{k}q^2+\frac{AB}{k}q+\frac{B^2}{4k}.$$

그러므로 HJB는

$$0=\left(A'+\frac{A^2}{k}\right)q^2+\left(B'+\frac{AB}{k}\right)q+\left(C'+\frac{B^2}{4k}\right).$$

이 식이 모든 $q$에 대해 성립해야 하므로 각 계수는 각각 0이어야 한다. 따라서

$$A'+\frac{A^2}{k}=0, \qquad B'+\frac{AB}{k}=0, \qquad C'+\frac{B^2}{4k}=0.$$

이제 terminal condition을 quadratic 항별로 분해한다.

$$-a(\bar q-q)^2=-a(\bar q^2-2\bar qq+q^2)=-a\bar q^2+2a\bar q\,q-aq^2.$$

따라서

$$A(T)=-a,\qquad B(T)=2a\bar q,\qquad C(T)=-a\bar q^2.\tag{6.13}$$

먼저 $A$를 푼다. $A'=-A^2/k$이므로

$$\left(\frac1A\right)'=-\frac{A'}{A^2}=\frac1k.$$

이를 $t$에서 $T$까지 적분하면

$$\frac1{A(T)}-\frac1{A(t)}=\frac{T-t}{k}.$$

여기에 $A(T)=-a$를 넣으면

$$-\frac1a-\frac1{A(t)}=\frac{T-t}{k}, \qquad \frac1{A(t)}=-\frac1a-\frac{T-t}{k}=-\frac{a(T-t)+k}{ak}.$$

따라서

$$A(t)=-\frac{ka}{a(T-t)+k}.\tag{6.14}$$

다음으로 $B$ 방정식은

$$B'+\frac{A}{k}B=0$$

이고, 방금 구한 $A/k=-a/[a(T-t)+k]$를 넣으면

$$B'-\frac{a}{a(T-t)+k}B=0.$$

후보해

$$B(t)=\frac{2ka\bar q}{a(T-t)+k}$$

를 미분해 검산하면

$$B'(t)=-\frac{2ka^2\bar q}{(a(T-t)+k)^2},$$ $$\frac{A(t)}{k}B(t)=\left(-\frac{a}{a(T-t)+k}\right)\left(\frac{2ka\bar q}{a(T-t)+k}\right)=-\frac{2ka^2\bar q}{(a(T-t)+k)^2},$$

이므로 실제로 $B'+(A/k)B=0$를 만족한다. 또한 $B(T)=2a\bar q$도 맞다. 따라서

$$B(t)=\frac{2ka\bar q}{a(T-t)+k}.\tag{6.15}$$

마지막으로 최적속도는

$$\begin{aligned} v_t^* &=\frac{2A(t)q+B(t)}{2k}\\ &=\frac{1}{2k}\left(-\frac{2kaq}{a(T-t)+k}+\frac{2ka\bar q}{a(T-t)+k}\right)\\ &=\frac{a(\bar q-q)}{a(T-t)+k}. \end{aligned}\tag{6.16}$$

즉 현재 재고 $q$가 목표 $\bar q$보다 많이 부족할수록 빠르게 매수하고, 단말 패널티 $a$가 클수록 같은 부족분에 대해서도 더 공격적으로 매수한다. 증명 끝.

∎

정리 6.4.2 — 재고경로와 단말부족분

증명. 앞 정리의 최적속도

$$v_t^*=\frac{a(\bar q-Q_t)}{a(T-t)+k}$$

를 상태방정식 $dQ_t=v_tdt$에 대입하면

$$\frac{dQ_t}{dt}=\frac{a(\bar q-Q_t)}{a(T-t)+k}.$$

목표 대비 남은 부족분을 직접 보는 것이 더 편하므로

$$Y_t:=\bar q-Q_t$$

라고 두자. 그러면 $Y_0=\bar q$이고, 미분하면

$$\frac{dY_t}{dt}=-\frac{dQ_t}{dt}=-\frac{aY_t}{a(T-t)+k}.$$

이 식을 분리하면

$$\frac{dY_t}{Y_t}=-\frac{a\,dt}{a(T-t)+k}.$$

초기조건 $Y_0=\bar q$를 사용하여 $0$에서 $t$까지 적분하면

$$\int_{\bar q}^{Y_t}\frac{dY}{Y}=\int_0^t-\frac{a\,du}{a(T-u)+k}.$$

왼쪽은 $\log Y_t-\log\bar q$이고, 오른쪽은 치환 $z=a(T-u)+k$, $dz=-a\,du$를 쓰면

$$\begin{aligned} \int_0^t-\frac{a\,du}{a(T-u)+k} &=\int_{aT+k}^{a(T-t)+k}\frac{dz}{z}\\ &=\log(a(T-t)+k)-\log(aT+k). \end{aligned}$$

따라서

$$\log\frac{Y_t}{\bar q}=\log\frac{a(T-t)+k}{aT+k}, \qquad Y_t=\bar q\frac{a(T-t)+k}{aT+k}.$$

이제 $Q_t=\bar q-Y_t$이므로

$$\begin{aligned} Q_t &=\bar q-\bar q\frac{a(T-t)+k}{aT+k}\\ &=\bar q\frac{aT+k-a(T-t)-k}{aT+k}\\ &=\bar q\frac{at}{aT+k}\\ &=\frac{a\bar q}{aT+k}t. \end{aligned}\tag{6.17}$$

즉 최적재고는 시간에 대해 선형으로 증가한다. 그러면 거래속도도 상수인지 확인할 수 있다.

$$\begin{aligned} v_t^* &=\frac{a(\bar q-Q_t)}{a(T-t)+k}\\ &=\frac{aY_t}{a(T-t)+k}\\ &=\frac{a}{a(T-t)+k}\cdot \bar q\frac{a(T-t)+k}{aT+k}\\ &=\frac{a\bar q}{aT+k}. \end{aligned}$$

즉 이 문제에서도 실제 최적집행 속도는 상수다. 다만 hard constraint가 아니라 soft penalty이므로 만기에는 일반적으로 목표를 정확히 채우지 않는다.

$$Q_T=\frac{aT}{aT+k}\bar q<\bar q.$$

남은 부족분은

$$\bar q-Q_T=\bar q\left(1-\frac{aT}{aT+k}\right)=\frac{k}{aT+k}\bar q$$

이며, 이 부족분을 terminal penalty가 흡수한다. 마지막으로 $a\to\infty$를 보내면

$$Q_T\to\bar q, \qquad v_t^*=\frac{a\bar q}{aT+k}\to\frac{\bar q}{T},$$

즉 soft constraint 해는 hard constraint의 균등 매수 스케줄로 수렴한다. 증명 끝.

∎

soft constraint의 의미

hard constraint는 만기에 반드시 맞춰야 하므로 근접한 시점에서 무한히 큰 한계가치를 만든다. 반면 soft penalty는 ‘못 맞추면 돈을 내라’는 구조이므로, 마지막까지도 한계가치는 유한하다. 이 작은 차이가 해의 형태를 blow-up에서 유한 terminal condition으로 바꾼다.

6.5 Liquidation with Permanent Price Impact

이제 제6장의 중심으로 들어간다. 여기서는 거래자의 매도가 단지 지금 체결가격만 악화시키는 것이 아니라, 중간가격의 미래까지 누르는 영구충격을 가진다. 동시에 거래자가 재고를 오래 들고 있을수록 위험을 느끼도록 running inventory penalty $\phi q^2$도 넣는다. 이 절부터 제6장의 전략은 더 이상 단순 TWAP가 아니다.

정의 6.5.1 — mark-to-market wealth

$Y_t:=X_t+Q_tS_t$를 mark-to-market wealth라 한다. 이는 누적현금과 남은 재고를 현재 중간가격으로 평가한 장부가치다. 이 변수를 쓰면 현금방정식과 가격방정식이 하나의 비용분해식으로 정리되어, temporary impact, permanent impact, inventory risk가 각각 어떤 항으로 나타나는지 한눈에 드러난다.

상태방정식과 목적함수

$$dS_t=-bv_tdt+\sigma dW_t,\qquad dQ_t=-v_tdt,\qquad dX_t=(S_t-kv_t)v_tdt,$$ $$\sup_v\mathbb E\Big[X_T+Q_T(S_T-\alpha Q_T)-\phi\int_t^T Q_u^2du\Big].\tag{6.18}$$

마지막 $-\alpha Q_T^2$는 남은 재고를 만기 일괄청산할 때의 추가손실을 나타낸다.

정리 6.5.1 — mark-to-market wealth의 동학

증명. $Y_t:=X_t+Q_tS_t$를 두자. 여기서 $X_t$는 누적현금, $Q_tS_t$는 남은 재고를 현재 중간가격으로 평가한 장부가치다. 곱의 미분공식을 적용하면

$$d(Q_tS_t)=Q_t\,dS_t+S_t\,dQ_t+d[Q,S]_t.$$

따라서

$$dY_t=dX_t+Q_t\,dS_t+S_t\,dQ_t+d[Q,S]_t.$$

이제 각 항을 하나씩 본다. 재고과정은

$$Q_t=q_0-\int_0^t v_u\,du$$

처럼 절대연속인 유한변동과정이다. 유한변동과정과 연속 준마팅게일 사이의 이차공변동은 0이므로

$$[Q,S]_t=0.$$

또 상태방정식은

$$dS_t=-bv_tdt+\sigma dW_t, \qquad dQ_t=-v_tdt, \qquad dX_t=(S_t-kv_t)v_tdt$$

이므로 이를 위 식에 대입하면

$$dY_t=(S_t-kv_t)v_tdt+Q_t(-bv_tdt+\sigma dW_t)+S_t(-v_tdt)+0.$$

이제 같은 항끼리 정리한다. 먼저 $S_tv_tdt$와 $-S_tv_tdt$가 정확히 상쇄된다.

$$ (S_t-kv_t)v_tdt+S_t(-v_tdt) =S_tv_tdt-kv_t^2dt-S_tv_tdt =-kv_t^2dt. $$

따라서 전체식은

$$dY_t=-kv_t^2dt-bQ_tv_tdt+\sigma Q_t dW_t.\tag{6.19}$$

즉 mark-to-market wealth의 변화는 세 부분으로 분해된다.

$-kv_t^2dt$: 일시충격이 만들어 내는 즉시 실행비용
$-bQ_tv_tdt$: 영구충격이 남은 재고가치에 미치는 추가손실
$\sigma Q_t dW_t$: 재고를 들고 있는 동안 노출되는 무작위 가격위험

따라서 이 식은 제6장 전체에서 충격비용과 가격위험을 분해하는 기본식이 된다. 증명 끝.

∎

정리 6.5.2 — 영구충격이 있는 청산문제의 HJB

증명. 가치함수를

$$H(t,x,s,q):=\sup_v\mathbb E_{t,x,s,q}\Big[X_T+Q_T(S_T-\alpha Q_T)-\phi\int_t^TQ_u^2du\Big]$$

라고 두자. 동적계획원리에 의해 HJB는

$$0=H_t+\frac12\sigma^2H_{ss}-\phi q^2+\sup_v\Big\{(s-kv)vH_x+(-bv)H_s+(-v)H_q\Big\}$$

이며, terminal condition은

$$H(T,x,s,q)=x+q(s-\alpha q).$$

이제 terminal payoff가 $x$와 $s$에 선형이므로, 6.3절과 마찬가지로

$$H(t,x,s,q)=x+qs+h(t,q)$$

를 대입한다. 이때 편미분은

$$H_t=h_t, \qquad H_x=1, \qquad H_s=q, \qquad H_{ss}=0, \qquad H_q=s+h_q.$$

이를 HJB에 넣으면

$$\begin{aligned} 0 &=h_t+\frac12\sigma^2\cdot 0-\phi q^2 +\sup_v\Big\{(s-kv)v\cdot 1+(-bv)q+(-v)(s+h_q)\Big\}. \end{aligned}$$

중괄호 안을 전개하면

$$ (s-kv)v-bqv-v(s+h_q) =sv-kv^2-bqv-sv-vh_q =-kv^2-(bq+h_q)v. $$

따라서 $h$는

$$0=h_t-\phi q^2+\sup_v\{-kv^2-(bq+h_q)v\}, \qquad h(T,q)=-\alpha q^2.\tag{6.20}$$

를 만족해야 한다. terminal condition은

$$x+qs+h(T,q)=x+q(s-\alpha q)$$

를 비교하면 바로 $h(T,q)=-\alpha q^2$가 됨을 알 수 있다.

이제 제어 $v$에 대한 최대화를 계산한다. 함수

$$g(v):=-kv^2-(bq+h_q)v$$

는

$$g'(v)=-2kv-(bq+h_q), \qquad g''(v)=-2k<0$$

이므로 엄밀히 오목하다. 따라서 일계조건이 전역최대점을 준다. 일계조건 $g'(v)=0$은

$$-2kv-(bq+h_q)=0$$

즉

$$v_t^*=-\frac{bq+h_q}{2k}.\tag{6.21}$$

이다. 이를 다시 $g(v)$에 대입하면

$$\begin{aligned} g(v^*) &=-k\left(-\frac{bq+h_q}{2k}\right)^2-(bq+h_q)\left(-\frac{bq+h_q}{2k}\right)\\ &=-\frac{(bq+h_q)^2}{4k}+\frac{(bq+h_q)^2}{2k}\\ &=\frac{(bq+h_q)^2}{4k}. \end{aligned}$$

따라서 PDE는 최종적으로

$$0=h_t-\phi q^2+\frac{(bq+h_q)^2}{4k}.\tag{6.22}$$

로 축소된다. 즉 영구충격 $b$는 $h_q$와 단순히 더해져 한계집행비용을 높이는 방식으로 들어간다. 증명 끝.

∎

정리 6.5.3 — Riccati ODE와 피드백형 최적속도

증명. 앞 정리의 terminal condition이 $-\alpha q^2$인 quadratic 형태이고, PDE 안의 비선형항도 $(bq+h_q)^2$ 형태이므로 $h$가 quadratic일 것이라 예상하는 것이 자연스럽다. 따라서

$$h(t,q)=A(t)q^2$$

라고 둔다. 그러면

$$h_t=A'(t)q^2, \qquad h_q=2A(t)q.$$

이를 식 $(6.22)$에 대입하면

$$0=A'(t)q^2-\phi q^2+\frac{(bq+2A(t)q)^2}{4k}.$$

제곱항에서 $q^2$를 묶어내면

$$ (bq+2Aq)^2=q^2(b+2A)^2 $$

이므로

$$0=A'(t)q^2-\phi q^2+\frac{(b+2A(t))^2}{4k}q^2.$$

즉

$$0=q^2\left(A'(t)-\phi+\frac{(b+2A(t))^2}{4k}\right).$$

이 식이 모든 $q$에 대해 성립하려면 괄호 안이 0이어야 한다. 따라서 $A$는 Riccati ODE

$$A'(t)-\phi+\frac{(b+2A(t))^2}{4k}=0, \qquad A(T)=-\alpha.\tag{6.23}$$

를 만족한다. terminal condition은 $h(T,q)=-\alpha q^2$에서 직접 온다.

이제 최적속도는 앞 정리의 식 $(6.21)$에서 얻는다.

$$\begin{aligned} v_t^* &=-\frac{bq+h_q}{2k}\\ &=-\frac{bq+2A(t)q}{2k}\\ &=-\frac{b+2A(t)}{2k}q. \end{aligned}$$

최적경로 위에서는 $q=Q_t$이므로

$$v_t^*= -\frac{b+2A(t)}{2k}Q_t.\tag{6.24}$$

즉 최적속도는 현재 재고 $Q_t$에 비례하는 피드백형 제어다. 비례계수 $-(b+2A(t))/(2k)$는 시간에 따라 변하며, 이것이 바로 남은 시간, 영구충격, running penalty, terminal penalty가 결합된 urgency를 정량화한다.

추가로 변수변환 $C(t)=A(t)+b/2$를 쓰면 $(6.23)$는

$$C'(t)=\phi-\frac{C(t)^2}{k}, \qquad C(T)=\frac b2-\alpha$$

가 되어 표준 Riccati식으로 정리된다. 따라서 이 문제의 해석적 핵심은 quadratic ansatz가 Riccati ODE로 닫힌다는 데 있다. 증명 끝.

∎

명시적 해의 형태

$C(t)=A(t)+b/2$라 두면

$$C'(t)=\phi-\frac{C(t)^2}{k},\qquad C(T)=\frac b2-\alpha.\tag{6.25}$$

이는 표준 Riccati식이며, $\lambda=\sqrt{\phi/k}$로 두면 하이퍼볼릭 함수로 닫힌형을 쓸 수 있다. 따라서 최적속도는 대략 $v_t^*=\Gamma(t)Q_t$ 꼴이며, $\Gamma(t)$는 만기에 가까울수록 커지는 경향을 가진다.

Figure 6.3 — permanent impact와 urgency가 만든 inventory path

영구충격과 재고벌점이 동시에 있으면 최적재고는 더 이상 직선이 아니다. 아래 그림은 $k=10^{-3}$, $\phi=0.01$, $\alpha=0.05$를 고정하고 영구충격 강도 $b$를 바꾸었을 때의 전형적 inventory path와 trading speed를 보여준다. 이 절의 핵심은 영구충격 $b$와 단말패널티 $\alpha$가 최적속도식 안에서 함께 작동한다는 점이다.

Figure 6.3. permanent impact와 inventory penalty가 함께 들어오면 초기에는 더 빠르고 뒤로 갈수록 완만한 deterministic schedule이 나타난다. TWAP는 이 경우의 일반해가 아니라 특수해다.

이 절의 경제적 의미

제6장의 유명한 메시지는 여기서 나온다. 단순 TWAP는 특정한 특수경우일 뿐이다. 재고위험과 영구충격을 넣는 순간, 최적전략은 일반적으로 초기에 빠르고 점차 느려지는 deterministic schedule이 된다. 이것이 Almgren–Chriss류 해의 직관적 핵심이다.

6.6 Execution with Exponential Utility Maximiser

앞 절까지는 기대 terminal wealth를 최대화하는 문제를 주로 다뤘다. 물론 inventory penalty가 위험회피의 역할을 하긴 했지만, 효용함수 자체를 도입한 것은 아니다. 이제 투자자가 진짜로 위험회피적이라고 보고, 지수효용

$$U(x)=-e^{-\eta x},\qquad \eta>0$$

를 사용한다. 원문은 이 절의 핵심 결론을 아주 선명하게 말한다. 지수효용 투자자의 최적정책은 적절한 inventory penalty를 가진 위험중립 투자자의 정책과 같은 형태다.

정의 6.6.1 — CARA utility와 certainty-equivalent ansatz

CARA 효용은 $U(x)=-e^{-\eta x}$ $(\eta>0)$이다. 지수형 효용에서는 현금항 $x$와 mark-to-market 항 $qS$를 지수의 선형항으로 결합할 수 있으므로, value function을 $-\exp\{-\eta(x+qS+h(t,q))\}$ 꼴로 두는 것이 자연스럽다. 이 구조가 6.5절과의 동치를 만든다.

원문의 성과함수

$$H^v(t,x,S,q)=\mathbb E_{t,x,S,q}\Big[-\exp\{-\eta(X_T+Q_T(S_T-\alpha Q_T))\}\Big],$$ $$H(t,x,S,q)=\sup_{v\in\mathcal A}H^v(t,x,S,q).\tag{6.31a--b}$$

정리 6.6.1 — 지수효용 문제의 PDE 축소

증명. 이 절의 terminal payoff는

$$-\exp\{-\eta(X_T+Q_T(S_T-\alpha Q_T))\}$$

이므로, value function의 형태를

$$H(t,x,S,q)=-\exp\{-\eta(x+qS+h(t,q))\}.\tag{6.32}$$

로 두는 것이 자연스럽다. 여기서 $h(t,q)$는 certainty equivalent correction에 해당한다.

계산을 간단히 하기 위해

$$F(t,x,S,q):=x+qS+h(t,q)$$

라고 두면 $H=-e^{-\eta F}$이다. 이제 편미분을 하나씩 계산한다.

$$F_t=h_t, \qquad F_x=1, \qquad F_S=q, \qquad F_q=S+h_q.$$

연쇄법칙으로부터

$$H_t=-\eta h_t H, \qquad H_x=-\eta H, \qquad H_S=-\eta qH, \qquad H_q=-\eta(S+h_q)H.$$

또 $q$는 $S$에 대해 상수이므로 두 번째 $S$-미분은

$$H_{SS}=\frac{\partial}{\partial S}(-\eta qH)=-\eta qH_S=-\eta q(-\eta qH)=\eta^2q^2H.$$

이제 효용극대화 문제의 HJB

$$0=H_t+\frac12\sigma^2H_{SS}+\sup_v\Big\{(S-kv)vH_x+(-bv)H_S+(-v)H_q\Big\}$$

에 위 미분식을 대입한다. 그러면

$$\begin{aligned} 0={}&-\eta h_tH+\frac12\sigma^2\eta^2q^2H \\ &+\sup_v\Big\{(S-kv)v(-\eta H)+(-bv)(-\eta qH)+(-v)(-\eta(S+h_q)H)\Big\}. \end{aligned}$$

sup 내부에서 $-\eta H$를 묶으면

$$\begin{aligned} &(S-kv)v(-\eta H)+(-bv)(-\eta qH)+(-v)(-\eta(S+h_q)H)\\ &=-\eta H\Big[(S-kv)v-bqv-(S+h_q)v\Big]\\ &=-\eta H\Big[-kv^2-(bq+h_q)v\Big]. \end{aligned}$$

따라서 전체 식은

$$0=-\eta H\left[h_t-\frac12\eta\sigma^2q^2+\sup_v\{-kv^2-(bq+h_q)v\}\right].$$

여기서 $-\eta H\neq 0$이므로 이를 나누면

$$0=h_t-\frac12\eta\sigma^2q^2+\sup_v\{-kv^2-(bq+h_q)v\}, \qquad h(T,q)=-\alpha q^2.\tag{6.33}$$

terminal condition은 $t=T$에서

$$-\exp\{-\eta(x+qS+h(T,q))\}=-\exp\{-\eta(x+q(S-\alpha q))\}$$

를 비교하면 곧바로 $h(T,q)=-\alpha q^2$가 됨을 알 수 있다.

결국 지수효용 문제는 6.5절의 위험중립 문제와 완전히 같은 구조의 PDE로 축소되며, 단지 running penalty의 역할을 하는 항이 $\phi$ 대신 $\frac12\eta\sigma^2$로 바뀐다. 증명 끝.

∎

정리 6.6.2 — CARA 효용과 분산형 재고벌점의 동치

증명. 앞 정리에서 얻은 PDE는

$$0=h_t-\frac12\eta\sigma^2q^2+\sup_v\{-kv^2-(bq+h_q)v\}, \qquad h(T,q)=-\alpha q^2$$

이다. 그런데 6.5절의 위험중립 문제에서 나온 PDE는

$$0=h_t-\phi q^2+\sup_v\{-kv^2-(bq+h_q)v\}, \qquad h(T,q)=-\alpha q^2$$

였다. 두 식을 항별로 비교하면 완전히 동일하고, 단 하나의 차이는

$$\phi\longleftrightarrow \frac12\eta\sigma^2$$

라는 치환뿐이다. 따라서 6.5절 문제에서 running inventory penalty를

$$\phi=\frac12\eta\sigma^2$$

로 놓으면 두 문제의 $h$는 같은 terminal condition과 같은 PDE를 만족한다. 그러므로 같은 verification 논리 아래 두 문제의 최적제어는 동일하다.

먼저 제어에 대한 최대화는 6.5절과 완전히 똑같다. 함수

$$g(v):=-kv^2-(bq+h_q)v$$

는 오목하므로 일계조건

$$-2kv-(bq+h_q)=0$$

에서

$$v_t^*=-\frac{bq+h_q}{2k}.\tag{6.34}$$

를 얻는다. 즉 CARA 효용 투자자의 최적속도는 위험중립-벌점 모형과 같은 형태다.

이제 quadratic ansatz

$$h(t,q)=A(t)q^2$$

를 대입하면

$$h_t=A'(t)q^2, \qquad h_q=2A(t)q.$$

이를 PDE에 넣으면

$$0=A'(t)q^2-\frac12\eta\sigma^2q^2+\frac{(bq+2A(t)q)^2}{4k}.$$

다시 $q^2$를 묶으면

$$0=q^2\left(A'(t)-\frac12\eta\sigma^2+\frac{(b+2A(t))^2}{4k}\right).$$

따라서 모든 $q$에 대해 성립하려면

$$A'(t)-\frac12\eta\sigma^2+\frac{(b+2A(t))^2}{4k}=0, \qquad A(T)=-\alpha.\tag{6.35}$$

여기서 terminal condition은 역시 $h(T,q)=-\alpha q^2$이다.

결론적으로 지수효용의 위험회피계수 $\eta$는 execution 문제 안에서는 재고를 오래 들고 있을 때 발생하는 분산위험에 대한 벌점 $\phi$와 같은 역할을 한다. 즉 CARA 효용 문제와 quadratic inventory penalty 문제는 이 선형-가우시안 구조에서는 동일한 최적정책을 낳는다. 증명 끝.

∎

6.6절의 핵심 메시지

지수효용 문제를 정면으로 풀면 복잡해 보이지만, 지수형 ansatz 덕분에 결국 6.5절과 같은 Riccati 구조로 환원된다. 그래서 위험중립에 inventory penalty를 붙인 모형이 단지 편의적 장치가 아니라, CARA 투자자에게는 효용극대화의 확률론적 내용과 사실상 같은 역할을 한다.

6.7 Non-Linear Temporary Price Impact

마지막 절에서는 선형 일시충격 $f(v)=kv$ 가정을 버린다. 현실에서 큰 속도로 거래할수록 비용이 선형보다 더 빠르게 증가하는 경우가 많다. 그래서 $vf(v)$, 즉 단위시간당 총 충격비용을 볼록함수로 두는 일반화가 중요하다.

정의 6.7.1 — convex conjugate

볼록함수 $F$의 convex conjugate는 $$F^*(y)=\sup_{v\ge 0}\{yv-F(v)\}$$ 로 정의한다. 6.7절에서는 $F(v)=vf(v)$를 두어 HJB의 최적화항을 $F^*(-(bq+h_q))$로 줄인다. 이 변환이 비선형 impact 문제를 가장 압축적으로 쓰는 핵심 도구다.

원문의 일반화된 HJB

$$0=(\partial_t+\tfrac12\sigma^2\partial_{SS})H-\phi q^2+\sup_v\{(v(S-f(v))\partial_x-bv\partial_S-v\partial_q)H\},$$ $$H(T,x,S,q)=x+q(S-\alpha q).$$

다시 $H=x+qS+h(t,q)$를 넣으면

$$0=h_t-\phi q^2+\sup_v\{-vf(v)-(bq+h_q)v\},\qquad h(T,q)=-\alpha q^2.\tag{6.36}$$

여기서 $F(v)=vf(v)$라고 두자. $F$가 볼록이면 supremum 항은 정확히 convex conjugate $F^*$로 정리된다.

정리 6.7.1 — convex conjugate를 이용한 HJB 축소

증명. 6.7절의 축소된 HJB는

$$0=h_t-\phi q^2+\sup_{v\ge0}\{-vf(v)-(bq+h_q)v\}, \qquad h(T,q)=-\alpha q^2.\tag{6.36}$$

이다. 여기서

$$F(v):=vf(v)$$

라고 두면 $F$는 단위시간당 총 일시충격비용을 뜻한다. 그러면 supremum 항은

$$\sup_{v\ge0}\{-F(v)-(bq+h_q)v\}$$

가 된다. 이제

$$y:=-(bq+h_q)$$

라고 놓으면 위 식은 정확히

$$\sup_{v\ge0}\{yv-F(v)\}$$

와 같다. 그런데 convex conjugate의 정의가

$$F^*(y)=\sup_{v\ge0}\{yv-F(v)\}$$

였으므로, 곧바로

$$\sup_{v\ge0}\{-vf(v)-(bq+h_q)v\}=F^*(y)=F^*(-(bq+h_q)).\tag{6.37}$$

를 얻는다. 즉 여기에는 추가 계산이 숨어 있지 않다. 단지 HJB 안의 최적화항을 Legendre–Fenchel 변환의 표준 형태로 다시 쓴 것뿐이다.

이를 식 $(6.36)$에 대입하면 PDE는

$$0=h_t-\phi q^2+F^*(-(bq+h_q)), \qquad h(T,q)=-\alpha q^2.\tag{6.38}$$

로 정리된다. 따라서 비선형 충격문제의 계산적 어려움은 이제 $F^*$를 구하는 문제로 압축된다. 증명 끝.

∎

Figure 6.4 — power-law temporary impact가 최적전략에 미치는 효과

비선형 temporary impact $f(v)=kv^a$에서는 지수 $a$가 작을수록 같은 주문속도에 대한 한계비용 증가가 덜 가파르다. 따라서 agent는 초기 재고를 더 공격적으로 줄일 수 있다. 아래 그림은 여러 $a$값에서의 inventory path와 trading speed의 전형적 변화를 보여준다.

$Figure 6.4$

Figure 6.4. power-law temporary impact에서 $a$가 작아질수록 agent는 재고를 더 빨리 줄이고, $a$가 커질수록 아주 빠른 거래에 대한 벌점이 커져 거래속도 곡선이 더 억제된다.

정리 6.7.2 — power-law impact에서의 최적속도

증명. power-law temporary impact를

$$f(v)=kv^a,\qquad a>0$$

로 두면

$$F(v)=vf(v)=kv^{1+a}.$$

이제 convex conjugate

$$F^*(y)=\sup_{v\ge0}\{yv-kv^{1+a}\}$$

를 직접 계산한다. 우선 최대화할 함수

$$g(v):=yv-kv^{1+a}$$

를 보자.

첫째, $y\le0$이면 $v\ge0$에서 $yv\le0$이고 $-kv^{1+a}\le0$이므로 $g(v)\le0$이다. 이 경우 최댓값은 $v=0$에서 달성되고,

$$F^*(y)=0\qquad (y\le0).$$

둘째, $y>0$이면 내부해가 존재할 수 있다. 이때

$$g'(v)=y-k(1+a)v^a, \qquad g''(v)=-ka(1+a)v^{a-1}<0 \quad (v>0).$$

따라서 $g$는 오목하고, 일계조건이 전역최대점을 준다. 일계조건 $g'(v)=0$은

$$y-k(1+a)v^a=0$$

즉

$$v^*=\left(\frac{y}{k(1+a)}\right)^{1/a} \qquad (y>0).$$

이제 최대값을 계산한다. 일계조건에서

$$k(v^*)^a=\frac{y}{1+a}$$

이므로

$$k(v^*)^{1+a}=\frac{y}{1+a}v^*.$$

따라서

$$\begin{aligned} F^*(y) &=yv^*-k(v^*)^{1+a}\\ &=yv^*-\frac{y}{1+a}v^*\\ &=\frac{a}{1+a}yv^*\\ &=\frac{a}{1+a}y\left(\frac{y}{k(1+a)}\right)^{1/a}\\ &=\frac{a}{(1+a)^{1+1/a}}k^{-1/a}y^{1+1/a} \qquad (y>0). \end{aligned}$$

두 경우를 합치면

$$F^*(y)=\frac{a}{(1+a)^{1+1/a}}k^{-1/a}(y_+)^{1+1/a}.\tag{6.39}$$

이제 HJB에서 $y=-(bq+h_q)$를 대입하면 최적속도는 conjugate를 최대화하는 $v$이므로

$$v_t^*=\left(\frac{-(bQ_t+h_q(t,Q_t))_+}{k(1+a)}\right)^{1/a}.\tag{6.40}$$

마지막으로 $a=1$이면

$$F(v)=kv^2, \qquad F^*(y)=\frac{(y_+)^2}{4k}, \qquad v_t^*=\frac{-(bQ_t+h_q(t,Q_t))_+}{2k},$$

가 되어 선형 temporary impact 모형의 식으로 정확히 돌아간다. 따라서 power-law 모형은 6.5절의 선형모형을 포함하는 진정한 상위 일반화다. 증명 끝.

∎

6.7절의 본질

선형 모형은 계산이 깔끔하지만, 매우 큰 주문속도에서 비용이 너무 완만하게 증가한다는 한계가 있다. 비선형 충격을 넣으면 ‘아주 빠른 거래’에 대해 더 강한 벌점이 생기고, 따라서 최적속도는 큰 재고를 들고 있어도 선형모형보다 덜 폭발적으로 움직인다. 이것이 현실적인 시장충격 모형으로 가는 첫걸음이다.

'Financial Engineering > ALGORITHMIC AND HIGH-FREQUENCY TRADING' 카테고리의 다른 글

8 (0)	2026.03.22
Chapter 7. Optimal Execution with Continuous Trading II (0)	2026.03.22
Chapter 5. Stochastic Optimal Control and Stopping (0)	2026.03.22
Chapter 4. Empirical and Statistical Evidence: Activity and Market Quality (0)	2026.03.22
Chapter 3. Empirical and Statistical Evidence: Prices and Returns (0)	2026.03.22

GEON의 티스토리

Chapter 6. Optimal Execution with Continuous Trading I

Algorithmic and High-Frequency Trading
Chapter 6 — Optimal Execution with Continuous Trading I

A.1 시장미시구조와 Execution Cost의 기초

A.2 확률공간, \(\sigma\)-대수, filtration, predictable control

A.3 적분가능성, \(L^p\) 공간, 균등적분가능성

A.4 Radon–Nikodym 정리와 조건부기대의 존재

선형성

Pull-out property

Tower property

A.5 등가측도, 밀도과정, Bayes 공식, 뉴메레르 미분

A.6 Brownian motion, 확률적분, Itô 공식

A.7 지수마팅게일, Novikov 조건, Girsanov 정리

A.8 제어문제의 DPP, HJB, Verification

A.9 선형-이차 구조와 Riccati ODE

A.10 볼록해석과 Legendre transform

A.11 지수효용, certainty equivalent, Gaussian exponential moment

6.1 문제의식: 왜 연속시간 최적집행이 필요한가

6.2 The Model

6.3 Liquidation without Penalties: only Temporary Impact

6.4 Optimal Acquisition with Terminal Penalty and Temporary Impact

6.5 Liquidation with Permanent Price Impact

6.6 Execution with Exponential Utility Maximiser

6.7 Non-Linear Temporary Price Impact

'Financial Engineering > ALGORITHMIC AND HIGH-FREQUENCY TRADING' 카테고리의 다른 글

티스토리툴바

Chapter 6. Optimal Execution with Continuous Trading I

Algorithmic and High-Frequency TradingChapter 6 — Optimal Execution with Continuous Trading I

A.1 시장미시구조와 Execution Cost의 기초

A.2 확률공간, \(\sigma\)-대수, filtration, predictable control

A.3 적분가능성, \(L^p\) 공간, 균등적분가능성

A.4 Radon–Nikodym 정리와 조건부기대의 존재

선형성

Pull-out property

Tower property

A.5 등가측도, 밀도과정, Bayes 공식, 뉴메레르 미분

A.6 Brownian motion, 확률적분, Itô 공식

A.7 지수마팅게일, Novikov 조건, Girsanov 정리

A.8 제어문제의 DPP, HJB, Verification

A.9 선형-이차 구조와 Riccati ODE

A.10 볼록해석과 Legendre transform

A.11 지수효용, certainty equivalent, Gaussian exponential moment

6.1 문제의식: 왜 연속시간 최적집행이 필요한가

6.2 The Model

6.3 Liquidation without Penalties: only Temporary Impact

6.4 Optimal Acquisition with Terminal Penalty and Temporary Impact

6.5 Liquidation with Permanent Price Impact

6.6 Execution with Exponential Utility Maximiser

6.7 Non-Linear Temporary Price Impact

'Financial Engineering > ALGORITHMIC AND HIGH-FREQUENCY TRADING' 카테고리의 다른 글

'Financial Engineering/ALGORITHMIC AND HIGH-FREQUENCY TRADING' Related Articles

티스토리툴바

Algorithmic and High-Frequency Trading
Chapter 6 — Optimal Execution with Continuous Trading I