Algorithmic and High-Frequency Trading
Chapter 1 — Electronic Markets and the Limit Order Book
이 장은 전자시장과 지정가호가창(limit order book, LOB)의 구조를 설명한다. 시장참여자의 유형, 주문의 종류, 매칭 엔진의 작동 방식, 호가창의 수학적 서술이 핵심 내용이다. 특히 1.4절의 quoted spread·midprice·microprice 공식은 이후 모든 알고리즘 설계의 출발점이 된다. Part A는 이 책 전반에서 사용되는 측도론과 확률미적분의 언어를 정리한다. 각 섹션은 정의와 증명을 중복 없이 순서대로 쌓아 올린다.
Part A — 선수지식: 이 장을 이해하기 위한 수학적 기초
A.1 σ-대수, Borel 집합, 역상
확률론의 기초는 측도 가능한 집합의 모음을 정의하는 것이다. 어떤 사건에 확률을 부여하려면, 먼저 "사건"이 무엇인지 수학적으로 특정해야 한다. 그 역할을 하는 구조가 \(\sigma\)-대수다.
집합족 \(\mathcal{F} \subseteq 2^\Omega\)가 \(\sigma\)-대수라는 것은 다음 세 조건을 만족함이다.
- \(\Omega \in \mathcal{F}\)
- \(A \in \mathcal{F} \Rightarrow A^c \in \mathcal{F}\) (여집합에 대해 닫힘)
- \((A_n)_{n \ge 1} \subseteq \mathcal{F} \Rightarrow \bigcup_{n=1}^\infty A_n \in \mathcal{F}\) (가산합집합에 대해 닫힘)
(a) \(\varnothing \in \mathcal{F}\): \(\Omega \in \mathcal{F}\)이므로 조건 (2)에 의해 \(\Omega^c = \varnothing \in \mathcal{F}\).
(b) 가산교집합 닫힘: \((A_n) \subseteq \mathcal{F}\)이면 각 \(A_n^c \in \mathcal{F}\)이고, 조건 (3)에 의해 \(\bigcup_n A_n^c \in \mathcal{F}\). 드모르간 법칙으로 \(\bigl(\bigcup_n A_n^c\bigr)^c = \bigcap_n A_n \in \mathcal{F}\).
(c) 유한합집합 닫힘: \(B_n = A_n\,(n \le m)\), \(B_n = \varnothing\,(n > m)\)으로 두면 \(\bigcup_{n=1}^\infty B_n\)의 특수한 경우다.
왜 하필 가산(countable) 연산인가? 연속시간 확률과정에서는 유리수 시점들에 대한 사건을 세어 가며 전체 시공간 사건으로 확장하는 논리가 반복되기 때문이다. 가산 연산에 대한 닫힘이 그 최소 요건이다.
\(\mathbb{R}\) 위의 Borel \(\sigma\)-대수 \(\mathcal{B}(\mathbb{R})\)는 모든 열린집합들이 생성하는 가장 작은 \(\sigma\)-대수다. 반직선 \(\{(-\infty, a] : a \in \mathbb{R}\}\)도 \(\mathcal{B}(\mathbb{R})\)를 생성한다.
함수 \(X : \Omega \to \mathbb{R}\)에 대해 다음 두 조건은 동치다.
(i) \(X^{-1}(B) \in \mathcal{F}\) for all \(B \in \mathcal{B}(\mathbb{R})\)
(ii) \(X^{-1}((-\infty, a]) \in \mathcal{F}\) for all \(a \in \mathbb{R}\)
증명: (i)\(\Rightarrow\)(ii)는 자명. (ii)\(\Rightarrow\)(i): \(\mathcal{C} := \{B \subseteq \mathbb{R} : X^{-1}(B) \in \mathcal{F}\}\)로 정의하자.
- \(\mathbb{R} \in \mathcal{C}\): \(X^{-1}(\mathbb{R}) = \Omega \in \mathcal{F}\).
- 여집합 닫힘: \(B \in \mathcal{C}\)이면 \(X^{-1}(B^c) = (X^{-1}(B))^c \in \mathcal{F}\). 역상은 여집합 연산을 보존하기 때문이다. 즉 \(f^{-1}(B^c) = (f^{-1}(B))^c\).
- 가산합집합 닫힘: \((B_n) \subseteq \mathcal{C}\)이면 \(X^{-1}(\bigcup_n B_n) = \bigcup_n X^{-1}(B_n) \in \mathcal{F}\). 역상은 합집합 연산도 보존한다.
따라서 \(\mathcal{C}\)는 \(\sigma\)-대수다. 조건 (ii)에 의해 모든 반직선 \((-\infty, a] \in \mathcal{C}\). 반직선들이 \(\mathcal{B}(\mathbb{R})\)를 생성하므로 \(\mathcal{B}(\mathbb{R}) \subseteq \mathcal{C}\).
확률변수 \(X : \Omega \to \mathbb{R}\)가 가측이라는 것은 모든 \(B \in \mathcal{B}(\mathbb{R})\)에 대해 \(X^{-1}(B) \in \mathcal{F}\)임이다. "\(X \le a\)"라는 문장을 사건으로 표현하면 \(\{X \le a\} = X^{-1}((-\infty, a])\)인데, 이것이 \(\mathcal{F}\)에 속해야 확률을 부여할 수 있다. 역상은 함수와 집합 언어 사이의 번역기다. 또한 역상은 집합 연산(합집합, 교집합, 여집합)을 모두 보존한다는 성질이 있어, 정리 A.1.4처럼 "생성계만 확인해도 충분하다"는 강력한 결과를 준다.
A.2 확률측도와 기본 성질
\(P : \mathcal{F} \to [0,1]\)가 다음을 만족하면 확률측도라 한다.
- \(P(\Omega) = 1\)
- \(P(A) \ge 0\) for all \(A \in \mathcal{F}\)
- 서로소인 \((A_n) \subseteq \mathcal{F}\)에 대해 \(P\!\left(\bigcup_n A_n\right) = \sum_n P(A_n)\) (가산가법성)
(a) \(P(\varnothing) = 0\): \(\Omega = \Omega \cup \varnothing\)(서로소)이므로 \(P(\Omega) = P(\Omega) + P(\varnothing)\). 따라서 \(P(\varnothing) = 0\).
(b) \(P(A^c) = 1 - P(A)\): \(A \cup A^c = \Omega\)(서로소)이므로 \(1 = P(A) + P(A^c)\).
(c) 단조성: \(A \subseteq B\)이면 \(B = A \cup (B \setminus A)\)(서로소)이므로 \(P(B) = P(A) + P(B \setminus A) \ge P(A)\).
(d) 포함-배제: \(P(A \cup B) = P(A) + P(B) - P(A \cap B)\). \(A \cup B = A \cup (B \setminus A)\)(서로소)이고 \(B = (B \setminus A) \cup (A \cap B)\)에서 \(P(B \setminus A) = P(B) - P(A \cap B)\). 대입하면 결론.
(a) 증가열: \(A_1 \subseteq A_2 \subseteq \cdots\)이면 \(B_1 = A_1\), \(B_n = A_n \setminus A_{n-1}\)(\(n \ge 2\))으로 두면 \((B_n)\)은 서로소이고 \(\bigcup_n A_n = \bigcup_n B_n\). 가산가법성으로 $$P\!\left(\bigcup_n A_n\right) = \sum_{n=1}^\infty P(B_n) = \lim_{n \to \infty}\sum_{k=1}^n P(B_k) = \lim_{n \to \infty} P(A_n).$$
(b) 감소열: \(C_n = A_1 \setminus A_n\)으로 두면 증가열이고 \(\bigcup_n C_n = A_1 \setminus \bigcap_n A_n\). (a)를 적용하고 \(P(A_1)\)으로 정리하면 \(P(\bigcap_n A_n) = \lim_{n \to \infty} P(A_n)\).
A.3 확률변수, 독립성, 확률과정
함수 \(X : \Omega \to \mathbb{R}\)가 \(\mathcal{F}\)-가측, 즉 모든 \(\alpha \in \mathbb{R}\)에 대해 \(\{X \le \alpha\} \in \mathcal{F}\)를 만족하면 확률변수라 한다. \(\sigma(X) := \{X^{-1}(B) : B \in \mathcal{B}(\mathbb{R})\}\)를 \(X\)가 생성하는 \(\sigma\)-대수라 한다.
두 \(\sigma\)-대수 \(\mathcal{A}, \mathcal{B} \subseteq \mathcal{F}\)가 독립이라는 것은 모든 \(A \in \mathcal{A}\), \(B \in \mathcal{B}\)에 대해 \(P(A \cap B) = P(A)P(B)\)가 성립하는 것이다. 확률변수 \(X, Y\)가 독립이라는 것은 \(\sigma(X)\)와 \(\sigma(Y)\)가 독립이라는 뜻이다.
시간 집합 \(T\)(보통 \([0,\infty)\) 또는 \(\{0,1,2,\ldots\}\)) 위의 확률과정은 \(X = (X_t)_{t \in T}\)다. \(t\)를 고정하면 \(X_t\)는 확률변수이고, \(\omega\)를 고정하면 \(t \mapsto X_t(\omega)\)는 경로(path)다. 연속성은 경로에 대한 성질이고, 가측성은 \(\omega\)에 대한 성질이다.
A.4 Lebesgue 적분과 기대값
Lebesgue 적분은 단순함수의 적분을 먼저 정의한 뒤, 단조증가 근사 수열로 일반 함수로 확장한다. 이 구성 방식이 분포의 종류(이산/연속/혼합)에 무관하게 기대값을 통일적으로 처리하게 해 준다.
유한개의 값만 갖는 가측함수를 단순함수라 한다. $$\varphi = \sum_{k=1}^m a_k\, \mathbf{1}_{A_k}, \qquad A_k \in \mathcal{F},\quad A_k \text{ 서로소},\quad \bigcup_k A_k = \Omega.$$ 단순함수의 적분: \(\displaystyle\int_\Omega \varphi\, dP = \sum_{k=1}^m a_k P(A_k)\).
비음수 가측함수 \(X \ge 0\)에 대해: \(\varphi_n \uparrow X\)인 단순함수 수열 \((\varphi_n)\)을 잡아서 $$E[X] := \lim_{n \to \infty} E[\varphi_n] = \sup\{E[\varphi] : 0 \le \varphi \le X,\, \varphi \text{ 단순}\}.$$ 일반 \(X = X^+ - X^-\): 두 항이 모두 유한하면 \(E[X] := E[X^+] - E[X^-]\).
이 통합적 기대값의 강점은 분포가 이산인지 연속인지를 묻지 않는다는 것이다. 이산 경우는 \(E[X] = \sum_i x_i P(X = x_i)\), 연속형은 밀도 \(f_X\)가 있을 때 \(E[X] = \int_{-\infty}^\infty x\, f_X(x)\, dx\)로 나타나지만, 두 경우 모두 \(E[X] = \int_\Omega X(\omega)\, dP(\omega)\)의 특수한 경우다.
(a) 선형성: \(E[aX + bY] = aE[X] + bE[Y]\)
(b) 단조성: \(X \le Y\) a.s. \(\Rightarrow E[X] \le E[Y]\)
(c) 무의식적 통계학자 공식: \(X\)의 밀도가 \(p\)이면 \(E[f(X)] = \int_{-\infty}^\infty f(x)p(x)\, dx\)
A.5 \(L^p\) 공간과 \(L^2\) 내적 기하학
확률공간 \((\Omega, \mathcal{F}, P)\) 위에서: \(X \in L^1\)은 \(E[|X|] < \infty\), \(X \in L^2\)은 \(E[X^2] < \infty\).
Cauchy-Schwarz에 의해 \(E[|X|] \le \sqrt{E[X^2]} < \infty\)이므로 \(L^2 \subseteq L^1\). \(L^2\)에서 내적을 정의한다.
$$\langle X, Y \rangle := E[XY], \qquad \|X\|_{L^2} = \sqrt{E[X^2]}.$$\(\langle X, Y \rangle = 0\)이면 \(X\)와 \(Y\)가 직교(orthogonal)한다고 한다.
\(L^2\)는 내적이 잘 정의된 완비 힐베르트 공간이다. \(\mathcal{G}\)-가측인 \(L^2\) 변수들의 부분공간 \(L^2(\mathcal{G})\)에 대해, \(E[X \mid \mathcal{G}]\)는 \(X\)를 이 부분공간으로 정사영(orthogonal projection)한 것이다.
\(X \in L^2\), \(Y := E[X \mid \mathcal{G}]\)라 하면:
(a) 직교성: 모든 \(Z \in L^2(\mathcal{G})\)에 대해 \(E[(X-Y)Z] = 0\).
증명: \(Z\)가 \(\mathcal{G}\)-가측이므로 Tower property와 pull-out property를 적용하면 $$E[(X-Y)Z] = E[E[(X-Y)Z \mid \mathcal{G}]] = E[Z \cdot E[X-Y \mid \mathcal{G}]] = E[Z \cdot 0] = 0.$$ 마지막 등식에서 \(E[Y \mid \mathcal{G}] = Y\) (\(Y\)가 \(\mathcal{G}\)-가측)를 사용했다.
(b) 피타고라스 정리와 최소제곱 최적성: \(X - Z = (X-Y) + (Y-Z)\)로 분해하고 제곱하면, 교차항 \(2E[(X-Y)(Y-Z)] = 0\)(직교성)으로 소거되어 $$E[(X-Z)^2] = E[(X-Y)^2] + E[(Y-Z)^2] \ge E[(X-Y)^2].$$ 따라서 \(Y = E[X \mid \mathcal{G}]\)는 \(L^2(\mathcal{G})\) 안에서 \(X\)와의 평균제곱오차를 최소화한다.
A.6 수렴정리: MCT, Fatou, DCT
이 세 정리는 "적분(기대값)과 극한의 순서를 교환할 수 있는가"를 각각 다른 조건 아래에서 다룬다. \(\text{limsup}\)과 \(\text{liminf}\)의 정의: \(\limsup_{n\to\infty} x_n := \lim_{n\to\infty}\sup_{k \ge n} x_k\), \(\liminf_{n\to\infty} x_n := \lim_{n\to\infty}\inf_{k \ge n} x_k\). Fatou에서는 tail infimum \(Y_n := \inf_{k \ge n} X_k\)를 잡으면 \(Y_n \uparrow \liminf_n X_n\)이 되어 MCT를 적용하게 된다.
진술: \(0 \le X_n \uparrow X\) a.s.이면 \(E[X_n] \uparrow E[X]\).
증명: \(X_n \le X\)이므로 단조성에서 \(E[X_n] \le E[X]\)는 명확하다. \(\liminf E[X_n] \ge E[X]\)를 보인다.
임의의 단순함수 \(\varphi = \sum_k a_k \mathbf{1}_{A_k} \le X\)와 \(\varepsilon \in (0,1)\)에 대해, \(A_n^{(k)} := \{X_n \ge (1-\varepsilon)a_k\} \cap A_k\)는 \(n\)에 대해 증가하여 \(A_k\)로 수렴한다. 측도 연속성에 의해 \(P(A_n^{(k)}) \to P(A_k)\)이다. 따라서 $$E[X_n] \ge (1-\varepsilon)\sum_k a_k P(A_n^{(k)}) \xrightarrow{n\to\infty} (1-\varepsilon)E[\varphi].$$ \(\varepsilon \downarrow 0\)이고 모든 \(\varphi \le X\)에 대해 상한을 취하면 \(\liminf E[X_n] \ge E[X]\).
진술: \(X_n \ge 0\)이면 \(E[\liminf_{n\to\infty} X_n] \le \liminf_{n\to\infty} E[X_n]\).
증명: \(Y_n := \inf_{k \ge n} X_k\)라 두면 \(Y_n \uparrow \liminf X_n\)이고 \(Y_n \le X_n\). MCT를 적용하면: $$E[\liminf X_n] = E[\lim_n Y_n] = \lim_n E[Y_n] \le \liminf_n E[X_n].$$
진술: \(X_n \to X\) a.s., \(|X_n| \le Y \in L^1\)이면 \(E[X_n] \to E[X]\).
증명: \(Y + X_n \ge 0\)와 \(Y - X_n \ge 0\)에 Fatou를 각각 적용한다.
\(Y + X_n\)에 Fatou 적용: \(E[Y + X] \le \liminf E[Y + X_n] = E[Y] + \liminf E[X_n]\). 따라서 $$E[X] \le \liminf_{n\to\infty} E[X_n]. \tag{1}$$
\(Y - X_n\)에 Fatou 적용: \(E[Y - X] \le \liminf E[Y - X_n] = E[Y] - \limsup E[X_n]\). 따라서 $$\limsup_{n\to\infty} E[X_n] \le E[X]. \tag{2}$$
(1)과 (2)를 합치면 \(E[X] \le \liminf E[X_n] \le \limsup E[X_n] \le E[X]\)이므로 \(E[X_n] \to E[X]\).
\(X_n = n\mathbf{1}_{(0,1/n)}\) on \((0,1)\). 점별로 \(X_n \to 0\)이지만 \(E[X_n] = 1\) for all \(n\). 이것이 "지배 조건"이라는 이름의 이유다.
A.7 Radon-Nikodym 정리
두 유한측도 \(\nu, \mu\)에 대해 \(\mu(A) = 0 \Rightarrow \nu(A) = 0\)(\(\forall A \in \mathcal{F}\))이면 \(\nu \ll \mu\)라 쓰고 \(\nu\)가 \(\mu\)에 절대연속이라 한다.
진술: \(\nu \ll \mu\)인 유한측도 \(\nu,\mu\)가 주어지면 어떤 \(\mathcal{F}\)-가측 함수 \(f \ge 0\)가 존재하여 모든 \(A \in \mathcal{F}\)에 대해 \(\nu(A)=\int_A f\,d\mu\)가 성립한다. 이 \(f\)를 \(\dfrac{d\nu}{d\mu}\)라 한다. 또한 \(f\)는 \(\mu\)-a.s. 유일하다.
1단계: 허용 가능한 후보 함수들의 집합. \(\mathcal{C}:=\{g\ge 0\text{ 가측}: \int_A g\,d\mu \le \nu(A)\ \forall A\in\mathcal{F}\}\)로 두고 \(\alpha:=\sup_{g\in\mathcal C}\int g\,d\mu\)를 정의한다. \(g=0\)가 가능하므로 \(\mathcal C\neq\varnothing\)이고, 모든 \(g\in\mathcal C\)에 대해 \(\int g\,d\mu \le \nu(\Omega) < \infty\)이므로 \(\alpha\)는 잘 정의된다.
2단계: 상한을 향하는 증가수열 구성. \(\int g_n\,d\mu \uparrow \alpha\)가 되도록 \(g_n\in\mathcal C\)를 택한다. 이제 \(f_n:=\max\{g_1,\dots,g_n\}\)라 두면 \(f_n\uparrow f\)인 가측함수 \(f\)가 존재한다. 각 \(f_n\)이 \(\mathcal C\)에 속함을 보이자. \(B_k:=\{f_n=g_k\}\setminus\bigcup_{j $$\int_A f_n\,d\mu=\sum_{k=1}^n\int_{A\cap B_k} g_k\,d\mu \le \sum_{k=1}^n \nu(A\cap B_k)=\nu(A).$$ 따라서 \(f_n\in\mathcal C\)다. 단조수렴정리로 모든 \(A\)에 대해 \(\int_A f\,d\mu=\lim_n\int_A f_n\,d\mu \le \nu(A)\)이므로 \(f\in\mathcal C\), 또한 \(\int f\,d\mu=\alpha\)다.
3단계: 잔여측도는 0이어야 한다. \(\lambda(A):=\nu(A)-\int_A f\,d\mu\)로 두면 \(\lambda\)는 음이 아닌 유한측도다. 만약 \(\lambda\not\equiv 0\)이면 \(\lambda(\Omega)>0\)이다. 이제 집합족 \(\mathcal D:=\{B\in\mathcal F: \mu(B)>0\}\)를 생각하자. 만약 모든 \(B\in\mathcal D\)와 모든 \(\varepsilon>0\)에 대해 \(\lambda(B)\le \varepsilon\mu(B)\)가 성립한다면, 특히 \(\varepsilon=1/m\)을 대입하여 모든 \(m\)에 대해 \(\lambda(B)\le \mu(B)/m\)가 되어 \(m\to\infty\)에서 \(\lambda(B)=0\)를 얻는다. 이는 \(\lambda(\Omega)>0\)와 모순이다. 따라서 어떤 \(\varepsilon_0>0\)와 \(B\in\mathcal F\)가 존재하여 \(\lambda(B)>\varepsilon_0\mu(B)\)를 만족한다. 이제 \(f^*:=f+\varepsilon_0\mathbf 1_B\)라 두면 임의의 \(A\in\mathcal F\)에 대해
$$\int_A f^*\,d\mu=\int_A f\,d\mu+\varepsilon_0\mu(A\cap B) \le \int_A f\,d\mu+\lambda(A\cap B) \le \nu(A).$$
즉 \(f^*\in\mathcal C\)다. 그러나
$$\int f^*\,d\mu=\int f\,d\mu+\varepsilon_0\mu(B)>\int f\,d\mu=\alpha,$$
이 되어 \(\alpha\)의 상한 정의와 모순이다. 그러므로 \(\lambda\equiv 0\)이고, 결국 모든 \(A\)에 대해 \(\nu(A)=\int_A f\,d\mu\)다.
4단계: 유일성. \(f,g\)가 둘 다 RN 도함수라고 하자. 그러면 모든 \(A\)에 대해 \(\int_A(f-g)\,d\mu=0\)다. 특히 \(A_+:=\{f>g\}\)를 택하면 \(f-g>0\)가 \(A_+\)에서 성립하므로 적분이 0이려면 \(\mu(A_+)=0\)여야 한다. 대칭적으로 \(A_-:=\{g>f\}\)도 \(\mu(A_-)=0\). 따라서 \(f=g\) \(\mu\)-a.s.
Radon-Nikodym 도함수는 금융에서 likelihood ratio, state-price density, pricing kernel, density process, change-of-measure factor로 모습을 바꾸며 계속 재등장한다. Girsanov 정리, 위험중립 가격결정, filtering의 공통 핵심이다. \(Z(\omega)\)는 시나리오 \(\omega\)별로 원래 확률을 얼마나 재가중하는지를 나타낸다.
A.8 조건부기댓값: 정의, 존재·유일성, 핵심 성질
\(X \in L^1\)과 부분 \(\sigma\)-대수 \(\mathcal{G} \subseteq \mathcal{F}\)가 주어졌을 때, \(\mathcal{G}\)-가측 확률변수 \(Y\)가 다음 두 조건을 만족하면 \(Y = E[X \mid \mathcal{G}]\)라 한다.
(i) \(Y\)는 \(\mathcal{G}\)-가측이다.
(ii) 모든 \(A \in \mathcal{G}\)에 대해 \(\displaystyle\int_A Y\, dP = \int_A X\, dP\) (부분평균 항등식).
존재: \(\mathcal{G}\) 위에 \(\nu(A) := \int_A X\, dP\)로 signed measure를 정의하자. \(P(A) = 0 \Rightarrow \nu(A) = 0\)이므로 \(\nu \ll P|_{\mathcal{G}}\). Radon-Nikodym 정리에 의해 \(\mathcal{G}\)-가측 함수 \(Y\)가 존재하여 \(\nu(A) = \int_A Y\, dP\;(\forall A \in \mathcal{G})\).
유일성: \(Y_1, Y_2\)가 둘 다 조건부기댓값이라면 모든 \(A \in \mathcal{G}\)에 대해 \(\int_A(Y_1 - Y_2)\, dP = 0\). \(A_n := \{Y_1 - Y_2 > 1/n\} \in \mathcal{G}\)를 대입하면 \(P(A_n) = 0\). 따라서 \(Y_1 = Y_2\) a.s.
(a) 선형성: \(E[aX + bY \mid \mathcal{G}] = aE[X \mid \mathcal{G}] + bE[Y \mid \mathcal{G}]\)
증명: \(Y_0 := aE[X \mid \mathcal{G}] + bE[Y \mid \mathcal{G}]\)는 \(\mathcal{G}\)-가측. 임의의 \(A \in \mathcal{G}\)에 대해 \(\int_A Y_0\, dP = a\int_A X\, dP + b\int_A Y\, dP = \int_A(aX+bY)\, dP\).
(b) 단조성: \(X \le Y\) a.s. \(\Rightarrow E[X \mid \mathcal{G}] \le E[Y \mid \mathcal{G}]\) a.s.
증명: \(U := E[Y-X \mid \mathcal{G}]\). \(P(U < 0) > 0\)이면 \(A := \{U < 0\} \in \mathcal{G}\)에서 \(\int_A U\, dP < 0\)이지만 \(\int_A(Y-X)\, dP \ge 0\). 모순.
(c) 총기댓값 법칙: \(E[E[X \mid \mathcal{G}]] = E[X]\)
증명: 정의에서 \(A = \Omega\)를 대입하면 \(\int_\Omega E[X \mid \mathcal{G}]\, dP = \int_\Omega X\, dP\).
(d) Pull-out property: \(Z\)가 bounded \(\mathcal{G}\)-가측이면 \(E[ZX \mid \mathcal{G}] = Z\, E[X \mid \mathcal{G}]\)
증명: \(Z = \sum_k c_k \mathbf{1}_{A_k}\) (비음수 단순 \(\mathcal{G}\)-가측)인 경우, 임의의 \(B \in \mathcal{G}\)에 대해 \(B \cap A_k \in \mathcal{G}\)이므로 $$\int_B Z E[X \mid \mathcal{G}]\, dP = \sum_k c_k \int_{B \cap A_k} E[X \mid \mathcal{G}]\, dP = \sum_k c_k \int_{B \cap A_k} X\, dP = \int_B ZX\, dP.$$ 일반 bounded \(Z\)는 단순함수 근사와 DCT로 얻는다.
(e) Tower property: \(\mathcal{H} \subseteq \mathcal{G}\)이면 \(E[E[X \mid \mathcal{G}] \mid \mathcal{H}] = E[X \mid \mathcal{H}]\)
증명: \(W := E[X \mid \mathcal{G}]\). 임의의 \(A \in \mathcal{H}\)에 대해 \(\mathcal{H} \subseteq \mathcal{G}\)이므로 \(A \in \mathcal{G}\). 따라서 \(\int_A E[W \mid \mathcal{H}]\, dP = \int_A W\, dP = \int_A X\, dP\).
진술: \(X \in L^1\)이고 \(X\)가 \(\mathcal{G}\)와 독립이면 \(E[X \mid \mathcal{G}] = E[X]\) a.s.
증명: \(E[X]\)는 상수이므로 \(\mathcal{G}\)-가측이다. 임의의 \(A \in \mathcal{G}\)에 대해 \(\mathbf{1}_A\)는 \(\mathcal{G}\)-가측이고 \(X\)와 독립이므로 $$E[X \mathbf{1}_A] = E[X] \cdot P(A) = \int_A E[X]\, dP.$$
진술: 볼록함수 \(c : \mathbb{R} \to \mathbb{R}\)이고 \(c(\xi) \in L^1\)이면 \(c(E[\xi \mid \mathcal{G}]) \le E[c(\xi) \mid \mathcal{G}]\) a.s.
증명: 볼록함수 \(c\)는 \(c(x) = \sup\{L(x) : L \text{ 아핀},\, L \le c\}\)로 표현된다. 임의의 지지 아핀 함수 \(L(x) = ax + b \le c(x)\)에 대해 조건부기댓값의 단조성과 선형성으로 $$E[c(\xi) \mid \mathcal{G}] \ge E[L(\xi) \mid \mathcal{G}] = aE[\xi \mid \mathcal{G}] + b = L(E[\xi \mid \mathcal{G}]).$$ 모든 \(L\)에 대해 상한을 취하면 결론.
A.9 Filtration, Adapted 과정, Stopping Time
\(\mathcal{F}_0 \subseteq \mathcal{F}_1 \subseteq \cdots\)인 \(\sigma\)-대수의 증가열 \((\mathcal{F}_n)_{n \ge 0}\)을 filtration이라 한다. 각 \(n\)에 대해 \(X_n\)이 \(\mathcal{F}_n\)-가측인 과정을 filtration에 적합(adapted)한다고 한다. \(\mathcal{F}_t\)는 "시각 \(t\)까지 관측 가능한 모든 사건의 모음"이다. 확률과정 \(X\)에 대한 자연 filtration은 \(\mathcal{F}_t^X := \sigma\!\left(\bigcup_{s \le t}\sigma(X_s)\right)\)다.
랜덤시각 \(\tau : \Omega \to \{0,1,\ldots,\infty\}\)가 모든 \(n \ge 0\)에 대해 \(\{\tau \le n\} \in \mathcal{F}_n\)를 만족하면 stopping time이라 한다. 연속시간에서는 모든 \(t \ge 0\)에 대해 \(\{\tau \le t\} \in \mathcal{F}_t\).
진술: \(X_n\)이 adapted이고 \(B \in \mathcal{B}(\mathbb{R})\)이면 \(\tau_B := \inf\{n \ge 0 : X_n \in B\}\)는 stopping time이다.
증명: \(\{\tau_B \le n\} = \bigcup_{k=0}^n \{X_k \in B\}\). 각 \(\{X_k \in B\} \in \mathcal{F}_k \subseteq \mathcal{F}_n\)이고, 유한합집합 닫힘에 의해 \(\{\tau_B \le n\} \in \mathcal{F}_n\).
A.10 마팅게일: 정의, Doob 마팅게일, 최대 부등식
적합 과정 \((M_n)_{n \ge 0}\)이 다음 세 조건을 만족하면 마팅게일(martingale)이라 한다. (i) 모든 \(n\)에 대해 \(E[|M_n|] < \infty\). (ii) \((M_n)\)은 adapted. (iii) 모든 \(m \le n\)에 대해 \(E[M_n \mid \mathcal{F}_m] = M_m\). 조건 (iii)에서 \(\ge\)이면 서브마팅게일, \(\le\)이면 슈퍼마팅게일이다.
진술: \(X \in L^1\)이고 filtration \((\mathcal{F}_n)\)이 주어질 때 \(M_n := E[X \mid \mathcal{F}_n]\)으로 정의하면 \((M_n)\)은 마팅게일이다.
증명: Adaptedness는 정의에서 자명. 적분가능성: Jensen으로 \(E|M_n| \le E[E(|X| \mid \mathcal{F}_n)] = E|X| < \infty\). 마팅게일 성질: Tower property로 \(m \le n\)이면 \(\mathcal{F}_m \subseteq \mathcal{F}_n\)이므로 $$E[M_n \mid \mathcal{F}_m] = E[E[X \mid \mathcal{F}_n] \mid \mathcal{F}_m] = E[X \mid \mathcal{F}_m] = M_m.$$
진술: 비음수 서브마팅게일 \((\xi_n)\)에 대해 임의의 \(\lambda > 0\)에 대해 \(P(\max_{0 \le k \le n}\xi_k \ge \lambda) \le \frac{1}{\lambda}E[\xi_n]\).
증명: \(\tau := \inf\{k : \xi_k \ge \lambda\}\)(없으면 \(n\))는 유계 stopping time이다. \(A := \{\max_{k \le n}\xi_k \ge \lambda\} = \{\tau \le n\}\) 위에서 \(\xi_\tau \ge \lambda\)이다. Optional sampling으로 \(E[\xi_n] \ge E[\xi_\tau]\). 사건 \(A\)를 기준으로 분해하면: $$E[\xi_n] \ge E[\xi_\tau \mathbf{1}_A] + E[\xi_n \mathbf{1}_{A^c}] \ge \lambda P(A) + E[\xi_n \mathbf{1}_{A^c}].$$ \(E[\xi_n] = E[\xi_n \mathbf{1}_A] + E[\xi_n \mathbf{1}_{A^c}]\)이므로 \(E[\xi_n \mathbf{1}_A] \ge \lambda P(A)\). 따라서 \(P(A) \le \frac{1}{\lambda}E[\xi_n]\).
A.11 Stopped Process, OST, 균등적분가능성, 마팅게일 수렴
진술: \(M_n\)이 마팅게일이고 \(\tau\)가 stopping time이면 \(M_n^\tau := M_{n \wedge \tau}\)도 마팅게일이다.
증명: 먼저 \(M_n^\tau\)가 \(\mathcal F_n\)-가측임을 확인한다. \(\tau \wedge n \le n\)이고 \(\tau\)가 stopping time이므로 \(\{\tau \wedge n = k\}\in\mathcal F_n\)이다. 따라서
$$M_n^\tau=\sum_{k=0}^{n-1}M_k\,\mathbf 1_{\{\tau=k\}}+M_n\,\mathbf 1_{\{\tau\ge n\}}$$
는 \(\mathcal F_n\)-가측이다. 적분가능성은 \(|M_n^\tau|\le \sum_{k=0}^n |M_k|\mathbf 1_{\{\tau\wedge n=k\}}\)이므로 각 \(M_k\in L^1\)에서 따라온다.
이제 마팅게일 성질을 보인다. 차분을 \(\Delta M_k:=M_k-M_{k-1}\)라 두면
$$M_n^\tau=M_0+\sum_{k=1}^n \mathbf 1_{\{\tau\ge k\}}\Delta M_k.$$
\(\{\tau\ge k\}=\{\tau\le k-1\}^c\in\mathcal F_{k-1}\)이므로 \(\mathbf 1_{\{\tau\ge k\}}\)는 \(\mathcal F_{k-1}\)-가측이다. 따라서
$$\begin{aligned} E[M_n^\tau\mid \mathcal F_{n-1}] &=E\!\left[M_{n-1}^\tau+\mathbf 1_{\{\tau\ge n\}}\Delta M_n \,\middle|\,\mathcal F_{n-1}\right]\\ &=M_{n-1}^\tau+\mathbf 1_{\{\tau\ge n\}}E[\Delta M_n\mid\mathcal F_{n-1}]\\ &=M_{n-1}^\tau. \end{aligned}$$
마지막 등식은 \(M\)이 마팅게일이므로 \(E[\Delta M_n\mid\mathcal F_{n-1}]=0\)이기 때문이다. 따라서 \(M^\tau\)는 마팅게일이다.
진술: \(M_n\)이 마팅게일이고 \(\sigma,\tau\)가 stopping time이며 \(\sigma\le \tau \le N\) a.s.이면 \(E[M_\tau\mid\mathcal F_\sigma]=M_\sigma\) a.s.
증명: \(\tau\le N\)이므로 정리 A.11.1에 의해 \(M_n^\tau:=M_{n\wedge\tau}\)는 마팅게일이다. 특히 \(M_N^\tau=M_\tau\)다.
조건부기댓값의 정의를 직접 확인하자. \(\mathcal F_\sigma\)-가측인 변수 \(M_\sigma\)가 \(M_\tau\)의 \(\mathcal F_\sigma\)-조건부기댓값이 되려면 임의의 \(A\in\mathcal F_\sigma\)에 대해
$$E[\mathbf 1_A M_\tau]=E[\mathbf 1_A M_\sigma]$$
를 보이면 충분하다. \(A_m:=A\cap\{\sigma=m\}\)라 두면 \(A_m\in\mathcal F_m\)이고 \(A=\bigsqcup_{m=0}^N A_m\)다. 따라서
$$E[\mathbf 1_A M_\tau]=\sum_{m=0}^N E[\mathbf 1_{A_m}M_\tau]=\sum_{m=0}^N E[\mathbf 1_{A_m}M_N^\tau].$$
마팅게일 \(M^\tau\)에 대해 \(A_m\in\mathcal F_m\)이므로
$$E[\mathbf 1_{A_m}M_N^\tau]=E\!\left[\mathbf 1_{A_m}E[M_N^\tau\mid\mathcal F_m]\right]=E[\mathbf 1_{A_m}M_m^\tau].$$
그런데 \(A_m\subseteq\{\sigma=m\}\)이고 \(\sigma\le\tau\)이므로 \(m\le\tau\)가 \(A_m\) 위에서 성립한다. 따라서 \(M_m^\tau=M_m=M_\sigma\) on \(A_m\). 그러므로
$$E[\mathbf 1_{A_m}M_N^\tau]=E[\mathbf 1_{A_m}M_\sigma].$$
이를 \(m=0,\dots,N\)에 대해 합하면 \(E[\mathbf 1_A M_\tau]=E[\mathbf 1_A M_\sigma]\)가 된다. 따라서 \(E[M_\tau\mid\mathcal F_\sigma]=M_\sigma\) a.s.
\(S_n=\sum_{k=1}^n\eta_k\)(대칭 랜덤워크), \(\alpha_n=2^{n-1}\), \(G_n=\sum_{k=1}^n\alpha_k\eta_k\), \(\tau=\min\{n:\eta_n=+1\}\)로 두면 \(G_n\)은 마팅게일이고 \(G_\tau=1\)이다. 그러나 \(\tau\)는 유계가 아니고 \(\{G_{n\wedge\tau}\}\)도 균등적분가능하지 않다. 실제로
$$E[G_\tau]=1\neq 0=E[G_0].$$
즉 stopping time이라는 사실만으로는 충분하지 않고, 유계성이나 균등적분가능성과 같은 추가 조건이 필요하다.
적분가능 확률변수족 \(\{X_n\}_{n\ge 1}\)이 균등적분가능하다는 것은
$$\lim_{M\to\infty}\sup_n E\!\left[|X_n|\mathbf 1_{\{|X_n|>M\}}\right]=0$$
가 성립한다는 뜻이다. 같은 식을 적분기호로 쓰면
$$\lim_{M\to\infty}\sup_n \int_{\{|X_n|>M\}}|X_n|\,dP=0$$
이다. 이 정의는 꼬리 부분의 질량이 지수 \(n\)에 대해 동시에 사라진다는 뜻이다.
실수 \(a완전한 상향횡단이란 어떤 시점에서 \(a\) 이하로 내려간 뒤, 그 이후 어떤 시점에서 \(b\) 이상으로 올라오는 사건이다.
정확히는 \(T_1:=\inf\{k\le n:x_k\le a\}\), \(S_1:=\inf\{k>T_1:x_k\ge b\}\), 이어서 \(T_2:=\inf\{k>S_1:x_k\le a\}\), \(S_2:=\inf\{k>T_2:x_k\ge b\}\) 등을 순차적으로 정의한다. 이때 \(S_m\le n\)인 \(m\)의 개수를 \(U_n(a,b)\)라 하고, 이를 \(n\)시점까지의 상향횡단수라 한다.
진술: \((X_n)\)이 서브마팅게일이고 \(a
$$ (b-a)\,E[U_n(a,b)]\le E[(X_n-a)^+]. $$
증명: 경로 하나를 고정하고, 과정이 \(a\) 이하일 때 한 단위를 매수하고 \(b\) 이상이 되면 이를 매도하는 예측가능 전략을 만든다. 이를 위해
$$H_{k-1}(\omega):= \begin{cases} 1,&\text{시점 }k-1\text{에서 이미 매수했고 아직 매도하지 않은 상태일 때},\\ 0,&\text{그 밖의 경우} \end{cases}$$
로 둔다. \(H_{k-1}\)는 \(X_0,\dots,X_{k-1}\)만으로 결정되므로 \(\mathcal F_{k-1}\)-가측이다. 누적 이익을
$$G_n:=\sum_{k=1}^n H_{k-1}(X_k-X_{k-1})$$
라 두자. \(0\le H_{k-1}\le 1\)이고 \(X\)가 서브마팅게일이므로 각 \(k\)에 대해
$$E[H_{k-1}(X_k-X_{k-1})]=E\!\left[H_{k-1}E[X_k-X_{k-1}\mid\mathcal F_{k-1}]\right]\ge 0.$$
이를 \(k=1,\dots,n\)에 대해 합하면 \(E[G_n]\ge 0\)이다.
이제 경로별 하계를 계산한다. 완전한 상향횡단이 한 번 일어날 때마다, 매수 가격은 \(a\) 이하이고 매도 가격은 \(b\) 이상이므로 그 한 번의 순이익은 적어도 \(b-a\)다. 따라서 \(U_n(a,b)\)번의 완전한 상향횡단이 끝난 후의 누적 이익은 적어도 \((b-a)U_n(a,b)\)이다. 다만 시점 \(n\)에 마지막 거래가 아직 열려 있을 수 있다. 이 경우 현재 평가손익은 \(X_n-a\)보다 작지 않다. 만약 \(X_n
$$G_n\ge (b-a)U_n(a,b)+(X_n-a)^--0-(X_n-a)^+.$$ 위 식에서 \((X_n-a)^-\ge 0\)이므로 약한 형태 $$G_n\ge (b-a)U_n(a,b)-(X_n-a)^+$$ 를 얻는다. 기대값을 취하면 $$0\le E[G_n]\ge (b-a)E[U_n(a,b)]-E[(X_n-a)^+],$$ 즉 $$ (b-a)E[U_n(a,b)]\le E[(X_n-a)^+]. $$ 원하는 결론이 나왔다.
진술: \(X_n\to X\) a.s.이고 \(\{X_n\}\)이 균등적분가능하면 \(X\in L^1\)이고 \(E[|X_n-X|]\to 0\)이다.
증명: 먼저 \(X\)가 적분가능함을 보인다. UI에 의해 어떤 \(M_0>0\)가 존재하여 \(\sup_n E[|X_n|\mathbf 1_{\{|X_n|>M_0\}}]\le 1\)이 된다. 그러면 모든 \(n\)에 대해
$$E|X_n|=E[|X_n|\mathbf 1_{\{|X_n|\le M_0\}}]+E[|X_n|\mathbf 1_{\{|X_n|>M_0\}}]\le M_0+1.$$
따라서 \(\sup_n E|X_n|<\infty\)다. Fatou 정리에 의해
$$E|X|\le \liminf_{n\to\infty}E|X_n|<\infty,$$
즉 \(X\in L^1\)이다.
이제 \(L^1\) 수렴을 보인다. 임의의 \(\varepsilon>0\)를 잡자. UI 정의에 의해 어떤 \(M>0\)를 선택하여
$$\sup_n E[|X_n|\mathbf 1_{\{|X_n|>M\}}]<\varepsilon$$
가 되게 할 수 있다. 또한 \(X\in L^1\)이므로 \(M\)을 더 크게 잡아
$$E[|X|\mathbf 1_{\{|X|>M\}}]<\varepsilon$$
도 성립하게 한다.
절단변수 \(X_n^{(M)}:=(-M)\vee(X_n\wedge M)\), \(X^{(M)}:=(-M)\vee(X\wedge M)\)를 정의한다. \(|X_n^{(M)}-X^{(M)}|\le 2M\)이고 \(X_n^{(M)}\to X^{(M)}\) a.s.이므로 지배수렴정리로
$$E|X_n^{(M)}-X^{(M)}|\longrightarrow 0.$$
한편
$$|X_n-X|\le |X_n-X_n^{(M)}|+|X_n^{(M)}-X^{(M)}|+|X^{(M)}-X|.$$
양변의 기대값을 취하면
$$E|X_n-X|\le E[|X_n|\mathbf 1_{\{|X_n|>M\}}]+E|X_n^{(M)}-X^{(M)}|+E[|X|\mathbf 1_{\{|X|>M\}}].$$
첫째 항은 \(\varepsilon\) 이하, 셋째 항도 \(\varepsilon\) 이하이며, 둘째 항은 \(n\to\infty\)로 보내면 0이 된다. 따라서 충분히 큰 \(n\)에 대해 \(E|X_n-X|\le 3\varepsilon\). \(\varepsilon\)는 임의였으므로 \(E|X_n-X|\to 0\)이다.
진술: 마팅게일 \((M_n)\)에 대해 다음 세 조건은 서로 동치다.
(i) \(\{M_n\}\)은 균등적분가능하다.
(ii) 어떤 \(M_\infty\in L^1\)가 존재하여 \(M_n\to M_\infty\) in \(L^1\).
(iii) 어떤 \(M_\infty\in L^1\)가 존재하여 모든 \(n\)에 대해 \(M_n=E[M_\infty\mid\mathcal F_n]\) a.s.
1단계: (ii) \(\Rightarrow\) (iii). \(M_n\to M_\infty\) in \(L^1\)라고 하자. 고정된 \(n\)을 잡고 \(m\ge n\)에 대해 마팅게일 성질을 쓰면
$$M_n=E[M_m\mid\mathcal F_n].$$
조건부기댓값은 \(L^1\)-축약사상이다. 즉
$$E\bigl|E[M_m-M_\infty\mid\mathcal F_n]\bigr|\le E|M_m-M_\infty| \xrightarrow[m\to\infty]{}0.$$
따라서 \(E[M_m\mid\mathcal F_n]\to E[M_\infty\mid\mathcal F_n]\) in \(L^1\). 그런데 좌변은 항상 \(M_n\)이므로 \(M_n=E[M_\infty\mid\mathcal F_n]\) a.s.
2단계: (iii) \(\Rightarrow\) (i). \(M_n=E[M_\infty\mid\mathcal F_n]\)라 하자. \(\{M_n\}\)이 UI임을 보이자. \(K>0\)를 고정하고 \(Y_K:=M_\infty\mathbf 1_{\{|M_\infty|>K\}}\)라 두면 \(M_\infty-Y_K\)는 절댓값이 \(K\) 이하인 변수다. 따라서
$$M_n=E[M_\infty-Y_K\mid\mathcal F_n]+E[Y_K\mid\mathcal F_n].$$
첫째 항의 절댓값은 \(K\) 이하이므로, \(|M_n|>2K\)이면 반드시 \(|E[Y_K\mid\mathcal F_n]|>K\)가 성립한다. 따라서
$$\begin{aligned} E\!\left[|M_n|\mathbf 1_{\{|M_n|>2K\}}\right] &\le E\!\left[\bigl|E[M_\infty-Y_K\mid\mathcal F_n]\bigr|\mathbf 1_{\{|M_n|>2K\}}\right] +E\!\left[\bigl|E[Y_K\mid\mathcal F_n]\bigr|\mathbf 1_{\{|M_n|>2K\}}\right]\\ &\le K\,P\!\left(|E[Y_K\mid\mathcal F_n]|>K\right)+E|E[Y_K\mid\mathcal F_n]|. \end{aligned}$$
Markov 부등식과 조건부기댓값의 \(L^1\)-축약성을 쓰면
$$K\,P\!\left(|E[Y_K\mid\mathcal F_n]|>K\right)\le E|E[Y_K\mid\mathcal F_n]|\le E|Y_K|,$$
또한 \(E|E[Y_K\mid\mathcal F_n]|\le E|Y_K|\)다. 따라서
$$E\!\left[|M_n|\mathbf 1_{\{|M_n|>2K\}}\right]\le 2E\!\left[|M_\infty|\mathbf 1_{\{|M_\infty|>K\}}\right].$$
우변은 \(K\to\infty\)에서 0으로 간다. 그리고 이 상계는 \(n\)에 무관하다. 따라서 \(\{M_n\}\)은 UI다.
3단계: (i) \(\Rightarrow\) (ii)의 준비 — 거의확실수렴. \(\{M_n\}\)이 UI이면 먼저 \(\sup_n E|M_n|<\infty\)임을 보인다. 실제로 UI 정의에 의해 어떤 \(K_0>0\)가 있어 \(\sup_n E[|M_n|\mathbf 1_{\{|M_n|>K_0\}}]\le 1\)이 된다. 따라서
$$E|M_n|\le K_0+1\qquad (\forall n).$$
이제 유리수 \(a
$$ (b-a)E[U_n(a,b)]\le E[(M_n-a)^+]\le E|M_n|+|a|\le K_0+1+|a|. $$
우변은 \(n\)에 무관한 상수이므로 \(\sup_n E[U_n(a,b)]<\infty\). 따라서 단조수렴정리로 \(E[U_\infty(a,b)]<\infty\), 곧 \(U_\infty(a,b)<\infty\) a.s.이다. 유리수 \(a
\(\omega\in\Omega_0\)를 고정하자. 만약 수열 \(M_n(\omega)\)가 수렴하지 않는다면 \(\liminf_n M_n(\omega)<\limsup_n M_n(\omega)\)이다. 두 값 사이에 유리수 \(a
마지막으로 \(\pm\infty\) 가능성을 배제한다. \(A:=\{M_n\to +\infty\}\)라 하자. \(K>0\)에 대해 충분히 큰 \(n\)에서는 \(A\) 위에서 \(M_n^+\ge K\)이므로 Fatou 정리에 의해
$$K\,P(A)\le E[\mathbf 1_A \liminf_n M_n^+]\le \liminf_n E[M_n^+]\le \sup_n E|M_n|<\infty.$$
이 식이 모든 \(K>0\)에 대해 성립하려면 \(P(A)=0\)이어야 한다. 같은 논리로 \(\{M_n\to -\infty\}\)의 확률도 0이다. 따라서 어떤 적분가능 변수 \(M_\infty\)가 존재하여 \(M_n\to M_\infty\) a.s.
4단계: (i) \(\Rightarrow\) (ii)의 결론 — \(L^1\) 수렴. 이미 \(M_n\to M_\infty\) a.s.이고 \(\{M_n\}\)이 UI다. 정리 A.11.6을 적용하면 \(M_\infty\in L^1\)이고
$$E|M_n-M_\infty|\xrightarrow[n\to\infty]{}0.$$
즉 \(M_n\to M_\infty\) in \(L^1\)이다. 이로써 (i)\(\Rightarrow\)(ii)가 증명되었다.
세 단계가 모두 증명되었으므로 (i), (ii), (iii)는 서로 동치다.
A.12 Local Martingale과 Novikov 조건
적합 과정 \((M_t)\)가 local martingale이라는 것은, stopping time의 단조증가 수열 \((\tau_n)\)이 존재하여 \(\tau_n \uparrow \infty\) a.s.이고 각 stopped process \(M^{\tau_n}\)이 마팅게일임이다.
\(Z_t := \exp\!\left(-\int_0^t \theta_s\, dW_s - \frac{1}{2}\int_0^t \theta_s^2\, ds\right)\)에 대해, Novikov 조건 $$E\!\left[\exp\!\left(\frac{1}{2}\int_0^T \theta_s^2\, ds\right)\right] < \infty$$ 이 성립하면 \(Z_t\)는 \([0,T]\) 위에서 true martingale이고 \(E[Z_T] = 1\)이다. 따라서 \(\frac{d\mathbb{Q}}{d\mathbb{P}}\big|_{\mathcal{F}_T} = Z_T\)로 새로운 측도 \(\mathbb{Q}\)를 정의할 수 있다.
적합 과정 \((M_t)\)가 local martingale이라는 것은, stopping time의 단조증가 수열 \((\tau_n)\)이 존재하여 \(\tau_n \uparrow \infty\) a.s.이고 각 stopped process \(M^{\tau_n}\)이 마팅게일임이다.
\(Z_t := \exp\!\left(-\int_0^t \theta_s\, dW_s - \frac{1}{2}\int_0^t \theta_s^2\, ds\right)\)에 대해, Novikov 조건 $$E\!\left[\exp\!\left(\frac{1}{2}\int_0^T \theta_s^2\, ds\right)\right] < \infty$$ 이 성립하면 \(Z_t\)는 \([0,T]\) 위에서 true martingale이고 \(E[Z_T] = 1\)이다. 따라서 \(\frac{d\mathbb{Q}}{d\mathbb{P}}\big|_{\mathcal{F}_T} = Z_T\)로 새로운 측도 \(\mathbb{Q}\)를 정의할 수 있다.
A.13 브라운 운동과 이차변동
과정 \((W_t)_{t \ge 0}\)이 다음을 만족하면 표준 브라운 운동이라 한다. (i) \(W_0 = 0\) a.s. (ii) 독립증분. (iii) \(W_t - W_s \sim N(0, t-s)\)(\(s < t\)). (iv) 거의 모든 경로가 연속이다.
브라운 운동은 대칭 랜덤워크의 연속시간 극한이다. \(\sqrt{\varepsilon}\, S(t/\varepsilon)\)은 \(\varepsilon \to 0\)일 때 브라운 운동으로 수렴한다. 경로가 연속이지만 어디서도 미분불가능한 이유는 \((\Delta W)^2 \sim \Delta t\)이기 때문이다.
진술: 분할 \(\pi_n = \{0 = t_0 < \cdots < t_n = t\}\)에 대해 \(\operatorname{mesh}(\pi_n) \to 0\)이면 $$\sum_{k=0}^{n-1}(W_{t_{k+1}} - W_{t_k})^2 \xrightarrow{L^2} t.$$
증명(등간격 분할): \(t_k = kT/n\)으로 두고 \(Q_n := \sum_{k=0}^{n-1}(W_{t_{k+1}} - W_{t_k})^2\), \(\xi_k := (W_{t_{k+1}} - W_{t_k})^2 - T/n\). \(\xi_k\)들은 i.i.d., \(E[\xi_k] = 0\). 정규분포의 4차 모멘트 공식 \(E[N(0,\sigma^2)^4] = 3\sigma^4\)에서 \(\operatorname{Var}(\xi_k) = E[\xi_k^2] = 3(T/n)^2 - (T/n)^2 = 2(T/n)^2\). 따라서: $$\operatorname{Var}(Q_n - T) = \operatorname{Var}\!\left(\sum_k \xi_k\right) = n \cdot 2(T/n)^2 = \frac{2T^2}{n} \to 0.$$ \(E[(Q_n - T)^2] = \operatorname{Var}(Q_n - T) \to 0\)이므로 \(Q_n \xrightarrow{L^2} T\).
\((dW_t)^2 = dt\), \(dW_t \cdot dt = 0\), \((dt)^2 = 0\). 이 규칙들이 Itô 공식에서 2차 미분항이 살아남는 이유를 설명하고, 확률 delta-hedging에서 \(\Gamma \cdot \sigma^2\)가 추가 비용으로 등장하는 이유를 설명한다.
A.14 Itô 적분과 등거리식
브라운 운동은 거의 모든 경로에서 무한 일차변동을 가진다. \(\sum_k|W_{t_{k+1}} - W_{t_k}| \sim C\sqrt{n} \to \infty\)이기 때문이다. 따라서 Riemann-Stieltjes 적분이 정의되지 않고, 별도의 구성이 필요하다.
예측가능한 단순과정 \(H_t = \sum_{k=0}^{n-1}\xi_k \mathbf{1}_{(t_k, t_{k+1}]}(t)\), \(\xi_k \in \mathcal{F}_{t_k}\)에 대해: $$\int_0^T H_t\, dW_t := \sum_{k=0}^{n-1}\xi_k(W_{t_{k+1}} - W_{t_k}).$$ \(\xi_k \in \mathcal{F}_{t_k}\) 조건은 미래를 보지 않는다는 비예견성을 수학화한다.
진술: \(E\!\left[\left(\int_0^T H_t\, dW_t\right)^2\right] = E\!\left[\int_0^T H_t^2\, dt\right]\).
증명: $$\left(\int_0^T H\, dW\right)^2 = \sum_k \xi_k^2(\Delta W_k)^2 + 2\sum_{i < j}\xi_i\xi_j\Delta W_i\Delta W_j.$$ 교차항이 0: \(i < j\)이면 \(\xi_i, \xi_j, \Delta W_i\)는 \(\mathcal{F}_{t_j}\)-가측이고, \(\Delta W_j\)는 \(\mathcal{F}_{t_j}\)와 독립이며 평균이 0이다. Tower property로 $$E[\xi_i\xi_j\Delta W_i\Delta W_j] = E[\xi_i\xi_j\Delta W_i \cdot E[\Delta W_j \mid \mathcal{F}_{t_j}]] = 0.$$ 대각항: \(\xi_k\)가 \(\mathcal{F}_{t_k}\)-가측이고 \((\Delta W_k)^2\)의 조건부기댓값이 \(t_{k+1} - t_k\)이므로 \(E[\xi_k^2(\Delta W_k)^2] = E[\xi_k^2] \cdot (t_{k+1} - t_k)\). 합산하면 $$E\!\left[\left(\int H\, dW\right)^2\right] = \sum_k E[\xi_k^2]\Delta t_k = E\!\left[\int_0^T H_t^2\, dt\right].$$ 이 등거리식은 Itô 적분의 기대값이 0임도 보장한다: \(E\!\left[\int_0^T H\, dW\right] = 0\). Itô 적분이 마팅게일인 이유다.
A.15 Itô 공식과 GBM
적응과정 \(b=(b_t)\), \(\sigma=(\sigma_t)\)가 적절한 적분가능성을 만족할 때
$$X_t=X_0+\int_0^t b_s\,ds+\int_0^t \sigma_s\,dW_s,\qquad 0\le t\le T,$$
와 같이 표현되는 연속과정을 Itô 과정이라 한다. 미분형식으로는
$$dX_t=b_t\,dt+\sigma_t\,dW_t$$
라고 쓴다. 이 과정의 유한변동 부분은 \(\int_0^t b_s\,ds\), 국소마팅게일 부분은 \(\int_0^t \sigma_s\,dW_s\)이며, 이차변동은
$$[X]_t=\int_0^t \sigma_s^2\,ds$$
이다.
함수 \(f=f(t,x)\)가 시간변수 \(t\)에 대해 한 번 연속미분 가능하고, 공간변수 \(x\)에 대해 두 번 연속미분 가능하면 \(f\in C^{1,2}\)라고 쓴다. 즉 \(f_t,f_x,f_{xx}\)가 모두 존재하고 연속이다.
진술. \(X_t=X_0+\int_0^t b_s\,ds+\int_0^t \sigma_s\,dW_s\)가 Itô 과정이고 \(f\in C^{1,2}\)라 하자. 그러면
$$df(t,X_t)=\left(f_t(t,X_t)+b_t f_x(t,X_t)+\frac12 \sigma_t^2 f_{xx}(t,X_t)\right)dt+\sigma_t f_x(t,X_t)\,dW_t.$$
1단계: 시간구간을 잘게 나누고 Taylor 전개를 쓴다. \(0=t_0 $$\begin{aligned}
f(t_{i+1},X_{t_{i+1}})-f(t_i,X_{t_i})
&=f_t(t_i,X_{t_i})\,\Delta t_i+f_x(t_i,X_{t_i})\,\Delta X_i \\
&\quad+\frac12 f_{xx}(t_i,X_{t_i})(\Delta X_i)^2+R_i,
\end{aligned}$$ 여기서 나머지항 \(R_i\)는 \(|\Delta t_i|^2\), \(|\Delta t_i||\Delta X_i|\), \(|\Delta X_i|^3\) 차수의 항들로 이루어진다.
2단계: \(\Delta X_i\)를 drift 부분과 diffusion 부분으로 분해한다. Itô 과정의 정의에서
$$\Delta X_i=\int_{t_i}^{t_{i+1}} b_s\,ds+\int_{t_i}^{t_{i+1}} \sigma_s\,dW_s=:B_i+M_i.$$
\(B_i\)는 크기가 \(\Delta t_i\) 수준이고, \(M_i\)는 평균제곱 크기가 \(\Delta t_i\) 수준이다. 실제로 \(E[M_i^2\mid\mathcal F_{t_i}]=E[\int_{t_i}^{t_{i+1}}\sigma_s^2\,ds\mid\mathcal F_{t_i}]\)이므로 \(M_i\)는 크기가 \((\Delta t_i)^{1/2}\)인 항이다.
3단계: \((\Delta X_i)^2\)의 주도항을 계산한다. 위 분해를 제곱하면
$$ (\Delta X_i)^2=B_i^2+2B_iM_i+M_i^2. $$
이제 각 항의 크기를 본다.
- \(B_i^2\)는 \((\Delta t_i)^2\) 수준이므로 전 구간에 대해 합하면 \(0\)으로 간다.
- \(2B_iM_i\)는 \((\Delta t_i)^{3/2}\) 수준이므로 전 구간 합도 \(0\)으로 간다.
- \(M_i^2\)만이 \(\Delta t_i\) 수준이어서 합했을 때 유한한 기여를 남긴다.
따라서 분할을 가늘게 하면
$$\sum_i f_{xx}(t_i,X_{t_i})(\Delta X_i)^2 \longrightarrow \int_0^t f_{xx}(s,X_s)\sigma_s^2\,ds$$
가 된다. 이것이 Itô 공식에서 2차 미분항이 사라지지 않는 이유다.
4단계: 1차항의 극한을 계산한다. 먼저 시간도함수 항은 보통의 Riemann 합이므로
$$\sum_i f_t(t_i,X_{t_i})\,\Delta t_i\longrightarrow \int_0^t f_t(s,X_s)\,ds.$$
다음으로 \(\Delta X_i=B_i+M_i\)를 대입하면
$$\sum_i f_x(t_i,X_{t_i})\Delta X_i =\sum_i f_x(t_i,X_{t_i})B_i+\sum_i f_x(t_i,X_{t_i})M_i.$$
첫 번째 합은
$$\sum_i f_x(t_i,X_{t_i})B_i\longrightarrow \int_0^t f_x(s,X_s)b_s\,ds,$$
두 번째 합은 Itô 적분의 정의로
$$\sum_i f_x(t_i,X_{t_i})M_i\longrightarrow \int_0^t f_x(s,X_s)\sigma_s\,dW_s.$$
5단계: 나머지항이 사라짐을 보인다. \(R_i\)는 \(|\Delta t_i|^2\), \(|\Delta t_i||\Delta X_i|\), \(|\Delta X_i|^3\)의 선형결합으로 지배된다. \(\Delta X_i\)의 주된 크기가 \((\Delta t_i)^{1/2}\)이므로 \(|\Delta t_i||\Delta X_i|\)는 \((\Delta t_i)^{3/2}\), \(|\Delta X_i|^3\)도 평균적으로 \((\Delta t_i)^{3/2}\) 수준이다. 따라서 \(\sum_i R_i\to0\)이다.
6단계: 모든 항을 합친다. 이제
$$\begin{aligned} f(t,X_t)-f(0,X_0) &=\int_0^t f_t(s,X_s)\,ds+\int_0^t f_x(s,X_s)b_s\,ds \\ &\quad+\int_0^t f_x(s,X_s)\sigma_s\,dW_s +\frac12\int_0^t f_{xx}(s,X_s)\sigma_s^2\,ds. \end{aligned}$$
이를 미분형식으로 쓰면 정리의 식이 된다.
기하 브라운 운동 \(S\)가
$$dS_t=\mu S_t\,dt+\sigma S_t\,dW_t,\qquad S_0>0$$
를 만족한다고 하자. \(f(x)=\ln x\)에 대해 \(f'(x)=1/x\), \(f''(x)=-1/x^2\)이므로 Itô 공식을 적용하면
$$d\ln S_t=f'(S_t)\,dS_t+\frac12 f''(S_t)\,d[S]_t.$$
여기서 \(d[S]_t=\sigma^2S_t^2\,dt\)이므로
$$\begin{aligned} d\ln S_t &=\frac{1}{S_t}\big(\mu S_t\,dt+\sigma S_t\,dW_t\big) +\frac12\left(-\frac{1}{S_t^2}\right)\sigma^2S_t^2\,dt \\ &=\mu\,dt+\sigma\,dW_t-\frac12\sigma^2\,dt \\ &=\left(\mu-\frac{\sigma^2}{2}\right)dt+\sigma\,dW_t. \end{aligned}$$
양변을 \(0\)부터 \(t\)까지 적분하면
$$\ln S_t-\ln S_0=\left(\mu-\frac{\sigma^2}{2}\right)t+\sigma W_t,$$
따라서
$$S_t=S_0\exp\!\left\{\left(\mu-\frac{\sigma^2}{2}\right)t+\sigma W_t\right\}.$$
즉 \(\ln S_t\)는 정규분포를 따르고 \(S_t\)는 로그정규분포를 따른다. \(-\sigma^2/2\)가 바로 Itô 보정항이다.
A.16 Girsanov 정리
같은 가측공간 \((\Omega,\mathcal F_T)\) 위의 두 확률측도 \(\mathbb P,\mathbb Q\)가 서로 절대연속이면 \(\mathbb P\sim\mathbb Q\)라고 하고, 이를 동치측도라 한다. 이때
$$Z_T:=\left.\frac{d\mathbb Q}{d\mathbb P}\right|_{\mathcal F_T}$$
를 최종시점의 Radon–Nikodym 도함수라 한다. 또한 필트레이션 \((\mathcal F_t)\)에 대해
$$Z_t:=E^{\mathbb P}\!\left[\left.\frac{d\mathbb Q}{d\mathbb P}\right|_{\mathcal F_T}\middle|\mathcal F_t\right],\qquad 0\le t\le T,$$
를 밀도과정이라 한다. \((Z_t)\)는 양의 \((\mathbb P,\mathcal F_t)\)-마팅게일이고 \(Z_0=1\), \(Z_T=d\mathbb Q/d\mathbb P|_{\mathcal F_T}\)를 만족한다.
\((W_t)\)가 \((\mathbb P,\mathcal F_t)\)-브라운 운동이고 \((\theta_t)\)가 적응과정이라 하자. 확률지수(stochastic exponential)
$$Z_t:=\exp\!\left(-\int_0^t\theta_s\,dW_s-\frac12\int_0^t\theta_s^2\,ds\right)$$
를 고려한다. 만약
$$E^{\mathbb P}\!\left[\exp\!\left(\frac12\int_0^T\theta_s^2\,ds\right)\right]<\infty$$
가 성립하면 Novikov 조건이 성립한다고 한다. 이 조건 아래에서 \(Z\)는 true martingale이 되고 \(E^{\mathbb P}[Z_T]=1\)이다.
연속 적응과정 \(M\)이 정지시킨 뒤 마팅게일이 되면 연속 local martingale이라 한다. 이차변동 \([M]_t\)는 분할합 \(\sum(M_{t_{i+1}}-M_{t_i})^2\)의 극한으로 정의되며, 브라운 운동에 대해서는 \([W]_t=t\)이다.
진술. \(X\in L^1(\mathbb Q)\), \(\mathcal G\subseteq\mathcal F_T\)라 하자. \(Z_T=d\mathbb Q/d\mathbb P|_{\mathcal F_T}\), \(Z_{\mathcal G}:=E^{\mathbb P}[Z_T\mid\mathcal G]\)라 두면
$$E^{\mathbb Q}[X\mid\mathcal G]=\frac{E^{\mathbb P}[Z_TX\mid\mathcal G]}{E^{\mathbb P}[Z_T\mid\mathcal G]}$$
가 \(Z_{\mathcal G}>0\)인 곳에서 성립한다.
1단계: 우변 후보를 만든다. \(\displaystyle Y:=\frac{E^{\mathbb P}[Z_TX\mid\mathcal G]}{E^{\mathbb P}[Z_T\mid\mathcal G]}\)라 두고 \(E^{\mathbb P}[Z_T\mid\mathcal G]=0\)인 곳에서는 \(Y=0\)으로 정의한다. 분자와 분모가 모두 \(\mathcal G\)-가측이므로 \(Y\)도 \(\mathcal G\)-가측이다.
2단계: 분모가 0인 집합은 \(\mathbb Q\)-영집합임을 보인다. \(D:=\{E^{\mathbb P}[Z_T\mid\mathcal G]=0\}\in\mathcal G\)라 하자. 그러면
$$\mathbb Q(D)=E^{\mathbb P}[Z_T\mathbf 1_D] =E^{\mathbb P}\!\left[E^{\mathbb P}[Z_T\mid\mathcal G]\mathbf 1_D\right] =0.$$
따라서 분모가 0인 곳은 \(\mathbb Q\)-거의 확실하게 무시할 수 있다.
3단계: 조건부기댓값의 적분항등식을 확인한다. 임의의 \(A\in\mathcal G\)에 대해
$$E^{\mathbb Q}[\mathbf 1_A Y]=E^{\mathbb P}[Z_T\mathbf 1_A Y].$$
\(\mathbf 1_A Y\)는 \(\mathcal G\)-가측이므로 pull-out property를 적용하면
$$E^{\mathbb P}[Z_T\mathbf 1_A Y] =E^{\mathbb P}\!\left[E^{\mathbb P}[Z_T\mid\mathcal G]\mathbf 1_A Y\right].$$
이제 \(Y\)의 정의를 대입하면
$$E^{\mathbb P}\!\left[E^{\mathbb P}[Z_T\mid\mathcal G]\mathbf 1_A Y\right] =E^{\mathbb P}\!\left[\mathbf 1_A E^{\mathbb P}[Z_TX\mid\mathcal G]\right] =E^{\mathbb P}[Z_TX\mathbf 1_A] =E^{\mathbb Q}[X\mathbf 1_A].$$
4단계: 조건부기댓값의 정의를 적용한다. 모든 \(A\in\mathcal G\)에 대해 \(E^{\mathbb Q}[\mathbf 1_A Y]=E^{\mathbb Q}[\mathbf 1_A X]\)이므로 \(Y\)는 \(\mathbb Q\) 아래에서 \(X\)의 \(\mathcal G\)-조건부기댓값이다.
진술. 연속 \((\mathbb Q,\mathcal F_t)\)-local martingale \(M\)이 \(M_0=0\) 및 \([M]_t=t\)를 만족하면 \(M\)은 \((\mathbb Q,\mathcal F_t)\)-브라운 운동이다.
1단계: 정지시켜 \(L^2\) 제어를 얻는다. \(\sigma_n:=\inf\{t\ge0:|M_t|\ge n\}\wedge T\)로 두면 \(M^{\sigma_n}\)은 연속 마팅게일이다. Itô 공식을 \(x\mapsto x^2\)에 적용하면
$$M_{t\wedge\sigma_n}^2-[M]_{t\wedge\sigma_n} =M_{t\wedge\sigma_n}^2-(t\wedge\sigma_n)$$
가 마팅게일이다. 따라서
$$E^{\mathbb Q}[M_{t\wedge\sigma_n}^2]=E^{\mathbb Q}[t\wedge\sigma_n]\le t.$$
Fatou 정리로 \(E^{\mathbb Q}[M_t^2]\le t\)이므로 \(M_t\in L^2\)다.
2단계: 지수과정이 마팅게일임을 보인다. 임의의 \(\lambda\in\mathbb R\)에 대해
$$Y_t^{(\lambda)}:=\exp\!\left(\lambda M_t-\frac12\lambda^2 t\right)$$
를 정의하자. Itô 공식을 적용하면
$$dY_t^{(\lambda)}=\lambda Y_t^{(\lambda)}\,dM_t.$$
따라서 \(Y^{(\lambda)}\)는 local martingale이다. 또한 \(Y^{(\lambda)}\ge0\)이므로 supermartingale이고 \(E^{\mathbb Q}[Y_t^{(\lambda)}]\le1\)이다. 같은 식을 \(-\lambda\)에도 적용하면 \(E^{\mathbb Q}[Y_t^{(-\lambda)}]\le1\)이다.
한편 \(Y_t^{(\lambda)}Y_t^{(-\lambda)}=1\)이므로 Cauchy–Schwarz를 쓰면
$$1=E^{\mathbb Q}[1] =E^{\mathbb Q}\!\left[\sqrt{Y_t^{(\lambda)}Y_t^{(-\lambda)}}\right] \le \big(E^{\mathbb Q}[Y_t^{(\lambda)}]E^{\mathbb Q}[Y_t^{(-\lambda)}]\big)^{1/2}\le1.$$
따라서 \(E^{\mathbb Q}[Y_t^{(\lambda)}]=1\)이고, \(Y^{(\lambda)}\)는 true martingale이다.
3단계: 증가분의 조건부 mgf를 계산한다. \(0\le s $$E^{\mathbb Q}[Y_t^{(\lambda)}\mid\mathcal F_s]=Y_s^{(\lambda)}.$$ 이를 전개하면 $$E^{\mathbb Q}\!\left[\exp\!\left(\lambda(M_t-M_s)-\frac12\lambda^2(t-s)\right)\middle|\mathcal F_s\right]=1,$$ 즉 $$E^{\mathbb Q}[e^{\lambda(M_t-M_s)}\mid\mathcal F_s]=e^{\frac12\lambda^2(t-s)}.$$ 우변은 \(N(0,t-s)\)의 moment generating function이다. 따라서 \(M_t-M_s\)의 \(\mathcal F_s\)-조건부분포는 \(N(0,t-s)\)이고, 우변이 \(\mathcal F_s\)에 의존하지 않으므로 증가분은 \(\mathcal F_s\)와 독립이다.
4단계: 브라운 운동의 정의를 확인한다. \(M_0=0\), 경로 연속성, 독립 정규증분, 분산 \(t-s\)를 모두 확인했다. 따라서 \(M\)은 \((\mathbb Q,\mathcal F_t)\)-브라운 운동이다.
진술. \((W_t)\)가 \((\mathbb P,\mathcal F_t)\)-브라운 운동이고 \((\theta_t)\)가 정의 A.16.2의 Novikov 조건을 만족한다고 하자. \(\mathbb Q\)를
$$\left.\frac{d\mathbb Q}{d\mathbb P}\right|_{\mathcal F_T}=Z_T =\exp\!\left(-\int_0^T\theta_s\,dW_s-\frac12\int_0^T\theta_s^2\,ds\right)$$
로 정의하면
$$\widetilde W_t:=W_t+\int_0^t\theta_s\,ds$$
는 \((\mathbb Q,\mathcal F_t)\)-브라운 운동이다.
1단계: \(\mathbb Q\)가 확률측도임을 확인한다. Novikov 조건에 의해 \(Z\)는 양의 \(\mathbb P\)-마팅게일이고 \(E^{\mathbb P}[Z_T]=1\)이다. 따라서
$$\mathbb Q(A):=E^{\mathbb P}[Z_T\mathbf 1_A],\qquad A\in\mathcal F_T$$
는 확률측도를 정의한다. 또한 \(Z_T>0\) 거의확실이므로 \(\mathbb Q\sim\mathbb P\)이다.
2단계: \(\widetilde W\)의 이차변동을 계산한다. \(\int_0^t\theta_s\,ds\)는 유한변동 연속과정이므로 이차변동에 기여하지 않는다. 따라서
$$[\widetilde W]_t=[W]_t=t.$$
3단계: \(Z_t\widetilde W_t\)의 미분을 계산한다. 확률지수의 미분은
$$dZ_t=-\theta_t Z_t\,dW_t,$$
그리고
$$d\widetilde W_t=dW_t+\theta_t\,dt.$$
곱공식을 적용하면
$$d(Z_t\widetilde W_t)=\widetilde W_t\,dZ_t+Z_t\,d\widetilde W_t+d[Z,\widetilde W]_t.$$
여기서 \(\widetilde W\)의 유한변동 부분은 \(\int_0^t\theta_sds\)이므로 공변동은 브라운 운동 부분에서만 생긴다. 따라서
$$d[Z,\widetilde W]_t=d[Z,W]_t=-\theta_t Z_t\,dt.$$
이를 대입하면
$$\begin{aligned} d(Z_t\widetilde W_t) &=\widetilde W_t(-\theta_t Z_t\,dW_t)+Z_t(dW_t+\theta_t\,dt)-\theta_t Z_t\,dt \\ &=Z_t(1-\theta_t\widetilde W_t)\,dW_t. \end{aligned}$$
드리프트 항이 완전히 상쇄되므로 \(Z_t\widetilde W_t\)는 \(\mathbb P\)-local martingale이다.
4단계: \(\widetilde W\)가 \(\mathbb Q\)-local martingale임을 보인다. 적분가능성 문제를 피하기 위해 적당한 정지시각 \(\tau_n\uparrow T\)를 잡아 \(Z^{\tau_n}\widetilde W^{\tau_n}\)가 true martingale이 되게 하자. 이제 \(0\le s\le t\le T\), \(A\in\mathcal F_s\)에 대해
$$E^{\mathbb Q}[\mathbf 1_A(\widetilde W_{t\wedge\tau_n}-\widetilde W_{s\wedge\tau_n})] =E^{\mathbb P}[Z_T\mathbf 1_A(\widetilde W_{t\wedge\tau_n}-\widetilde W_{s\wedge\tau_n})].$$
탑 성질로 \(E^{\mathbb P}[Z_T\mid\mathcal F_{t\wedge\tau_n}]=Z_{t\wedge\tau_n}\)이므로
$$E^{\mathbb Q}[\mathbf 1_A(\widetilde W_{t\wedge\tau_n}-\widetilde W_{s\wedge\tau_n})] =E^{\mathbb P}[Z_{t\wedge\tau_n}\mathbf 1_A(\widetilde W_{t\wedge\tau_n}-\widetilde W_{s\wedge\tau_n})].$$
우변은 마팅게일 \(Z^{\tau_n}\widetilde W^{\tau_n}\)와 \(Z^{\tau_n}\)의 차를 이용하면 \(0\)이 된다. 따라서 \(\widetilde W^{\tau_n}\)는 \(\mathbb Q\)-마팅게일이고, \(n\to\infty\)로 보내면 \(\widetilde W\)는 \(\mathbb Q\)-local martingale이다.
5단계: Lévy 특성화 정리를 적용한다. 2단계에서 \([\widetilde W]_t=t\), 4단계에서 \(\widetilde W\)가 연속 \(\mathbb Q\)-local martingale임을 보였다. 따라서 정리 A.16.5를 적용하면 \(\widetilde W\)는 \(\mathbb Q\)-브라운 운동이다.
\(\mathbb P\) 아래에서
$$dX_t=\mu_t\,dt+\sigma_t\,dW_t$$
인 확산은 \(\mathbb Q\) 아래에서
$$dX_t=(\mu_t-\sigma_t\theta_t)\,dt+\sigma_t\,d\widetilde W_t$$
로 바뀐다. 즉 측도변환은 drift를 바꾸고 diffusion coefficient는 그대로 둔다.
A.17 뉴메레르, 밀도과정, 측도변환
엄격히 양수인 적응과정 \(N=(N_t)_{0\le t\le T}\)를 택해 모든 자산가격을 \(N_t\)로 나누어 표현할 때, 이 \(N\)을 뉴메레르라 한다. 자산 \(S\)의 뉴메레르 표시가격은
$$\widehat S_t:=\frac{S_t}{N_t}$$
이다. 현금계정 \(B_t=e^{\int_0^t r_s\,ds}\), 특정 만기의 할인채 \(P(t,T)\), 외화자산 가치과정 등이 전형적인 예다.
현금계정 \(B\)를 기준 뉴메레르로 하는 위험중립측도 \(\mathbb Q^B\) 아래에서 다른 양의 거래가능 자산 \(N\)을 새 뉴메레르로 선택하자. 이때
$$Z_t^{N/B}:=\frac{N_t/B_t}{N_0/B_0}$$
를 \(B\)-뉴메레르에서 \(N\)-뉴메레르로 옮길 때의 뉴메레르 도함수 또는 뉴메레르 밀도과정이라 한다. 이는 최종시점에서
$$\left.\frac{d\mathbb Q^N}{d\mathbb Q^B}\right|_{\mathcal F_T}=Z_T^{N/B}$$
를 정의하는 후보가 된다.
가정: \(\mathbb Q^B\) 아래에서 모든 거래가능 자산의 할인가격은 마팅게일이며, 특히 \(N_t/B_t\)도 마팅게일이라고 하자.
주장: \(Z_t^{N/B}=(N_t/B_t)/(N_0/B_0)\)는 양의 \(\mathbb Q^B\)-마팅게일이고 \(E^{\mathbb Q^B}[Z_t^{N/B}]=1\)이다. 따라서 \(Z_T^{N/B}\)는 어떤 확률측도 \(\mathbb Q^N\)를 정의한다.
증명: \(N_t>0\), \(B_t>0\)이므로 \(Z_t^{N/B}>0\)는 자명하다. 마팅게일 성질은 \(N_t/B_t\)가 \(\mathbb Q^B\)-마팅게일이라는 가정에서 바로 따라온다. 즉 \(s\le t\)에 대해
$$\begin{aligned} E^{\mathbb Q^B}[Z_t^{N/B}\mid\mathcal F_s] &=E^{\mathbb Q^B}\!\left[\frac{N_t/B_t}{N_0/B_0}\,\middle|\,\mathcal F_s\right]\\ &=\frac{1}{N_0/B_0}E^{\mathbb Q^B}\!\left[\frac{N_t}{B_t}\,\middle|\,\mathcal F_s\right]\\ &=\frac{N_s/B_s}{N_0/B_0} =Z_s^{N/B}. \end{aligned}$$
기댓값은 \(s=0\)을 대입하면
$$E^{\mathbb Q^B}[Z_t^{N/B}] =\frac{1}{N_0/B_0}E^{\mathbb Q^B}\!\left[\frac{N_t}{B_t}\right] =\frac{1}{N_0/B_0}\frac{N_0}{B_0}=1.$$
따라서 \(A\in\mathcal F_T\)에 대해
$$\mathbb Q^N(A):=E^{\mathbb Q^B}[Z_T^{N/B}\mathbf 1_A]$$
로 두면 \(\mathbb Q^N\)는 확률측도다. 이것이 \(N\)-뉴메레르에 대응하는 측도다.
진술: \(X\in L^1(\mathbb Q^N)\), \(\mathcal G\subseteq\mathcal F_T\)라 하자. 그러면
$$E^{\mathbb Q^N}[X\mid\mathcal G] =\frac{E^{\mathbb Q^B}[Z_T^{N/B}X\mid\mathcal G]}{E^{\mathbb Q^B}[Z_T^{N/B}\mid\mathcal G]}$$
가 \(E^{\mathbb Q^B}[Z_T^{N/B}\mid\mathcal G]>0\)인 곳에서 성립한다.
증명: 정리 A.16.4를 \(\mathbb P=\mathbb Q^B\), \(\mathbb Q=\mathbb Q^N\), \(Z_T=d\mathbb Q^N/d\mathbb Q^B|_{\mathcal F_T}=Z_T^{N/B}\)로 놓고 그대로 적용하면 된다. 다만 이 장에서는 식이 실제로 어떻게 나오는지 다시 적어 두겠다.
우변을
$$Y:=\frac{E^{\mathbb Q^B}[Z_T^{N/B}X\mid\mathcal G]}{E^{\mathbb Q^B}[Z_T^{N/B}\mid\mathcal G]}$$
로 두자. 분자와 분모가 모두 \(\mathcal G\)-가측이므로 \(Y\)는 \(\mathcal G\)-가측이다. 이제 임의의 \(A\in\mathcal G\)에 대해
$$\begin{aligned} E^{\mathbb Q^N}[\mathbf 1_A Y] &=E^{\mathbb Q^B}[Z_T^{N/B}\mathbf 1_A Y]\\ &=E^{\mathbb Q^B}\!\left[E^{\mathbb Q^B}[Z_T^{N/B}\mid\mathcal G]\mathbf 1_A Y\right]\\ &=E^{\mathbb Q^B}\!\left[\mathbf 1_A E^{\mathbb Q^B}[Z_T^{N/B}X\mid\mathcal G]\right]\\ &=E^{\mathbb Q^B}[Z_T^{N/B}X\mathbf 1_A]\\ &=E^{\mathbb Q^N}[X\mathbf 1_A]. \end{aligned}$$
따라서 조건부기댓값의 정의에 의해 \(Y=E^{\mathbb Q^N}[X\mid\mathcal G]\)다.
가정: \(\mathbb Q^B\) 아래에서 모든 거래가능 자산의 할인가격 \(S_t/B_t\)는 마팅게일이고, 새 뉴메레르 \(N_t\)도 양의 거래가능 자산이라고 하자.
주장: \(\mathbb Q^N\)를
$$\left.\frac{d\mathbb Q^N}{d\mathbb Q^B}\right|_{\mathcal F_T} =\frac{N_T/B_T}{N_0/B_0}$$
로 정의하면, 임의의 거래가능 자산 \(S\)에 대해 \(S_t/N_t\)는 \(\mathbb Q^N\)-마팅게일이 된다.
증명: \(0\le t\le T\)를 고정하고, 정리 A.17.4를 \(X=S_T/N_T\), \(\mathcal G=\mathcal F_t\)에 적용한다. 그러면
$$E^{\mathbb Q^N}\!\left[\frac{S_T}{N_T}\,\middle|\,\mathcal F_t\right] =\frac{E^{\mathbb Q^B}[Z_T^{N/B}(S_T/N_T)\mid\mathcal F_t]}{E^{\mathbb Q^B}[Z_T^{N/B}\mid\mathcal F_t]}.$$
이제 분자부터 정리한다. \(Z_T^{N/B}=(N_T/B_T)/(N_0/B_0)\)이므로
$$Z_T^{N/B}\frac{S_T}{N_T} =\frac{N_T/B_T}{N_0/B_0}\cdot\frac{S_T}{N_T} =\frac{1}{N_0/B_0}\frac{S_T}{B_T}.$$
따라서 분자는
$$E^{\mathbb Q^B}[Z_T^{N/B}(S_T/N_T)\mid\mathcal F_t] =\frac{1}{N_0/B_0}E^{\mathbb Q^B}[S_T/B_T\mid\mathcal F_t].$$
\(\mathbb Q^B\) 아래에서 \(S_t/B_t\)가 마팅게일이므로
$$E^{\mathbb Q^B}[S_T/B_T\mid\mathcal F_t]=S_t/B_t.$$
또한 분모는 정리 A.17.3에서 보인 마팅게일 성질로
$$E^{\mathbb Q^B}[Z_T^{N/B}\mid\mathcal F_t]=Z_t^{N/B}=\frac{N_t/B_t}{N_0/B_0}.$$
이 둘을 대입하면
$$\begin{aligned} E^{\mathbb Q^N}\!\left[\frac{S_T}{N_T}\,\middle|\,\mathcal F_t\right] &=\frac{(N_0/B_0)^{-1}(S_t/B_t)}{(N_t/B_t)/(N_0/B_0)}\\ &=\frac{S_t}{N_t}. \end{aligned}$$
즉 \(S_t/N_t\)는 \(\mathbb Q^N\)-마팅게일이다.
만기 지급액 \(H_T\)의 시점 \(t\) 가치 \(V_t\)는 어떤 뉴메레르 \(N\)을 택하든
$$V_t=N_t\,E^{\mathbb Q^N}\!\left[\frac{H_T}{N_T}\,\middle|\,\mathcal F_t\right]$$
로 쓸 수 있다. \(N=B\)이면 보통의 위험중립 가격결정식, \(N=P(\cdot,T)\)이면 \(T\)-forward measure 아래의 가격결정식이 된다.
Chapter 1 자체는 주문과 호가창의 구조를 설명하지만, 이후 장들에서는 midprice, microprice, 체결강도, 재고위험을 확률과정으로 기술한다. 그때 어떤 측도 아래에서 무엇이 마팅게일인지, 드리프트가 어떤 방식으로 바뀌는지, 할인채를 뉴메레르로 바꾸면 기대값 식이 어떻게 바뀌는지가 모두 이 절의 언어로 정리된다.
A.18 Generator와 HJB 방정식
Generator는 "아주 짧은 시간 \(dt\) 동안 기대적으로 함수값이 얼마나 변하는가"를 1차 근사하는 연산자다. 확산과정 \(dX_t = b(X_t)\, dt + \sigma(X_t)\, dW_t\)에 대해 $$\mathcal{L}f(x) = b(x)f'(x) + \frac{1}{2}\sigma^2(x)f''(x)$$ 가 generator이며 \(E[f(X_{t+dt}) - f(X_t) \mid \mathcal{F}_t] \approx \mathcal{L}f(X_t)\, dt\)를 의미한다. 점프가 있으면 "점프 후 값 - 현재 값"의 항이 추가된다.
가치함수(value function)는 "지금 상태에서 앞으로 최적으로 행동했을 때 얻을 수 있는 최대 기대보상"이다. 동적 프로그래밍 원리(DPP)는 "최적 = 지금 한 걸음 + 이후 최적"의 재귀 구조다. Hamilton-Jacobi-Bellman(HJB) 방정식은 DPP를 미분형으로 쓴 PDE다: $$\frac{\partial V}{\partial t} + \sup_u\!\left[b(x,u)\partial_x V + \frac{1}{2}\sigma^2(x,u)\partial_{xx}V + r(x,u)\right] = 0.$$ 시장조성 문제에서는 \(u = (a,b)\)(호가)가 제어변수, \(x = (S,q)\)(가격, 재고)가 상태변수가 되어 이 방정식이 최적 호가를 결정한다.
Part B — Chapter 1 본문
Electronic Markets and the Limit Order Book
1장은 이 책 전체의 출발점이다. 알고리즘과 고빈도 거래를 설계하기 위해서는 거래가 이루어지는 물리적·제도적 환경을 먼저 이해해야 한다. 1.1절에서 전자시장에서 어떤 계약이 거래되는지를 개관하고, 1.2절에서 시장참여자를 분류한다. 1.3절에서 주문의 종류와 거래소 구조를 설명하고, 1.4절에서 지정가호가창(LOB)의 수학적 서술과 핵심 가격 지표들을 다룬다.
1.1 전자시장이란 무엇이며 어떻게 작동하는가
1.1.1 주식, 채권, 우선주
전자시장에서 거래되는 가장 기본적인 금융계약은 주식, 즉 기업에 대한 소유권 청구권이다. 기업은 자본을 조달하기 위해 주식을 발행하고, 전자거래소에서 거래되려면 상장(listing) 절차를 거쳐야 한다. 상장은 흔히 IPO(initial public offering)와 결부된다. 가장 일반적인 형태는 보통주(ordinary shares 또는 common stock)로, 보유자에게 기업 이익의 균등한 몫과 주주총회 의결권을 부여한다.
대기업이 자본을 조달하는 또 다른 수단은 채권(bonds)이다. 채권은 정기적인 이자수익을 약속하지만 의결권은 부여하지 않는다. 주식과 채권의 근본적 차이는 다음과 같다. 주주는 배당의 규모와 빈도에 대한 보장이 없지만 의결권이 있다. 채권 보유자는 사전에 정해진 규칙적 지급을 보장받지만 의결권이 없다.
이 둘의 성격을 합친 계약이 우선주(preferred stock)다. 우선주는 채권처럼 의결권이 없고 미리 정해진 수입을 받지만, 그 수입의 법적 성격은 부채가 아니라 자기자본(equity)이다. 이 차이는 기업이 재무적 곤경에 빠졌을 때 중요하다. 청산 시 채무가 모든 자기자본보다 선순위이므로, 채권자의 청구권이 먼저 변제된 뒤에야 우선주 보유자가 남은 자산에 대한 지급을 받을 수 있다.
1.1.2 자산군과 집합투자 상품
금융계약은 기초자산의 특성에 따라 자산군(asset classes)으로 나뉜다. 주식과 우선주는 주식자산(Equities), 채권은 별도의 자산군을 이룬다. 그 밖에 현금성 자산, 외환(FX), 원자재(Commodities), 부동산(Property) 등이 있다.
투자자는 이 자산들을 직접 거래하거나, 집합투자 상품을 통해 간접적으로 접근할 수 있다. 뮤추얼펀드(mutual fund)는 위탁투자 운용자 역할을 한다. 투자자가 자신의 현금을 금융운용회사에 맡기면, 운용회사는 그 돈으로 펀드의 투자목적에 맞는 포트폴리오를 구성한다. 펀드는 주식, 채권, 현금, 외환, 부동산 등 매우 다양한 자산에 투자할 수 있으며, 적극적으로 종목을 선택하는 액티브 운용인지, 아니면 특정 지수를 추종하는 패시브 운용인지에 따라 구분된다.
뮤추얼펀드는 폐쇄형(closed-end fund)과 개방형(open-end fund)으로 나뉜다. 폐쇄형 펀드는 설립 시 한 번 정해진 수의 지분만 발행하며, 투자자는 그 지분을 펀드 자체에 되팔 수 없다. 거래소에 상장되어 투자자들끼리 서로 사고판다. 반면 개방형 펀드는 지분 수가 가변적이다. 새로운 투자자 수요가 생기면 지분을 추가 발행하고, 기존 투자자가 환매를 원하면 펀드가 지분을 사들여 소각한다. 이 과정은 일반적으로 하루 한 번, 시장이 끝난 뒤 펀드 순자산가치(NAV)가 결정될 때 이루어진다.
폐쇄형 펀드처럼 전자거래소에서 거래되는 상품이 ETF(상장지수펀드)다. ETF는 두 가지 중요한 특징을 가진다. 첫째, 대개 특정 시장지수의 수익률을 재현하도록 설계된다. 둘째, 투자자가 지분을 반환하려 하면, 펀드는 ETF 포트폴리오를 반영하는 기초증권 바스켓을 넘겨줄 수 있다. ETF는 매우 큰 단위(Creation Units, 때로 50,000주에 이름)로 지분을 발행하고 이를 거래소에서 개별 주식처럼 유통시킨다. 거래비용을 낮추고 분산투자와 높은 유동성을 원하는 투자자는 ETF를 선호하는 반면, 운용자의 종목선정 능력을 기대하는 투자자는 뮤추얼펀드를 선호한다.
헤지펀드는 뮤추얼펀드 운용자에게 부과되는 엄격한 규제를 피해 더 공격적인 전략을 추구하는 투자회사다. 규제와 공시 요건이 상대적으로 적기 때문에 적격투자자에게 접근이 제한된다. 헤지펀드 자체는 거래소에 상장되는 경우가 많지 않지만, 그 운용자들은 거래소시장의 핵심 참여자다.
1.1.3 파생상품
전자거래소에는 선물, 스왑, 옵션 같은 파생상품도 활발히 거래된다. 이들 계약은 채권, 외환, 원자재, 주식, 지수 등 매우 다양한 기초자산 위에 쓰인다. 이 책에서 전개하는 개념과 기법은 이런 모든 자산의 거래에 적용될 수 있지만, 예시와 응용은 주로 주식시장에 초점을 맞춘다. 알고리즘을 설계할 때는 자신이 거래하려는 자산의 특수성, 해당 전자거래소의 구체적 제도, 그리고 그 시장에서 마주칠 다른 투자자들의 거래목표를 반드시 함께 고려해야 한다.
1.2 시장참여자의 분류
거래전략과 알고리즘을 설계할 때는 전자거래소에서 마주치게 될 다양한 거래행태를 이해하는 것이 중요하다. 어떤 참여자가 왜 거래하는지를 알아야, 그 동기와 맞물리는 알고리즘을 설계할 수 있기 때문이다.
1.2.1 세 가지 주요 거래자 유형
- 기초적 거래자 또는 소음·유동성 거래자: 거래소 밖의 경제적 기초여건에 의해 거래가 유발되는 사람들이다. 어떤 개인은 기업의 성장에 참여하기 위해, 또는 갑작스러운 현금 수요나 위험선호의 변화 때문에 포트폴리오를 조정한다. 어떤 기업은 원재료 가격 변동을 헤지하기 위해 금융계약을 사용한다. 고빈도 알고리즘의 짧은 시간지평에서 보면 이들의 거래는 단기 시장사건과 비교해 '소음'으로 간주하는 것이 실용적이다.
- 정보 거래자: 아직 시장가격에 반영되지 않은 정보를 이용해 자산가격의 상승이나 하락을 예상하고 거래하는 사람들이다. 차익거래자(arbitrageurs)도 본질적으로 가격변화를 미리 포착해 거래한다는 점에서 이 범주에 포함한다.
- 시장조성자: 특정 자산의 거래를 원활하게 만들어 주는 대가로 수익을 얻고, 체결기술과 주문집행 능력을 활용하는 전문 거래자들이다.
1.2.2 능동적·수동적 거래와 유동성 공급·수요
시장조성형 거래는 대체로 '수동적(passive)' 또는 '반응적(reactive)' 거래라고 볼 수 있다. 이들은 거래과정 자체에 대한 정교한 지식을 이용해 시장상황 변화에 맞추어 행동한다. 반면 기초적 거래자와 정보 거래자는 거래환경 바깥에서 얻은 특정 정보우위를 활용하기 위해서만 거래하는 '능동적(active)' 또는 '공격적(aggressive)' 거래에 가깝다.
시장조성을 유동성 공급과 완전히 동일시하거나, 정보 거래를 곧바로 유동성 수요와 동일시하는 것은 잘못이다. 시장조성 활동은 일반적으로 유동성을 공급하는 방향을 띠지만, 특정 시장조성 전략은 어떤 때는 유동성을 제공하고 어떤 때는 오히려 유동성을 가져가기도 한다. 마찬가지로 정보 거래가 항상 공격적 주문으로만 이루어지는 것도 아니다. 이 책 10장에서는 항상 유동성을 공급하는 시장조성 알고리즘을, 8장에서는 유동성을 제공하면서도 동시에 가져가는 최적집행 모형을 다룬다.
1.3 전자시장에서의 거래
전자시장은 본질적으로 참여자가 자신의 거래 의사를 신호할 수 있는 방법과, 사고자 하는 사람과 팔고자 하는 사람을 연결해 주는 매칭 엔진을 갖춘 시스템으로 요약된다.
1.3.1 주문과 거래소
가장 기본적인 전자시장에서는 두 가지 주문유형이 존재한다. 시장가주문(Market Order, MO)은 즉시 체결을 목표로 하는 공격적 주문이다. MO를 제출하는 거래자는 최선의 현재 가격으로 일정 수량의 주식을 사고팔겠다는 의사를 표현하며, 대개 즉시 체결이 발생한다. 지정가주문(Limit Order, LO)은 수동적 주문이다. LO를 내는 거래자는 특정 가격에서 최대 일정 수량까지 매수 또는 매도할 의향이 있음을 뜻한다. LO에 적힌 가격은 보통 현재 시장가격보다 덜 유리한 가격이므로 즉시 체결되지 않고, 이후 그 가격에서 거래하고자 하는 상대주문이 들어오기를 기다리거나, 아니면 주문을 취소할 때까지 호가창에 남아 있게 된다.
주문은 매칭 엔진(matching engine)과 지정가호가창(LOB)에 의해 관리된다. 대부분의 시장은 MO에 LO보다 우선권을 주고, 그 위에 가격-시간 우선(price-time priority) 규칙을 적용한다. 매수 MO가 들어오면, 기존의 매도 LO 가운데 가장 낮은 매도가격부터 체결된다. 최우선 가격에 쌓여 있는 수량만으로 MO의 수요를 충족할 수 없다면, 가장 먼저 들어와 오래 기다린 LO부터 차례로 체결된다. 그래도 수량이 부족하면 두 번째, 세 번째로 좋은 가격 순으로 더 깊은 호가까지 내려가며 체결이 이어진다. 이렇게 들어온 MO가 더 불리한 가격 수준까지 연속해서 체결되는 것을 호가창을 걸어간다(walking the book)고 부른다.
1.3.2 대안적 거래소 구조
모든 전자시장이 가격-시간 우선순위만을 쓰는 것은 아니다. 단기금융시장 등 일부 시장에서는 안분배분(pro-rata) 규칙을 쓰는데, 들어온 MO는 최선가격에 대기 중인 LO들 사이에 수량 비례로 배분된다. 시간우선은 적용되지 않는다. 어떤 선물시장에서는 안분배분과 시간우선이 혼합된 방식을 사용하기도 한다.
많은 거래소는 특정 시점에 경매(auction)를 사용한다. 장 시작과 장 마감의 개시경매·종가경매, 변동성 제한 발동 이후 연속매매로 복귀시키는 경매 등이 그 예다.
시장구조를 구분하는 중요한 축은 투명성이다. LOB 정보가 공개되는 명시적(lit) 시장과, 호가정보가 외부에 보이지 않는 비공개(dark) 시장이 있다. 미국에서는 NASDAQ·NYSE 같은 규제거래소 외에도 ECN, 다크풀, 브로커-딜러 내부화 시장 등 다양한 전자거래장이 존재한다. 이 책 대부분의 알고리즘은 LOB를 관찰할 수 있는 lit 시장을 전제로 하지만, 7장에서는 다크풀과 lit 시장을 동시에 이용하는 최적집행 알고리즘도 다룬다.
1.3.3 코로케이션
거래소는 참여자에게 제공하는 정보의 양과 세분성도 통제한다. 저렴한 공용 통합 피드를 이용할 수도 있고, 훨씬 비싼 직접·전용 피드를 구매할 수도 있다. 또한 거래소는 속도에 대한 수요를 수익화하기 위해 매칭 엔진 옆에 컴퓨터·서버 공간을 임대하는데, 이를 코로케이션(colocation)이라고 한다.
코로케이션을 통해 거래소는 각 고객을 거래엔진에 연결하는 하드웨어, 케이블 길이, 네트워크를 직접 통제하여 거래참여자에게 균일한 서비스를 제공할 수 있다. 같은 코로케이션 시설 안에 있는 거래자들은 매우 빠른 접속을 거의 동일한 조건으로 누린다. 반면 코로케이션을 이용하지 않는 거래자는 항상 속도 면에서 불리한 위치에 놓인다.
거래엔진과의 거리 문제는 미국 주식시장의 분절화(fragmentation)와 연결된다. 미국 주식시장의 거래자는 최대 13개의 lit 전자거래소와 40개가 넘는 dark 거래장을 동시에 의식해야 한다. 한 거래소로 보낸 MO가 다른 거래소에서 더 나은 가격을 만날 수 있을 때 어떻게 처리되는지를 규율하는 trade-through 규칙도 존재한다. 미국에는 이 규칙이 있지만 유럽시장에는 없다. 여러 거래장 간 상호작용, 거래장 사이를 오갈 때의 지연(latency), 그리고 이를 둘러싼 규제는 성공적인 거래전략 설계에 추가적인 차원을 더한다.
1.3.4 확장 주문 유형
속도의 중요성은 거래알고리즘 설계의 전 과정에 스며든다. 거래소들도 이를 잘 알고 있기 때문에, 단순한 MO와 LO를 훨씬 넘어서는 다양한 주문유형을 제공한다. 대표적인 것들은 다음과 같다.
- Day Orders: 정규장 동안 유효하며, 필요하면 장전·장후 세션까지 연장할 수 있는 주문.
- Non-routable: 'book only', 'post only', 'midpoint peg'처럼 다른 거래소로의 기본 재라우팅을 피하도록 설계된 주문.
- Pegged, Hide-not-Slide: 중간가격 또는 전국 최우선가격과 함께 움직이는 주문.
- Hidden: 수량을 공개하지 않는 주문.
- Iceberg: 수량 일부만 공개하고, 공개분이 소진되면 자동으로 다시 채워 넣을 수 있는 주문.
- Immediate-or-Cancel (IOC): 최선가격에서 가능한 만큼만 즉시 체결하고 나머지는 취소하는 주문. 다른 거래소로 라우팅되지 않으며 호가창을 걸어가지도 않는다.
- Fill-or-Kill (FOK): 최선가격에서 전량이 즉시 체결되지 않으면 아예 체결되지 않는 주문.
- Good-Till-Time (GTT): 미리 정한 시각까지 체결되지 않으면 자동으로 취소되는 주문.
- Discretionary: 겉으로는 하나의 지정가격을 게시하지만, 더 공격적인 숨겨진 가격으로도 체결될 수 있는 주문.
이 목록은 대표적인 예시일 뿐이다. 실제로는 훨씬 더 많은 변형 주문이 존재한다. 주문유형의 다양성을 모르면 큰 손실로 이어질 수 있다. 일부 주문유형은 거래엔진 수준에서 자체적으로 가격 수정이나 조건 조정을 수행하므로, 아무리 빠른 알고리즘이라도 거래자 측 엔진이 이를 앞설 수 없다. 이 책 Part III의 수학적 알고리즘에서는 주로 MO와 LO를 사용하고, LO를 취소할 때는 전량 취소를 가정한다.
1.3.5 거래소 수수료
거래소에서의 거래는 공짜가 아니며, 그 비용도 모든 거래자에게 동일하지 않다. 많은 거래소는 maker-taker 수수료 체계를 운용한다. 이 체계에서는 MO를 보내 유동성을 가져가는 거래자(taker)가 수수료를 내고, 그 MO와 매칭되어 체결된 LO를 게시해 유동성을 제공한 거래자(maker)는 더 낮은 수수료를 내거나 오히려 거래소로부터 리베이트(rebate)를 받기도 한다.
반대로 taker-maker처럼 정반대의 수수료 구조를 가진 시장도 있다. 이런 시장에서는 유동성을 제공하는 쪽이 더 높은 비용을 부담하고, 유동성을 가져가는 쪽이 오히려 보조금을 받을 수도 있다.
수수료는 관측되는 시장가격을 왜곡한다. 실제 거래에서 중요한 가격은 공표된 호가 자체가 아니라, 수수료를 차감하거나 더한 뒤 거래자가 실제로 지불하거나 수취하는 순가격(net price)이다. 특히 시장이 분절되어 있을 때 이러한 수수료의 효과는 훨씬 더 논쟁적인 문제를 낳는다.
1.4 지정가호가창 (Limit Order Book)
이제 LOB의 구조를 더 구체적으로 살펴본다. 먼저 인공적인 예시를 통해 LOB의 작동 방식을 설명하고, 이어서 NASDAQ에서 거래된 실제 종목 HPQ와 FARO의 사례를 살펴본다.
1.4.1 LO의 LOB 추가 방식
전자거래소의 가장 기본적인 구성요소는 LOB와 매칭 알고리즘이다. 새로 들어온 LO는 자신의 가격 수준에서 LOB에 합류하고, 그 가격에 이미 대기 중이던 주문들 뒤쪽, 곧 가장 마지막 순서로 큐에 배치된다.
위쪽 패널은 최우선 bid, 최우선 ask, quoted spread, midprice가 동시에 어떻게 정의되는지를 보여 주고, 아래 패널은 23.09달러에 새 매수 LO가 들어왔을 때 같은 가격수준 큐의 맨 뒤에 합류하는 모습을 보여 준다. 가격-시간 우선이 실무에서 어떤 큐 규칙을 의미하는지 이 그림이 가장 명확하게 보여 준다.
그림 1.2. LOB illustration of a buy LO added to the queue at the best bid.
1.4.2 MO의 체결 과정: 호가창 걸어가기, 재라우팅, IOC
그림 1.2에 나타난 LOB에 250주 매도 MO가 들어온다고 하자. 이 거래장의 최우선 매수호가가 현재 여러 거래장을 통틀어 시장 전체가 표시하는 최우선 매수호가라고 가정한다. 매칭 엔진은 기존의 매수 LO와 새로 들어온 MO를 규칙에 따라 하나씩 맞춰 나간다. 최우선 매수호가 23.09달러에 각각 100주씩 두 개의 LO가 있으므로 총 200주가 즉시 체결된다.
상단은 250주 매도 MO가 동일 거래장 안에서 최우선 bid를 모두 소진한 뒤 그 아래 가격까지 내려가며 체결되는 전형적인 walking-the-book 상황이다. 하단은 미국식 order protection rule 때문에 남은 수량이 더 좋은 가격을 보이는 다른 거래장으로 재라우팅되는 경우다. 단일 거래장 최적화가 아니라 다중 venue 라우팅이 왜 중요한지 보여 준다.
그림 1.3. LOB illustration of a sell MO walking the LOB with and without re-routing.
미국에서는 trade-through 규칙이 존재하기 때문에 MO가 곧바로 한 거래소의 호가창을 깊게 걸어가는 모습은 매우 드물다. 대신 큰 MO가 여러 거래장에 걸쳐 매우 짧은 시간 동안 잘게 나뉘어 순차적으로 체결되는 모습을 관찰하게 된다. 이와 달리 유럽시장에는 trade-through 규칙이 없으므로 다른 거래 패턴이 나타난다.
2010년 5월 6일의 Flash Crash처럼 시장 깊이가 순식간에 증발하면, 연속적으로 이어지는 주문들 끝에 있는 MO는 극도로 나쁜 가격에서 체결될 수 있다. 최악의 경우에는 stub quote라 불리는 터무니없이 멀리 떨어진 호가와 매칭되기도 한다. 이는 사실상 체결될 것으로 기대하지 않는 상징적 호가인데, Flash Crash 당시 JKE, RSP, Exelon, Accenture 등의 종목에서 실제로 관측되었다. 이런 이유로 LOB는 단순히 LO를 저장하는 장부가 아니라, 들어오는 주문을 기존 LO와 어떤 규칙으로 연결할지를 추적하고 실행하는 핵심 장치다.
1.4.3 틱 크기
LOB는 이산적인 고정 가격격자 위에 정의된다. 이 격자의 각 점이 가격수준(price level)이며, 인접한 가격수준 사이의 간격을 틱(tick)이라고 한다. 미국에서는 1달러를 초과하는 모든 주식의 최소 틱 크기가 1센트다. 반면 파리증권거래소나 마드리드증권거래소처럼 주가 수준에 따라 0.001유로에서 0.05유로까지 다양한 틱 크기가 공존하는 시장도 있다.
1.4.4 Quoted Spread와 Midprice
그림 1.1에서 HPQ의 최선 매도호가(best ask)와 최선 매수호가(best bid)를 읽어낼 수 있다. 예컨대 최선 매도호가는 21.16달러, 최선 매수호가는 21.15달러다. 두 가격의 차이가 quoted spread다.
여기서 \(P_t^{b}\)는 시점 \(t\)의 최우선 매수호가(best bid), \(P_t^{a}\)는 최우선 매도호가(best ask)다. 이 예에서는 호가스프레드가 1센트, 곧 최소스프레드다.
특수한 경우로, bid와 ask가 같아져 스프레드가 0이 되기도 한다. 이를 잠김시장(locked market)이라고 부른다. 보통 오래 지속되지는 않지만, 매우 유동적인 자산에서는 점점 더 자주 관찰된다.
LOB를 설명할 때 자주 쓰는 또 하나의 대상은 중간가격(midprice)이다.
중간가격은 bid와 ask의 산술평균으로 정의된다. 명시적·암묵적 거래비용, 다시 말해 스프레드가 없다고 가정했을 때의 '진짜' 기초가격을 대리하는 값으로 자주 사용된다.
1.4.5 FARO와 HPQ의 유동성 비교
좌측은 HPQ, 우측은 FARO의 LOB 스냅샷이다. HPQ는 거의 모든 틱에 LO가 놓여 있고 상단 호가에 깊이가 충분하지만, FARO는 호가 간격이 넓고 공백이 많으며 깊이도 얕다. 좁은 스프레드와 촘촘한 가격연속성이 유동성의 핵심이라는 점을 이 그림이 직관적으로 보여 준다.
그림 1.1. NASDAQ LOB after the 10,000th event of the day.
그림 1.1에 나타난 두 LOB는 성격이 크게 다르다. HPQ는 거래가 활발하고 유동성이 높은 자산이다. HPQ의 LOB에는 적어도 중간가격에서 20틱 떨어진 가격수준까지 거의 모든 틱마다 LO가 게시되어 있으며, 스프레드도 최소인 1틱이다.
반면 FARO는 거래가 드물고 비유동적인 자산이다. FARO의 LOB에는 매수·매도호가가 듬성듬성 게시되어 있고, 중간에 비어 있는 가격구간도 불규칙하게 나타난다. 스프레드는 약 41달러 수준의 주가에서 20틱, 곧 20센트에 달한다.
두 자산의 유동성 차이는 하루 중 10,000번째 이벤트가 발생한 시점에서도 드러난다.
| 항목 | HPQ | FARO |
|---|---|---|
| 10,000번째 이벤트 도달 시각 | 오전 9시 42분경 (장 시작 후 약 15분) | 오후 12시 4분경 (장 시작 후 약 2시간 30분) |
| bid-ask spread | 1틱 (최소) | 20틱 (20센트) |
| 상위 2개 가격수준 합계 수량 | 1,000주 이상 | 100주 미만 |
| LOB 밀도 | 거의 모든 틱에 주문 게시 | 듬성듬성, 빈 가격구간 다수 |
| 달러 기준 깊이 비교 | 훨씬 크다 (주가 감안해도) | 훨씬 작다 |
1.4.6 LOB의 동학: 그림 1.4
그림 1.1은 LOB의 정적인 단면만 보여 줄 뿐이다. 실제로는 LOB의 동학이 훨씬 더 흥미롭고 정보가 많다.
세 종목의 패널은 5분 동안 호가창이 어떻게 움직이는지를 보여 준다. 파란 음영은 ask 측, 붉은 음영은 bid 측의 게시수량이며, 원은 공격적 MO의 체결 시점과 체결크기를 나타낸다. 정적인 스냅샷만으로는 보이지 않는 주문도착 빈도, 깊이 소진 속도, 최우선 호가의 내구성이 시계열 형태로 드러난다.
그림 1.4. Time series of the changes in the LOB for HPQ, NTAP, and ORCL.
1.4.7 Microprice
중간가격 \(\text{Midprice}_t\)는 bid와 ask를 단순 산술평균한 것이다. 그러나 최우선 bid와 ask에 게시된 상대적 수량이 가격이 어느 쪽으로 움직일 가능성이 큰지를 보여 준다는 점을 활용하면, 보다 섬세한 기초가격 추정량을 만들 수 있다. 매수 대기수량이 많다면 가격은 ask 쪽으로 밀릴 가능성이 크고, 매도 대기수량이 많다면 bid 쪽으로 내려갈 가능성이 커진다. 이 직관을 수량 가중 평균으로 수식화한 것이 microprice다.
여기서 \(V_t^{b}\)는 최우선 bid에 게시된 수량(매수 대기 물량), \(V_t^{a}\)는 최우선 ask에 게시된 수량(매도 대기 물량)이다. \(P_t^{b}\)와 \(P_t^{a}\)는 각각 최우선 bid와 ask 가격이다.
이 식을 직관적으로 해석하면: bid 측 물량 \(V_t^b\)가 크면 분자에서 \(P_t^a\)(ask 가격)의 비중이 커지므로 microprice가 ask 쪽으로 이동한다. 반대로 ask 측 물량 \(V_t^a\)가 크면 microprice가 bid 쪽으로 내려간다. 즉 microprice는 시장의 매수압력과 매도압력의 불균형을 가격으로 환산한 값이다.
세 가지 가격 지표를 비교하면 다음과 같다.
| 지표 | 정의 | 특징 |
|---|---|---|
| Quoted Spread | \(P_t^a - P_t^b\) | 거래비용의 1차 근사. 작을수록 유동성이 높다. |
| Midprice | \(\frac{1}{2}(P_t^a + P_t^b)\) | 스프레드가 없다고 가정한 기초가격 대리값. 단순하지만 수량정보를 무시한다. |
| Microprice | \(\frac{V_t^b P_t^a + V_t^a P_t^b}{V_t^b + V_t^a}\) | 최우선 호가 수량을 가중치로 반영. bid/ask 불균형이 가격 방향 예측에 유용하다. |
Microprice는 단순한 정의를 넘어, 향후 단기 가격 방향을 예측하는 시그널로 활용된다. 12장에서는 LOB의 수량 불균형을 고려한 알고리즘을 전개하면서 microprice와 상대수량의 효과를 더 깊이 다룬다. 이미 1장에서 이 개념을 정의함으로써, 이후 장들에서 최적 호가 결정, 재고 관리, 시장조성 알고리즘의 성과 평가에 이 지표를 반복적으로 활용할 기반을 마련한다.