Algorithmic and High-Frequency Trading
Chapter 2 — A Primer on the Microstructure of Financial Markets
Part B의 시장미시구조 모형들을 완전히 이해하려면 다음의 수학적 도구들이 필요하다. 각 절은 Chapter 2에서 반복적으로 등장하는 결과들을 정밀하게 정리한다. 특히 조건부기댓값과 Bayes 갱신은 이 장 전체의 수학적 엔진이므로 가장 자세히 다룬다.
A.1 시장 메커니즘의 기본 정의
bid, ask, spread, 중간가격, 주문 유형의 정의는 이후 모든 수식의 좌표계다. 시장조성 모형에서 가격결정 공식의 변수들이 정확히 무엇을 가리키는지 이 절에서 먼저 확정한다.
한 시점에서 최고 매수호가(best bid)를 \(b\), 최저 매도호가(best ask)를 \(a\)라 하자. 정상적인 시장에서는 항상 \(a \ge b\)이다. 중간가격(midprice), 호가스프레드(quoted spread), half-spread를 각각
$$m := \frac{a+b}{2}, \qquad s := a - b, \qquad \delta := \frac{s}{2} = \frac{a-b}{2}$$로 정의한다. 즉 \(a = m + \delta\), \(b = m - \delta\)가 성립한다.
시장가주문(market order, MO)은 현재 주문장에 존재하는 최선 호가를 즉시 체결시키는 주문이다. 가격 재량권을 포기하는 대신 즉시 체결을 보장받는다. 매수 MO는 best ask를 치고, 매도 MO는 best bid를 친다.
지정가주문(limit order, LO)은 가격과 수량을 지정해 주문장에 올려두고 반대편 MO가 들어오면 체결되는 주문이다. 비체결위험(non-execution risk)과 역선택위험(adverse selection risk)을 동시에 안는다.
유동성 거래자(liquidity trader)는 정보우위가 아니라 포트폴리오 재조정, 현금 수요 등 외생적 이유로 거래하는 참가자다. 이들의 주문에는 자산 가치에 대한 정보가 담겨 있지 않다.
정보우위 거래자(informed trader)는 자산의 fundamental value에 대해 시장보다 더 나은 정보를 보유하고 거래하는 참가자다.
시장조성자(market maker, MM)는 양방향 호가를 동시에 제시하여 유동성을 공급하고, 그 대가로 spread 수익을 얻는 참가자다. 동시에 inventory risk와 adverse selection risk를 떠안는다.
유동성은 spread 하나로 요약되지 않는다. Tightness: 즉시 거래 비용이 얼마나 작은가(spread). Depth: 현재 호가 근처에 얼마나 많은 수량이 쌓여 있는가. Resiliency: 충격 후 얼마나 빨리 주문장이 원상복원되는가. Immediacy: 원하는 시점에 얼마나 빨리 거래할 수 있는가. 소액 거래자는 spread가 좁은 시장을, 대형 거래자는 depth가 두터운 시장을 선호하므로 유동성은 반드시 거래 규모와 함께 읽어야 한다.
거래가 buyer-initiated이면 \(d_t=+1\), seller-initiated이면 \(d_t=-1\). 체결가격을 \(p_t\), 체결 직전 midprice를 \(m_t\), 체결 후 일정 시간 \(\Delta\) 뒤의 midprice를 \(m_{t+\Delta}\)라 하면
$$\text{Effective Spread}: \; ES_t := 2d_t(p_t - m_t)$$ $$\text{Realized Spread}: \; RS_{t,\Delta} := 2d_t(p_t - m_{t+\Delta})$$ $$\text{Adverse Selection}: \; AS_{t,\Delta} := 2d_t(m_{t+\Delta} - m_t)$$단순 대수 계산으로부터 분해식
$$ES_t = RS_{t,\Delta} + AS_{t,\Delta}$$가 성립한다. Effective spread는 거래자가 즉시 지불한 비용이고, realized spread는 유동성 공급자가 실제로 남긴 몫이며, adverse selection component는 체결 후 가격이 상대방에게 유리하게 움직인 부분, 즉 정보비용이다.
A.2 확률공간과 랜덤변수
"주문 흐름을 조건으로 한 자산가치의 기댓값"이라는 표현이 수학적으로 무엇을 의미하는지 명확히 정의한다.
확률공간(probability space)은 삼중쌍 \((\Omega, \mathcal{F}, \mathbb{P})\)이다. \(\Omega\)는 가능한 모든 상태의 집합, \(\mathcal{F}\)는 \(\sigma\)-algebra로 어떤 사건이 관측 가능한가를 형식화하고, \(\mathbb{P}\)는 각 사건에 확률을 부여한다.
\(\mathcal{F} \subseteq 2^\Omega\)가 \(\sigma\)-algebra라는 것은
$$\text{(i)}\ \Omega \in \mathcal{F}, \qquad \text{(ii)}\ A \in \mathcal{F} \Rightarrow A^c \in \mathcal{F}, \qquad \text{(iii)}\ A_1, A_2, \ldots \in \mathcal{F} \Rightarrow \bigcup_n A_n \in \mathcal{F}$$를 의미한다. 시장미시구조에서 \(\mathcal{G}\)는 "시장조성자가 현재까지 관측한 order flow 정보"로 이해한다. 부분 \(\sigma\)-algebra \(\mathcal{G} \subseteq \mathcal{F}\)는 \(\mathcal{F}\)보다 덜 많은 정보를 담는다.
함수 \(X : \Omega \to \mathbb{R}\)가 모든 \(\alpha \in \mathbb{R}\)에 대해 \(\{X \le \alpha\} \in \mathcal{F}\)를 만족하면 \(\mathcal{F}\)-가측 랜덤변수라 한다. AHFT 2장의 모든 객체인 자산가치 \(v\), 유동성 수요 \(u\), 내부자 주문 \(x(v)\), 효율가격 \(\mu_t\), 호가 \(a_t, b_t\)는 모두 랜덤변수 또는 확률과정이다.
A.3 조건부확률과 Bayes 정리
§2.2와 §2.3의 핵심 질문은 "buy order가 왔다는 사실을 관측했을 때, 자산가치가 높을 확률은 얼마인가"이다. 이것이 \(P(v = v_H \mid B)\)의 계산 문제다.
사건 \(A, B\)에 대해 \(P(B) > 0\)이면
$$P(A \mid B) := \frac{P(A \cap B)}{P(B)}$$이 정리 A.3.2에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리에서 기본 객체는 사건 \(A,B\)와, 경우에 따라 \(\{B_i\}_{i=1}^n\)라는 분할이다. \(\{B_i\}\)가 분할이라는 것은 서로소이고 합집합이 전체공간 \(\Omega\)가 된다는 뜻이다. \(P(A\mid B)\)는 사건 \(B\)가 이미 일어났다는 정보를 반영한 뒤 사건 \(A\)의 확률이고, Bayes 갱신에서는 \(P(A)\)를 사전확률, \(P(B\mid A)\)를 likelihood, \(P(A\mid B)\)를 사후확률로 읽는다.
\(P(A), P(B) > 0\)이면
$$P(A \mid B) = \frac{P(B \mid A) \cdot P(A)}{P(B)}$$가정을 다시 적으면 \(P(A), P(B) > 0\)이면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
조건부확률의 정의를 두 방향으로 각각 쓴다. 먼저 \(P(B)>0\)이므로
$$P(A\mid B)=\frac{P(A\cap B)}{P(B)}.$$또한 \(P(A)>0\)이므로
$$P(B\mid A)=\frac{P(A\cap B)}{P(A)}.$$둘째 식의 양변에 \(P(A)\)를 곱하면 교집합 확률이
$$P(A\cap B)=P(B\mid A)P(A)$$로 표현된다. 이제 이 표현을 첫째 식의 분자에 대입하면
$$P(A\mid B)=\frac{P(A\cap B)}{P(B)}=\frac{P(B\mid A)P(A)}{P(B)}.$$결국 사후확률은 사전확률과 likelihood의 곱을 정규화 상수 \(P(B)\)로 나눈 값이 된다. 이것이 Bayes 공식이다. \(\square\)
이 정리 A.3.3에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리에서 기본 객체는 사건 \(A,B\)와, 경우에 따라 \(\{B_i\}_{i=1}^n\)라는 분할이다. \(\{B_i\}\)가 분할이라는 것은 서로소이고 합집합이 전체공간 \(\Omega\)가 된다는 뜻이다. \(P(A\mid B)\)는 사건 \(B\)가 이미 일어났다는 정보를 반영한 뒤 사건 \(A\)의 확률이고, Bayes 갱신에서는 \(P(A)\)를 사전확률, \(P(B\mid A)\)를 likelihood, \(P(A\mid B)\)를 사후확률로 읽는다.
\(\{B_i\}_{i=1}^n\)이 \(\Omega\)의 분할이고 각 \(P(B_i) > 0\)이면
$$P(A) = \sum_i P(A \mid B_i) \cdot P(B_i)$$가정을 다시 적으면 \(\{B_i\}_{i=1}^n\)이 \(\Omega\)의 분할이고 각 \(P(B_i) > 0\)이면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(\{B_i\}_{i=1}^n\)가 분할이라는 말은 두 사실을 뜻한다. 첫째, \(B_i\cap B_j=\varnothing\) for \(i eq j\). 둘째, \(\bigcup_{i=1}^n B_i=\Omega\)이다. 따라서 사건 \(A\)는
$$A=A\cap\Omega=A\cap\Bigl(\bigcup_{i=1}^n B_i\Bigr)=\bigcup_{i=1}^n (A\cap B_i)$$로 분해된다. 분할의 서로소성 때문에 \(A\cap B_i\)들도 서로소이므로 확률의 가법성에서
$$P(A)=\sum_{i=1}^n P(A\cap B_i).$$이제 각 \(i\)에 대해 \(P(B_i)>0\)이므로 조건부확률 정의를 적용할 수 있고,
$$P(A\cap B_i)=P(A\mid B_i)P(B_i).$$이를 위 합식에 대입하면
$$P(A)=\sum_{i=1}^n P(A\mid B_i)P(B_i).$$즉 전체확률의 법칙이 성립한다. \(\square\)
A.4 조건부기댓값 — 정의, 존재, 유일성, 핵심 성질
조건부기댓값은 AHFT Chapter 2 전체를 관통하는 수학적 핵심이다. "관측된 정보로 자산가치를 가장 잘 추정한 값"이 조건부기댓값이며, 이것이 경쟁적 MM의 최적 호가가 되는 근본 이유다.
A.4.1 엄밀 정의
\(\{B_1, \ldots, B_n\}\)이 \(\Omega\)의 분할이고 \(X\)가 적분가능 랜덤변수일 때
$$\mathbb{E}[X \mid \sigma(B_1, \ldots, B_n)] = \sum_i \mathbb{E}[X \mid B_i] \cdot \mathbf{1}_{B_i}, \qquad \mathbb{E}[X \mid B_i] := \frac{\mathbb{E}[X \cdot \mathbf{1}_{B_i}]}{P(B_i)}$$\(X \in L^1\), \(\mathcal{G} \subseteq \mathcal{F}\)라 하자. \(\mathbb{E}[X \mid \mathcal{G}]\)는 다음 두 조건을 만족하는 확률변수 \(Y\)다.
$$\text{(i)}\ Y\text{는 }\mathcal{G}\text{-가측이다.} \qquad \text{(ii)}\ \forall A \in \mathcal{G}: \int_A Y\,d\mathbb{P} = \int_A X\,d\mathbb{P}.$$이때 \(Y\)는 a.s. 유일하다. 존재성은 Radon–Nikodym 정리로 보장된다. 조건 (ii)를 부분평균화(partial averaging) 조건이라 한다.
A.4.2 존재성
이 보조정리 A.4.3에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 보조정리의 객체는 Hilbert 공간 \(L^2(\mathcal F)\)와 그 안의 부분집합 \(L^2(\mathcal G)=\{Y\in L^2(\mathcal F):Y\text{는 }\mathcal G\text{-가측}\}\)이다. 선형부분공간이라는 말은 덧셈과 스칼라배에 대해 닫혀 있다는 뜻이고, 닫혀 있다는 말은 \(L^2\)-노름으로 수렴하는 수열의 극한이 다시 그 집합 안에 남는다는 뜻이다.
\(L^2(\mathcal{G}) := \{Y \in L^2(\mathcal{F}) : Y \text{ 는 }\mathcal{G}\text{-가측}\}\)는 \(L^2(\mathcal{F})\)의 닫힌 선형부분공간이다.
가정을 다시 적으면 \(L^2(\mathcal{G}) := \{Y \in L^2(\mathcal{F}) : Y \text{ 는 }\mathcal{G}\text{-가측}\}\)는 \(L^2(\mathcal{F})\)의 닫힌 선형부분공간이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
먼저 선형성을 보인다. \(Y_1,Y_2\in L^2(\mathcal G)\), \(a,b\in\mathbb R\)라 하자. \(Y_1,Y_2\)가 모두 \(\mathcal G\)-가측이므로 \(aY_1+bY_2\)도 \(\mathcal G\)-가측이다. 또한
$$\mathbb E[|aY_1+bY_2|^2]\le 2a^2\mathbb E[|Y_1|^2]+2b^2\mathbb E[|Y_2|^2]<\infty,$$이므로 \(aY_1+bY_2\in L^2(\mathcal G)\)이다. 따라서 \(L^2(\mathcal G)\)는 선형부분공간이다.
이제 닫힘성을 보인다. \(Y_n\in L^2(\mathcal G)\)이고 \(Y_n\to Y\) in \(L^2\)라고 하자. \(L^2\)-수렴이면 어떤 부분열 \(Y_{n_k}\)를 택해 \(Y_{n_k}\to Y\) almost surely가 되게 할 수 있다. 각 \(Y_{n_k}\)는 \(\mathcal G\)-가측이다. 가측함수열의 점wise 극한은 다시 가측이므로 \(Y\)는 \(\mathcal G\)-가측이다.
또한 \(Y_n\to Y\) in \(L^2\)라는 가정 자체가 \(Y\in L^2(\mathcal F)\)임을 포함한다. 따라서 \(Y\in L^2(\mathcal G)\)이다. 곧 \(L^2(\mathcal G)\)는 닫힌 선형부분공간이다. \(\square\)
이 정리 A.4.4에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리에서 \(H\)는 내적 \(\langle\cdot,\cdot\rangle\)와 노름 \(\|x\|=\sqrt{\langle x,x\rangle}\)를 가진 Hilbert 공간이고, \(M\subset H\)는 닫힌 선형부분공간이다. 정사영(projection)은 주어진 벡터 \(x\)에 대해 \(M\) 안에서 가장 가까운 점을 고르는 연산이고, 그 특징은 오차벡터 \(x-m^*\)가 \(M\) 전체와 직교한다는 점이다.
\(H\)를 Hilbert 공간, \(M \subset H\)를 닫힌 선형부분공간이라 하자. 임의의 \(x \in H\)에 대해 유일한 \(m^* \in M\)가 존재하여 \(\|x - m^*\| = \inf_{m \in M}\|x-m\|\)이고, \(\langle x - m^*, z \rangle = 0\) for all \(z \in M\)이다.
가정을 다시 적으면 \(H\)를 Hilbert 공간, \(M \subset H\)를 닫힌 선형부분공간이라 하자. 임의의 \(x \in H\)에 대해 유일한 \(m^* \in M\)가 존재하여 \(\|x - m^*\| = \inf_{m \in M}\|x-m\|\)이고, \(\langle x - m^*, z \rangle = 0\) for all \(z \in M\)이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
존재성: \(d := \inf_{m \in M}\|x-m\|\), \(\|x - m_n\| \downarrow d\)인 수열을 잡는다. 평행사변형 항등식
$$\|m_n - m_m\|^2 = 2\|x-m_n\|^2 + 2\|x-m_m\|^2 - 4\left\|x - \frac{m_n+m_m}{2}\right\|^2$$에서 \((m_n+m_m)/2 \in M\)이므로 마지막 항이 \(\ge 4d^2\). 따라서 \(\|m_n - m_m\|^2 \le 2\|x-m_n\|^2 + 2\|x-m_m\|^2 - 4d^2 \to 0\). \((m_n)\)은 Cauchy열이고 \(M\)이 닫혀 있으므로 \(m^* \in M\) 존재.
직교성: \(\phi(t) = \|x-(m^*+tz)\|^2\)는 \(t=0\)에서 최솟값이므로 \(\phi'(0) = -2\langle x-m^*, z\rangle = 0\). 유일성: 두 최솟값이 있으면 평행사변형 항등식에서 \(\|m_1^* - m_2^*\|^2 \le 0\). \(\square\)
이 정리 A.4.5에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리는 조건부기댓값의 존재를 두 단계로 나눈다. 먼저 \(X\in L^2\)에서는 정사영 정리로 존재를 만든다. 그다음 일반 적분가능 변수 \(X\in L^1\)에 대해서는 절단변수 \(X_n=(-n)\vee(X\wedge n)\)를 사용해 \(L^2\)에서 만든 조건부기댓값을 \(L^1\)-극한으로 넘긴다. 따라서 여기서 핵심 객체는 \(L^2(\mathcal G)\), 절단 \(X_n\), 그리고 \(L^1\)-수렴이다.
\(X \in L^2\)이면 정사영 정리를 \(H = L^2(\mathcal{F})\), \(M = L^2(\mathcal{G})\)에 적용하여 \(Y \in L^2(\mathcal{G})\)가 존재하고 \(\mathbb{E}[(X-Y)Z] = 0\) for all \(Z \in L^2(\mathcal{G})\)가 성립한다. \(Z = \mathbf{1}_A\)를 넣으면 부분평균화 조건이 확인된다.
일반 \(X \in L^1\)에 대해서는 절단 \(X_n := (-n) \vee (X \wedge n) \in L^2\)을 적용한다. \(L^1\)-contraction 성질 \(\mathbb{E}[|\mathbb{E}[Z|\mathcal{G}]|] \le \mathbb{E}[|Z|]\)에서 \(\mathbb{E}[|Y_n - Y_m|] \le \mathbb{E}[|X_n - X_m|] \to 0\)이므로 \(L^1\)-Cauchy열이고 극한 \(Y\)가 존재한다. \(\square\)
가정을 다시 적으면 \(X \in L^2\)이면 정사영 정리를 \(H = L^2(\mathcal{F})\), \(M = L^2(\mathcal{G})\)에 적용하여 \(Y \in L^2(\mathcal{G})\)가 존재하고 \(\mathbb{E}[(X-Y)Z] = 0\) for all \(Z \in L^2(\mathcal{G})\)가 성립한다. \(Z = \mathbf{1}_A\)를 넣으면 부분평균화 조건이 확인된다. 일반 \(X \in L^1\)에 대해서는 절단 \(X_n := (-n) \vee (X \wedge n) \in L^2\)을 적용한다. \(L^1\)-contraction 성질 \(\mathbb{E}[|\mathbb{E}[Z|\mathcal{G}]|] \le \mathbb{E}[|Z|]\)에서 \(\mathbb{E}[|Y_n - Y_m|] \le \mathbb{E}[|X_n - X_m|] \to 0\)이므로 \(L^1\)-Cauchy열이고 극한 \(Y\)가 존재한다. \(\square\) 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
먼저 \(X\in L^2(\mathcal F)\)인 경우를 다룬다. 보조정리 A.4.3에 의해 \(L^2(\mathcal G)\)는 \(L^2(\mathcal F)\)의 닫힌 선형부분공간이다. 따라서 정리 A.4.4를 \(H=L^2(\mathcal F)\), \(M=L^2(\mathcal G)\), \(x=X\)에 적용하면 어떤 \(Y\in L^2(\mathcal G)\)가 존재하여
$$\mathbb E[(X-Y)Z]=0 \qquad \text{for all } Z\in L^2(\mathcal G)$$가 성립한다. 이제 \(A\in\mathcal G\)를 임의로 잡으면 \(\mathbf 1_A\in L^2(\mathcal G)\)이므로 \(Z=\mathbf 1_A\)를 넣을 수 있다. 그러면
$$0=\mathbb E[(X-Y)\mathbf 1_A]=\mathbb E[X\mathbf 1_A]-\mathbb E[Y\mathbf 1_A].$$즉 \(\mathbb E[Y\mathbf 1_A]=\mathbb E[X\mathbf 1_A]\)가 모든 \(A\in\mathcal G\)에 대해 성립한다. 또한 \(Y\)는 \(\mathcal G\)-가측이다. 따라서 \(Y\)는 조건부기댓값의 정의를 만족한다. 곧 \(Y=\mathbb E[X\mid\mathcal G]\)이다.
이제 일반 \(X\in L^1\)로 확장한다. 절단변수
$$X_n:=(-n)\vee(X\wedge n)$$를 두면 각 \(X_n\)은 유계이므로 \(L^2\)에 속한다. 방금 증명한 \(L^2\) 경우에 의해 \(Y_n:=\mathbb E[X_n\mid\mathcal G]\)가 존재한다. 또한
$$|Y_n-Y_m|=\left|\mathbb E[X_n-X_m\mid\mathcal G]\right|\le \mathbb E[|X_n-X_m|\mid\mathcal G]$$almost surely이고, 양변의 기대값을 취하면
$$\mathbb E|Y_n-Y_m|\le \mathbb E|X_n-X_m|.$$그런데 \(X_n\to X\) in \(L^1\)이므로 우변은 \(n,m\to\infty\)에서 0으로 간다. 따라서 \((Y_n)\)은 \(L^1\)-Cauchy열이고, 어떤 \(Y\in L^1\)가 존재하여 \(Y_n\to Y\) in \(L^1\)이다.
이제 \(Y\)가 조건부기댓값 정의를 만족함을 보인다. 각 \(Y_n\)은 \(\mathcal G\)-가측이다. \(L^1\)-수렴에서 부분열을 택하면 almost surely 수렴하는 부분열이 있으므로 \(Y\)도 \(\mathcal G\)-가측이다. 또 임의의 \(A\in\mathcal G\)에 대해
$$\mathbb E[Y_n\mathbf 1_A]=\mathbb E[X_n\mathbf 1_A].$$왼쪽은 \(L^1\)-수렴으로 \(\mathbb E[Y\mathbf 1_A]\)로 간다. 오른쪽은 \(|X_n\mathbf 1_A-X\mathbf 1_A|\le |X_n-X|\)와 \(L^1\)-수렴으로부터 \(\mathbb E[X\mathbf 1_A]\)로 간다. 따라서
$$\mathbb E[Y\mathbf 1_A]=\mathbb E[X\mathbf 1_A] \qquad \text{for all } A\in\mathcal G.$$결국 \(Y\)는 \(\mathcal G\)-가측이고 부분평균화 조건도 만족한다. 그러므로 \(Y=\mathbb E[X\mid\mathcal G]\)가 존재한다. \(\square\)
A.4.3 유일성
이 정리 A.4.6에서 쓰는 기본 객체와 가정부터 분명히 적는다. 조건부기댓값의 정의는 \(\mathcal G\)-가측성과 부분평균화 조건 \(\int_A Y\,d\mathbb P=\int_A X\,d\mathbb P\) for all \(A\in\mathcal G\)의 두 축으로 이루어진다. 이 정리는 그 두 조건을 만족하는 대표자가 두 개 있더라도 서로 거의 확실하게 같다는 것을 말한다. 즉 조건부기댓값은 점wise가 아니라 a.s. 의미에서 유일하다.
\(Y_1, Y_2\)가 모두 \(\mathbb{E}[X \mid \mathcal{G}]\)의 정의를 만족하면 \(Y_1 = Y_2\) a.s.이다.
가정을 다시 적으면 \(Y_1, Y_2\)가 모두 \(\mathbb{E}[X \mid \mathcal{G}]\)의 정의를 만족하면 \(Y_1 = Y_2\) a.s.이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(D := Y_1 - Y_2\)는 \(\mathcal{G}\)-가측이고 모든 \(A \in \mathcal{G}\)에 대해 \(\int_A D\,d\mathbb{P} = 0\). \(A_+ := \{D > 0\} \in \mathcal{G}\)를 택하면 \(\int_{A_+} D\,d\mathbb{P} = 0\)이고 피적분함수가 양수이므로 \(D = 0\) a.s. on \(A_+\). 마찬가지로 \(A_- := \{D < 0\}\)에서도 같다. \(\Omega = A_+ \cup A_- \cup \{D=0\}\)이므로 전체적으로 \(D = 0\) a.s. \(\square\)
A.4.4 핵심 성질과 증명
이 정리 A.4.7에서 쓰는 기본 객체와 가정부터 분명히 적는다. 여기서 \(X,Z\in L^1\), \(a,b\in\mathbb R\), \(\mathcal G\subseteq\mathcal F\)이다. 선형성은 조건부기댓값이 단순한 평균연산이 아니라 \(L^1\) 위의 선형연산자라는 뜻이다. 즉 가중합을 먼저 만든 뒤 조건부평균을 취하나, 각 항을 따로 조건부평균한 뒤 가중합하나 결과가 같아진다.
가정을 다시 적으면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
우변
$$U:=a\,\mathbb E[X\mid\mathcal G]+b\,\mathbb E[Z\mid\mathcal G]$$를 정의하자. \(\mathbb E[X\mid\mathcal G]\)와 \(\mathbb E[Z\mid\mathcal G]\)는 모두 \(\mathcal G\)-가측이므로 \(U\) 역시 \(\mathcal G\)-가측이다.
이제 임의의 \(A\in\mathcal G\)를 잡는다. 그러면 조건부기댓값의 정의에 의해
$$\mathbb E[U\mathbf 1_A]=a\,\mathbb E[\mathbb E[X\mid\mathcal G]\mathbf 1_A]+b\,\mathbb E[\mathbb E[Z\mid\mathcal G]\mathbf 1_A]$$ $$=a\,\mathbb E[X\mathbf 1_A]+b\,\mathbb E[Z\mathbf 1_A]=\mathbb E[(aX+bZ)\mathbf 1_A].$$즉 \(U\)는 \(\mathcal G\)-가측이고, 모든 \(A\in\mathcal G\)에 대해 \(\mathbb E[U\mathbf 1_A]=\mathbb E[(aX+bZ)\mathbf 1_A]\)를 만족한다. 따라서 조건부기댓값의 유일성에 의해
$$U=\mathbb E[aX+bZ\mid\mathcal G]$$almost surely이다. 곧 선형성이 성립한다. \(\square\)
이 정리 A.4.8에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리의 핵심은 \(\mathcal G\)-가측 변수 \(Z\)는 이미 \(\mathcal G\)가 알고 있는 정보이므로 조건부기댓값 바깥으로 꺼낼 수 있다는 사실이다. 정확히는 \(X\in L^1\), \(Z\)는 \(\mathcal G\)-가측이며 \(ZX\in L^1\)이라고 두고, \(\mathbb E[ZX\mid\mathcal G]\)가 \(Z\mathbb E[X\mid\mathcal G]\)와 같음을 보인다.
\(Z\)가 \(\mathcal{G}\)-가측이고 적분가능하면
$$\mathbb{E}[ZX \mid \mathcal{G}] = Z\,\mathbb{E}[X \mid \mathcal{G}]$$가정을 다시 적으면 \(Z\)가 \(\mathcal{G}\)-가측이고 적분가능하면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
먼저 \(Z=\mathbf 1_B\), \(B\in\mathcal G\)인 지시함수 경우를 보인다. 이때 \(\mathbf 1_B\mathbb E[X\mid\mathcal G]\)는 \(\mathcal G\)-가측이다. 임의의 \(A\in\mathcal G\)에 대해
$$\mathbb E[\mathbf 1_A\mathbf 1_B\mathbb E[X\mid\mathcal G]] = \mathbb E[\mathbf 1_{A\cap B}\mathbb E[X\mid\mathcal G]] = \mathbb E[\mathbf 1_{A\cap B}X] = \mathbb E[\mathbf 1_A\mathbf 1_B X].$$따라서 유일성에 의해
$$\mathbb E[\mathbf 1_B X\mid\mathcal G]=\mathbf 1_B\mathbb E[X\mid\mathcal G].$$다음으로 \(Z\)가 비음이 아닌 단순함수 \(Z=\sum_{j=1}^m c_j\mathbf 1_{B_j}\)라고 하자. 선형성과 방금 증명한 지시함수 경우를 이용하면
$$\mathbb E[ZX\mid\mathcal G]=\sum_{j=1}^m c_j\mathbb E[\mathbf 1_{B_j}X\mid\mathcal G]=\sum_{j=1}^m c_j\mathbf 1_{B_j}\mathbb E[X\mid\mathcal G]=Z\mathbb E[X\mid\mathcal G].$$이제 일반적인 비음이 아닌 \(\mathcal G\)-가측 \(Z\)를 잡고, \(Z_n\uparrow Z\)인 비음 단순함수열을 택한다. 그러면 \(Z_nX^+\uparrow ZX^+\), \(Z_nX^-\uparrow ZX^-\)이므로 단조수렴정리를 각각 적용할 수 있다. 따라서
$$\mathbb E[ZX^+\mid\mathcal G]=Z\mathbb E[X^+\mid\mathcal G],\qquad \mathbb E[ZX^-\mid\mathcal G]=Z\mathbb E[X^-\mid\mathcal G].$$두 식을 빼면 \(ZX\in L^1\)일 때
$$\mathbb E[ZX\mid\mathcal G]=Z\mathbb E[X\mid\mathcal G].$$마지막으로 \(Z\)가 부호를 가질 수 있으면 \(Z=Z^+-Z^-\)로 분해하고 선형성을 적용하면 같은 결론이 나온다. \(\square\)
이 정리 A.4.9에서 쓰는 기본 객체와 가정부터 분명히 적는다. 여기서는 정보가 두 단계로 중첩된다. \(\mathcal H\subseteq\mathcal G\subseteq\mathcal F\)이면 \(\mathcal G\)는 더 많은 정보, \(\mathcal H\)는 더 적은 정보다. tower property는 큰 정보로 한 번 평균을 낸 뒤 작은 정보로 다시 평균을 내면 처음부터 작은 정보만 가지고 평균을 낸 것과 같다고 말한다.
\(\mathcal{H} \subseteq \mathcal{G} \subseteq \mathcal{F}\)일 때
$$\mathbb{E}\!\left[\mathbb{E}[X \mid \mathcal{G}] \mid \mathcal{H}\right] = \mathbb{E}[X \mid \mathcal{H}]$$가정을 다시 적으면 \(\mathcal{H} \subseteq \mathcal{G} \subseteq \mathcal{F}\)일 때 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(Y:=\mathbb E[X\mid\mathcal G]\)라고 두자. 먼저 \(Y\)는 \(\mathcal G\)-가측이고 적분가능하므로, \(\mathcal H\subseteq\mathcal G\)에서 \(\mathbb E[Y\mid\mathcal H]\)는 잘 정의된다. 또한 당연히 \(\mathcal H\)-가측이다.
이제 임의의 사건 \(A\in\mathcal H\)를 잡는다. \(\mathcal H\subseteq\mathcal G\)이므로 \(A\in\mathcal G\)이기도 하다. 따라서 \(Y=\mathbb E[X\mid\mathcal G]\)의 defining property에 의해
$$\mathbb E[Y\mathbf 1_A]=\mathbb E[X\mathbf 1_A].$$한편 \(\mathbb E[Y\mid\mathcal H]\)의 정의를 \(A\in\mathcal H\)에 적용하면
$$\mathbb E[\mathbb E[Y\mid\mathcal H]\mathbf 1_A]=\mathbb E[Y\mathbf 1_A].$$두 식을 연결하면
$$\mathbb E[\mathbb E[Y\mid\mathcal H]\mathbf 1_A]=\mathbb E[X\mathbf 1_A] \qquad \text{for all } A\in\mathcal H.$$즉 \(\mathbb E[Y\mid\mathcal H]\)는 \(\mathcal H\)-가측이고, 모든 \(A\in\mathcal H\) 위에서 \(X\)와 같은 적분값을 갖는다. 따라서 조건부기댓값의 유일성에 의해
$$\mathbb E[\mathbb E[X\mid\mathcal G]\mid\mathcal H]=\mathbb E[X\mid\mathcal H]$$almost surely이다. 이것이 tower property다. \(\square\)
큰 정보 \(\mathcal{G}\)에 대해 한 번 평균을 낸 뒤, 더 작은 정보 \(\mathcal{H}\)로 다시 평균을 내면, 처음부터 \(\mathcal{H}\)만 가지고 평균을 낸 것과 같다. §2.3.1에서 "효율가격은 martingale"이라는 명제는 이 성질의 직접적 귀결이다.
이 보조정리 A.4.10에서 쓰는 기본 객체와 가정부터 분명히 적는다. 오차항 \(X-\mathbb E[X\mid\mathcal G]\)는 \(\mathcal G\)-가측 변수들과 평균적으로 직교한다. 여기서 직교는 내적 \(\langle U,V\rangle=\mathbb E[UV]\)가 0이라는 뜻이다. 이는 조건부기댓값을 \(L^2(\mathcal G)\) 위 정사영으로 보는 해석과 정확히 일치한다.
\(Y\)가 \(\mathcal{G}\)-가측이고 적분가능하면 \(\mathbb{E}\!\left[(X - \mathbb{E}[X|\mathcal{G}]) Y\right] = 0\)이다.
가정을 다시 적으면 \(Y\)가 \(\mathcal{G}\)-가측이고 적분가능하면 \(\mathbb{E}\!\left[(X - \mathbb{E}[X|\mathcal{G}]) Y\right] = 0\)이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
Tower property와 Pulling out known factors를 적용한다.
$$\mathbb{E}[(X-\mathbb{E}[X|\mathcal{G}])Y] = \mathbb{E}\!\left[\mathbb{E}[(X-\mathbb{E}[X|\mathcal{G}])Y \mid \mathcal{G}]\right] = \mathbb{E}\!\left[Y \cdot \mathbb{E}[X - \mathbb{E}[X|\mathcal{G}] \mid \mathcal{G}]\right]$$\(\mathbb{E}[X|\mathcal{G}]\)는 \(\mathcal{G}\)-가측이므로 \(\mathbb{E}[X - \mathbb{E}[X|\mathcal{G}] \mid \mathcal{G}] = \mathbb{E}[X|\mathcal{G}] - \mathbb{E}[X|\mathcal{G}] = 0\). \(\square\)
이 정리 A.4.11에서 쓰는 기본 객체와 가정부터 분명히 적는다. \(X\in L^2\)일 때 \(\mathcal G\)-가측 확률변수들 가운데 평균제곱오차 \(\mathbb E[(X-Z)^2]\)를 최소로 만드는 예측량이 바로 \(\mathbb E[X\mid\mathcal G]\)이다. 이 정리는 조건부기댓값이 단순한 정의적 객체가 아니라 통계적 최적예측량이라는 사실을 보여 준다.
\(X \in L^2\)이면 \(\mathbb{E}[X|\mathcal{G}] = \arg\min_{Z \in L^2(\mathcal{G})} \mathbb{E}[(X-Z)^2]\)이다.
가정을 다시 적으면 \(X \in L^2\)이면 \(\mathbb{E}[X|\mathcal{G}] = \arg\min_{Z \in L^2(\mathcal{G})} \mathbb{E}[(X-Z)^2]\)이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(X - Z = (X - \mathbb{E}[X|\mathcal{G}]) + (\mathbb{E}[X|\mathcal{G}] - Z)\)로 분해. \(W := \mathbb{E}[X|\mathcal{G}] - Z\)는 \(\mathcal{G}\)-가측이므로 조건부직교성에 의해 \(\mathbb{E}[(X - \mathbb{E}[X|\mathcal{G}]) \cdot W] = 0\). 따라서 \(\mathbb{E}[(X-Z)^2] = \mathbb{E}[(X-\mathbb{E}[X|\mathcal{G}])^2] + \mathbb{E}[W^2] \ge \mathbb{E}[(X-\mathbb{E}[X|\mathcal{G}])^2]\). \(\square\)
이 정리 A.4.12에서 쓰는 기본 객체와 가정부터 분명히 적는다. 분산은 총 불확실성을 뜻한다. 이 정리는 그 총 불확실성이 두 조각으로 나뉜다고 말한다. 하나는 정보를 안 뒤에도 남는 평균적인 조건부분산 \(\mathbb E[\operatorname{Var}(X\mid\mathcal G)]\)이고, 다른 하나는 조건부평균 자체가 흔들리는 정도 \(\operatorname{Var}(\mathbb E[X\mid\mathcal G])\)이다.
가정을 다시 적으면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(m:=\mathbb E[X]\), \(Y:=\mathbb E[X\mid\mathcal G]\)라고 두자. 그러면
$$X-m=(X-Y)+(Y-m).$$양변을 제곱하면
$$ (X-m)^2=(X-Y)^2+2(X-Y)(Y-m)+(Y-m)^2. $$이제 기대값을 취한다.
$$\mathbb E[(X-m)^2]=\mathbb E[(X-Y)^2]+2\mathbb E[(X-Y)(Y-m)]+\mathbb E[(Y-m)^2].$$중간항을 0으로 만드는 것이 핵심이다. \(Y-m\)은 \(\mathcal G\)-가측이므로 보조정리 A.4.10의 조건부직교성을 적용할 수 있다. 따라서
$$\mathbb E[(X-Y)(Y-m)]=0.$$또한 정의에 의해
$$\operatorname{Var}(X)=\mathbb E[(X-m)^2],\qquad \operatorname{Var}(Y)=\mathbb E[(Y-m)^2].$$그리고 조건부분산의 정의는
$$\operatorname{Var}(X\mid\mathcal G):=\mathbb E[(X-Y)^2\mid\mathcal G].$$따라서 tower property로
$$\mathbb E[(X-Y)^2]=\mathbb E\big[\mathbb E[(X-Y)^2\mid\mathcal G]\big]=\mathbb E[\operatorname{Var}(X\mid\mathcal G)].$$이 모든 식을 합치면
$$\operatorname{Var}(X)=\mathbb E[\operatorname{Var}(X\mid\mathcal G)]+\operatorname{Var}(\mathbb E[X\mid\mathcal G]).$$원하는 등식이 증명되었다. \(\square\)
이 정리 A.4.13에서 쓰는 기본 객체와 가정부터 분명히 적는다. \(\varphi\)가 볼록함수이면 평균을 먼저 취한 값에 \(\varphi\)를 적용하는 것이, \(\varphi\)를 먼저 적용한 뒤 평균을 취하는 것보다 작다. 조건부 Jensen 부등식은 이 원리를 정보 집합 \(\mathcal G\) 아래의 조건부기댓값으로 옮긴 것이다.
볼록함수 \(\varphi\)에 대해 \(\varphi(\mathbb{E}[X|\mathcal{G}]) \le \mathbb{E}[\varphi(X)|\mathcal{G}]\) a.s.
가정을 다시 적으면 볼록함수 \(\varphi\)에 대해 \(\varphi(\mathbb{E}[X|\mathcal{G}]) \le \mathbb{E}[\varphi(X)|\mathcal{G}]\) a.s. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(M := \mathbb{E}[X|\mathcal{G}]\)라 두자. 볼록성에 의해 subgradient \(g_M\)이 존재하여 \(\varphi(X) \ge \varphi(M) + g_M(X-M)\). 조건부기댓값을 취하면 \(\mathbb{E}[\varphi(X)|\mathcal{G}] \ge \varphi(M) + g_M \cdot \mathbb{E}[X-M|\mathcal{G}] = \varphi(M)\). 마지막 등호는 \(\mathbb{E}[X-M|\mathcal{G}] = M - M = 0\). \(\square\)
이 보조정리 A.4.14에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 명제의 상황은 \(X\)가 \(\mathcal G\)와 독립이라는 것이다. 독립이면 \(\mathcal G\)가 알려 주는 정보가 \(X\)의 분포를 전혀 바꾸지 못하므로, \(\mathbb E[X\mid\mathcal G]\)는 무작위 객체가 아니라 상수 \(\mathbb E[X]\)가 된다.
\(X\)가 \(\mathcal{G}\)와 독립이면 \(\mathbb{E}[X|\mathcal{G}] = \mathbb{E}[X]\)이다.
가정을 다시 적으면 \(X\)가 \(\mathcal{G}\)와 독립이면 \(\mathbb{E}[X|\mathcal{G}] = \mathbb{E}[X]\)이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
상수 \(c:=\mathbb E[X]\)를 생각하자. 상수는 모든 \(\sigma\)-대수에 대해 가측이므로 \(c\)는 \(\mathcal G\)-가측이다. 이제 임의의 \(A\in\mathcal G\)에 대해 독립성을 사용한다. \(\mathbf 1_A\)는 \(\mathcal G\)-가측이므로 \(X\)와 독립이며, 따라서
$$\mathbb E[X\mathbf 1_A]=\mathbb E[X]\,\mathbb E[\mathbf 1_A]=c\,\mathbb P(A)=\mathbb E[c\mathbf 1_A].$$즉 \(c\)는 \(\mathcal G\)-가측이고, 모든 \(A\in\mathcal G\)에 대해 \(\mathbb E[c\mathbf 1_A]=\mathbb E[X\mathbf 1_A]\)를 만족한다. 조건부기댓값의 유일성에 의해
$$\mathbb E[X\mid\mathcal G]=c=\mathbb E[X]$$almost surely이다. \(\square\)
A.5 Filtration, Martingale, 효율가격
시간에 따라 증가하는 \(\sigma\)-algebra족 \((\mathcal{F}_t)_{t \ge 0}\)가 \(\mathcal{F}_s \subseteq \mathcal{F}_t\) (\(s \le t\))를 만족하면 filtration이라 한다. 시장미시구조에서 \(\mathcal{F}_t\)는 시점 \(t\)까지 관측한 buy/sell 주문 시퀀스와 체결 기록 전체를 포함하는 정보 집합이다. 확률과정 \(X_t\)가 모든 \(t\)에 대해 \(\mathcal{F}_t\)-가측이면 adapted(적응)라 한다.
적분가능하고 adapted인 과정 \((M_t)\)가 임의의 \(s \le t\)에 대해
$$\mathbb{E}[M_t \mid \mathcal{F}_s] = M_s$$를 만족하면 \((\mathcal{F}_t)\)-martingale이라 한다. 현재 정보로 볼 때 미래의 평균은 현재값과 같다는 의미, 즉 "공정한 게임"이다.
이 정리 A.5.3에서 쓰는 기본 객체와 가정부터 분명히 적는다. 마팅게일은 현재 정보 \(\mathcal F_s\)까지 알고 있을 때 미래의 조건부기댓값이 현재값과 정확히 일치하는 과정이다. 즉 \((M_t)\)가 마팅게일이라는 말은 \(\mathbb E[M_t\mid\mathcal F_s]=M_s\)가 모든 \(s\le t\)에 대해 성립한다는 뜻이다. 효율가격 \(\mu_t=\mathbb E[v\mid\mathcal F_t]\)는 바로 이 정의를 만족하는 전형적인 예다.
자산의 최종 fundamental value를 \(v\)라 하고 효율가격을 \(p_t := \mathbb{E}[v \mid \mathcal{F}_t]\)로 정의하면 \((p_t)\)는 \((\mathcal{F}_t)\)-martingale이다.
가정을 다시 적으면 자산의 최종 fundamental value를 \(v\)라 하고 효율가격을 \(p_t := \mathbb{E}[v \mid \mathcal{F}_t]\)로 정의하면 \((p_t)\)는 \((\mathcal{F}_t)\)-martingale이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
정의에 의해 효율가격은 \(\mu_t=\mathbb E[v\mid\mathcal F_t]\)이다. 먼저 \(\mu_t\)는 조건부기댓값이므로 \(\mathcal F_t\)-가측이고, \(v\in L^1\)이면 \(\mu_t\in L^1\)이다. 따라서 마팅게일 정의에서 요구하는 적응성과 적분가능성은 충족된다.
이제 \(s\le t\)를 고정한다. tower property를 한 번 그대로 적용하면
$$\mathbb E[\mu_t\mid\mathcal F_s]=\mathbb E\bigl[\mathbb E[v\mid\mathcal F_t]\mid\mathcal F_s\bigr]=\mathbb E[v\mid\mathcal F_s]=\mu_s.$$마지막 등식은 다시 효율가격의 정의다. 따라서 모든 \(s\le t\)에 대해 \(\mathbb E[\mu_t\mid\mathcal F_s]=\mu_s\)이고, \((\mu_t)\)는 \((\mathcal F_t)\)-마팅게일이다. \(\square\)
효율가격이 martingale이라는 사실은 가격변화가 "예측 가능한 드리프트"로부터가 아니라 "새로운 정보의 유입"으로 발생한다는 뜻이다. 매수 주문이 오면 \(v\)에 대한 posterior belief가 갱신되고, 이 belief 갱신이 그대로 가격변화다.
A.6 브라운 운동과 Itô 보조정리 (가격 동학의 기초)
연속 과정 \((W_t)\)가 (i) \(W_0 = 0\), (ii) 독립 증분, (iii) \(W_t - W_s \sim N(0, t-s)\) for \(s < t\)를 만족하면 표준 브라운 운동이라 한다.
브라운 운동의 이차변동(quadratic variation)은 \([W,W]_T = T\)이다. 미분 형식으로는
$$(dW_t)^2 = dt, \qquad dW_t \cdot dt = 0, \qquad (dt)^2 = 0.$$이것이 보통 미적분과 확률미적분을 가르는 핵심이다. 확률과정의 증가분이 \(\sqrt{\delta t}\) 크기이므로 그 제곱은 \(\delta t\)와 같은 크기가 되어 사라지지 않는다.
\(dX_t = m(X_t,t)\,dt + s(X_t,t)\,dW_t\)를 따를 때, \(C^{1,2}\) 함수 \(V(X_t, t)\)에 대해
$$dV = \left(\frac{\partial V}{\partial t} + \frac{\partial V}{\partial x} m + \frac{1}{2}\frac{\partial^2 V}{\partial x^2} s^2\right)dt + \frac{\partial V}{\partial x} s\,dW_t.$$보통 체인룰 대비 \(\frac{1}{2}V_{xx}s^2\,dt\)라는 Itô 수정항이 추가된다. 이 항은 확률적 흔들림이 가격함수의 비선형성과 결합하여 평균 방향에 영향을 미치기 때문에 생긴다.
A.7 경쟁적 Pricing과 Zero-Profit 조건
이 정리 A.7.1에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리에서 숨은 상태는 자산의 근본가치 \(v\), 관측되는 신호는 매수사건 \(B\) 또는 매도사건 \(S\)다. 경쟁적인 시장조성자는 거래 상대방에게 기대이윤을 남기지 않는 zero-profit 호가를 제시하므로 ask와 bid는 각각 \(\mathbb E[v\mid B]\), \(\mathbb E[v\mid S]\) 또는 여기에 재고비용 조정항을 더한 값으로 결정된다. posterior \(\mu_B,\mu_S\)는 주문방향을 본 뒤 \(V_H\)가 실현되었을 확률이다.
위험중립이고 경쟁적인 MM의 zero-profit 조건으로부터
$$a = \mathbb{E}[v \mid B], \qquad b = \mathbb{E}[v \mid S].$$가정을 다시 적으면 위험중립이고 경쟁적인 MM의 zero-profit 조건으로부터 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
Ask 유도: buy order \(B\)가 오면 MM은 1주를 \(a\)에 판다. 이익은 \(\Pi_a = a - v\). Zero-profit 조건 \(\mathbb{E}[\Pi_a \mid B] = 0\)에서 \(\mathbb{E}[a - v \mid B] = 0\). \(a\)는 buy가 오기 전에 정해진 상수이므로 Pulling out known factors에 의해 \(a - \mathbb{E}[v \mid B] = 0\). Bid는 동일한 방식. \(\square\)
마지막으로 위 계산은 가정에서 요구한 모든 조건을 정확히 사용했고, 따라서 정리의 결론이 그대로 따라온다.
주문 자체가 정보이며, 가격은 그 주문이 드러내는 정보를 반영한 posterior expectation이다. 이 두 식이 §2.2와 §2.3을 하나의 논리적 사슬로 연결하는 기둥이다.
A.8 재고비용과 Inventory-Adjusted Quote
MM의 보유 주식 수를 \(q\)라 하자. 가장 자주 쓰는 재고비용 형태는
$$C(q) = \frac{\kappa}{2} q^2, \qquad \kappa > 0.$$이것은 단순한 감각적 근사가 아니다. MM이 CARA 효용 \(U(w) = -e^{-\gamma w}\)를 가지고 재고 \(q\)를 들고 있을 때, 가격변화 \(\Delta P \sim N(0, \sigma^2)\)에 대한 certainty equivalent 보상 요구액을 \(\pi(q)\)로 두면, 무차별 조건 \(-e^{-\gamma\pi} \cdot \mathbb{E}[e^{-\gamma q \Delta P}] = -1\)에서 정규분포의 mgf \(\mathbb{E}[e^{-\gamma q \Delta P}] = e^{\gamma^2 q^2 \sigma^2 / 2}\)를 이용하면
$$\pi(q) = \frac{\gamma}{2}q^2\sigma^2.$$따라서 \(\kappa = \gamma\sigma^2\)로 볼 수 있다. 재고가 두 배면 비용은 네 배, 위험회피계수 \(\gamma\)가 클수록, 변동성 \(\sigma\)가 클수록 재고가 더 비싸다.
이 정리 A.8.2에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리들에서는 midprice로부터의 거리 \(\delta\) 또는 inventory \(q\)가 통제변수다. \(\delta\)를 키우면 건당 마진은 커지지만 체결확률은 감소한다. \(q\)가 커지면 다음 거래에서 추가로 떠안게 되거나 줄일 재고에 대한 한계비용이 바뀐다. 따라서 최적 호가는 기대수익과 체결강도, 그리고 inventory cost의 한계차이를 동시에 반영한다.
현재 midprice \(m\), inventory \(q\)일 때
$$a(q) = m + C(q-1) - C(q), \qquad b(q) = m + C(q) - C(q+1).$$가정을 다시 적으면 현재 midprice \(m\), inventory \(q\)일 때 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
ask에서 1주를 판매하면 inventory가 \(q\)에서 \(q-1\)로 줄어든다. 총가치 무차별 조건 \(W + a(q) + m(q-1) - C(q-1) = W + mq - C(q)\)에서 \(a(q) = m + C(q-1) - C(q)\). \(\square\)
\(C(q) = \frac{\kappa}{2}q^2\)이면
$$a(q) = m - \kappa q + \frac{\kappa}{2}, \qquad b(q) = m - \kappa q - \frac{\kappa}{2}, \qquad a(q) - b(q) = \kappa.$$\(a(q) = m + \frac{\kappa}{2}(q-1)^2 - \frac{\kappa}{2}q^2 = m + \frac{\kappa}{2}(-2q+1) = m - \kappa q + \frac{\kappa}{2}\). \(\square\)
재고가 있으면 mid quote 자체를 \(-\kappa q\)만큼 이동시킨다. \(q > 0\)(재고 과다)이면 quotes를 낮추어 매도를 촉진하고, \(q < 0\)(재고 부족)이면 quotes를 높여 매수를 유도한다.
A.9 Poisson 도착 과정
확률변수 \(N_t\)가 파라미터 \(\lambda t\)의 Poisson 분포를 따르면
$$P(N_t = n) = e^{-\lambda t} \frac{(\lambda t)^n}{n!}, \quad n = 0, 1, 2, \ldots$$\(\lambda\)는 단위 시간당 평균 도착 건수다. 짧은 시간에 드물게, 독립적으로 발생하는 주문 도착을 모형화하는 가장 단순한 방법이다.
이 정리 A.9.2에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리들에서는 midprice로부터의 거리 \(\delta\) 또는 inventory \(q\)가 통제변수다. \(\delta\)를 키우면 건당 마진은 커지지만 체결확률은 감소한다. \(q\)가 커지면 다음 거래에서 추가로 떠안게 되거나 줄일 재고에 대한 한계비용이 바뀐다. 따라서 최적 호가는 기대수익과 체결강도, 그리고 inventory cost의 한계차이를 동시에 반영한다.
강도 \(\lambda\)의 Poisson arrival에서 시간 \(\Delta t\) 동안 적어도 한 번 도착할 확률은 \(1 - e^{-\lambda \Delta t}\)이며, \(\Delta t \to 0\)이면
$$1 - e^{-\lambda \Delta t} = \lambda \Delta t + o(\Delta t).$$가정을 다시 적으면 강도 \(\lambda\)의 Poisson arrival에서 시간 \(\Delta t\) 동안 적어도 한 번 도착할 확률은 \(1 - e^{-\lambda \Delta t}\)이며, \(\Delta t \to 0\)이면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
강도 \(\lambda\)의 포아송과정 \(N_t\)에서 길이 \(\Delta t\) 구간의 증가분은 평균 \(\lambda\Delta t\)를 갖는 포아송 분포를 따른다. 따라서 적어도 한 번 도착할 확률은
$$\mathbb P(\Delta N_t\ge 1)=1-\mathbb P(\Delta N_t=0)=1-e^{-\lambda\Delta t}.$$이제 지수함수의 Taylor 전개를 쓴다.
$$e^{-\lambda\Delta t}=1-\lambda\Delta t+\frac{(\lambda\Delta t)^2}{2}-\frac{(\lambda\Delta t)^3}{6}+\cdots$$따라서
$$1-e^{-\lambda\Delta t}=\lambda\Delta t-\frac{(\lambda\Delta t)^2}{2}+O((\Delta t)^3)=\lambda\Delta t+O((\Delta t)^2).$$같은 방식으로 정확히 한 번 도착할 확률은
$$\mathbb P(\Delta N_t=1)=e^{-\lambda\Delta t}(\lambda\Delta t)=\lambda\Delta t+O((\Delta t)^2),$$두 번 이상 도착할 확률은
$$\mathbb P(\Delta N_t\ge 2)=1-\mathbb P(\Delta N_t=0)-\mathbb P(\Delta N_t=1)=O((\Delta t)^2).$$즉 아주 짧은 시간에는 한 번 도착할 확률이 1차항 \(\lambda\Delta t\)를 지배하고, 두 번 이상 도착은 2차 미소량이다. \(\square\)
A.10 가우시안 선형 신호 모형 — Kyle 모형의 핵심 수학
AHFT §2.2의 정보우위 거래 모형을 이해하기 위한 직접 준비다. MM이 총 order flow를 보고 value에 대한 belief를 갱신하는 수학이 정확히 이 구조다.
\(V \sim N(\mu, \sigma_v^2)\), \(U \sim N(0, \sigma_u^2)\), \(U \perp V\). 관측 신호 \(Y = aV + U\). MM은 \(Y\)를 보고 \(V\)를 추정한다.
이 정리 A.10.1에서 쓰는 기본 객체와 가정부터 분명히 적는다. 여기서 신호모형은 \(Y=a(V-\mu)+U\)처럼 선형-가우시안 구조를 가진다. \(V\sim N(\mu,\sigma_V^2)\), \(U\sim N(0,\sigma_U^2)\)가 독립이면 posterior mean \(\mathbb E[V\mid Y]\)는 다시 \(Y\)의 선형함수가 된다. 이것이 Kyle 모형과 선형 가격규칙의 수학적 기반이다.
가정을 다시 적으면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
첫째. 선형투영. \(\mathbb{E}[V \mid Y] = \alpha + \beta Y\)로 두고 직교 조건을 맞춘다. \(\mathbb{E}[\text{error}] = 0\)에서 \(\alpha = \mu - \beta a\mu\). 공분산 직교 조건 \(\operatorname{Cov}(V, Y) = \beta \operatorname{Var}(Y)\)에서
$$\operatorname{Cov}(V, Y) = a\sigma_v^2, \quad \operatorname{Var}(Y) = a^2\sigma_v^2 + \sigma_u^2.$$따라서 \(\beta = \frac{a\sigma_v^2}{a^2\sigma_v^2 + \sigma_u^2}\).
둘째. 완전제곱. 사후밀도 \(f_{V|Y}(v \mid y) \propto \exp\!\left(-\frac{(y-av)^2}{2\sigma_u^2}\right)\exp\!\left(-\frac{(v-\mu)^2}{2\sigma_v^2}\right)\). 지수부를 \(v\)에 대한 이차식으로 정리하면
$$A = \frac{a^2}{\sigma_u^2} + \frac{1}{\sigma_v^2}, \quad B = \frac{ay}{\sigma_u^2} + \frac{\mu}{\sigma_v^2}.$$완전제곱하면 posterior는 평균 \(B/A\), 분산 \(1/A\)인 정규분포다.
$$\mathbb{E}[V \mid Y=y] = \frac{B}{A} = \mu + \frac{a\sigma_v^2}{a^2\sigma_v^2+\sigma_u^2}(y - a\mu), \quad \operatorname{Var}(V \mid Y) = \frac{\sigma_v^2\sigma_u^2}{a^2\sigma_v^2+\sigma_u^2}.\ \square$$\(\sigma_u^2\)가 크면 신호 노이즈가 커서 learning이 약하다. \(\sigma_v^2\)가 크면 prior uncertainty가 커서 order flow 신호가 상대적으로 중요해진다. \(a\)가 크면 value가 order flow에 더 강하게 반영되어 관측력이 높아진다. AHFT §2.2의 "MMs infer value from net order flow"는 정확히 이 구조다.
A.11 수렴정리와 균등적분가능성
Chapter 2 자체는 정태적 미시구조 모형이 중심이지만, 이 장에서 도입된 효율가격, 조건부기댓값, posterior mean, martingale이라는 언어는 뒤 장에서 연속시간 가격과 측도변환으로 곧바로 이어진다. 그때 가장 자주 부딪히는 문제는 “극한과 기댓값을 바꿔도 되는가”이다. 이 절은 그 문제를 통제하는 수렴정리와, 그 정리들을 실제 금융수학에서 작동시키는 균등적분가능성을 정리한다.
이 정리 A.11.1에서 쓰는 기본 객체와 가정부터 분명히 적는다. 수렴정리에서는 비음수성, 지배가능성, 그리고 균등적분가능성이 핵심 가정이다. 비음수열은 단조수렴정리와 Fatou 보조정리의 영역이고, 적분가능한 지배함수 \(Y\)가 존재하면 지배수렴정리를 사용할 수 있다. 균등적분가능성은 큰 값 꼬리의 질량이 지수열 전체에 대해 한꺼번에 작아진다는 조건이며, 확률수렴을 \(L^1\) 수렴으로 올릴 때 결정적이다.
\(0 \le X_n \uparrow X\) almost surely 이면
$$\lim_{n\to\infty}\mathbb{E}[X_n] = \mathbb{E}[X].$$가정을 다시 적으면 \(0 \le X_n \uparrow X\) almost surely 이면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(Y_n := X - X_n \ge 0\)라 두면 \(Y_n \downarrow 0\) almost surely 이다. 먼저 단순함수 정의를 사용하여 음이 아닌 확률변수의 적분은 상향 단순함수 근사로 정의되므로, \(X_n \le X\)에서 \(\mathbb{E}[X_n] \le \mathbb{E}[X]\)가 성립한다. 따라서 \(\ell := \lim_n \mathbb{E}[X_n]\)은 존재하고 \(\ell \le \mathbb{E}[X]\)이다.
이제 임의의 단순함수 \(0\le \varphi \le X\)를 잡자. \(\varphi = \sum_{k=1}^m a_k 1_{A_k}\)라 쓰고 \(B_{n,k}:=A_k\cap\{X_n\ge a_k\}\)라 두면 \(B_{n,k}\uparrow A_k\)이다. 그러므로 \(\varphi_n:=\sum_{k=1}^m a_k 1_{B_{n,k}}\)는 \(\varphi_n\le X_n\), \(\varphi_n\uparrow \varphi\)를 만족한다. 단순함수 적분의 연속성으로 \(\mathbb{E}[\varphi_n]\uparrow \mathbb{E}[\varphi]\). 따라서 \(\mathbb{E}[\varphi]\le \sup_n \mathbb{E}[X_n]=\ell\).
\(\mathbb{E}[X]\)는 \(X\) 아래의 단순함수 적분값들의 상한이므로 \(\mathbb{E}[X]\le \ell\). 앞에서 \(\ell\le \mathbb{E}[X]\)를 얻었으므로 \(\ell=\mathbb{E}[X]\). \(\square\)
이 정리 A.11.2에서 쓰는 기본 객체와 가정부터 분명히 적는다. 수렴정리에서는 비음수성, 지배가능성, 그리고 균등적분가능성이 핵심 가정이다. 비음수열은 단조수렴정리와 Fatou 보조정리의 영역이고, 적분가능한 지배함수 \(Y\)가 존재하면 지배수렴정리를 사용할 수 있다. 균등적분가능성은 큰 값 꼬리의 질량이 지수열 전체에 대해 한꺼번에 작아진다는 조건이며, 확률수렴을 \(L^1\) 수렴으로 올릴 때 결정적이다.
음이 아닌 확률변수열 \(X_n\ge 0\)에 대하여
$$\mathbb{E}[\liminf_{n\to\infty} X_n] \le \liminf_{n\to\infty}\mathbb{E}[X_n].$$가정을 다시 적으면 음이 아닌 확률변수열 \(X_n\ge 0\)에 대하여 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(Y_n := \inf_{m\ge n}X_m\)라 두면 \(Y_n\uparrow \liminf_n X_n\), 또한 \(Y_n\le X_m\) for all \(m\ge n\). MCT로
$$\mathbb{E}[\liminf X_n]=\lim_{n\to\infty}\mathbb{E}[Y_n].$$한편 각 \(n\)에 대해 \(\mathbb{E}[Y_n]\le \inf_{m\ge n}\mathbb{E}[X_m]\). 양변에 \(n\to\infty\)를 보내면
$$\mathbb{E}[\liminf X_n]\le \lim_{n\to\infty}\inf_{m\ge n}\mathbb{E}[X_m]=\liminf_{n\to\infty}\mathbb{E}[X_n].\qquad \square$$이 정리 A.11.3에서 쓰는 기본 객체와 가정부터 분명히 적는다. 수렴정리에서는 비음수성, 지배가능성, 그리고 균등적분가능성이 핵심 가정이다. 비음수열은 단조수렴정리와 Fatou 보조정리의 영역이고, 적분가능한 지배함수 \(Y\)가 존재하면 지배수렴정리를 사용할 수 있다. 균등적분가능성은 큰 값 꼬리의 질량이 지수열 전체에 대해 한꺼번에 작아진다는 조건이며, 확률수렴을 \(L^1\) 수렴으로 올릴 때 결정적이다.
\(X_n\to X\) almost surely 이고 \(|X_n|\le Y\) a.s. for all \(n\), \(\mathbb{E}[Y]<\infty\)이면
$$\lim_{n\to\infty}\mathbb{E}[|X_n-X|]=0,\qquad \lim_{n\to\infty}\mathbb{E}[X_n]=\mathbb{E}[X].$$가정을 다시 적으면 \(X_n\to X\) almost surely 이고 \(|X_n|\le Y\) a.s. for all \(n\), \(\mathbb{E}[Y]<\infty\)이면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(Z_n:=2Y-|X_n-X|\ge 0\). \(X_n\to X\)에서 \(|X_n-X|\to 0\)이므로 \(Z_n\to 2Y\) almost surely. Fatou를 \(Z_n\)에 적용하면
$$\mathbb{E}[2Y]\le \liminf_{n\to\infty}\mathbb{E}[2Y-|X_n-X|] = 2\mathbb{E}[Y]-\limsup_{n\to\infty}\mathbb{E}[|X_n-X|].$$따라서 \(\limsup_n \mathbb{E}[|X_n-X|]\le 0\), 즉 \(\mathbb{E}[|X_n-X|]\to 0\). 마지막 등식은
$$|\mathbb{E}[X_n]-\mathbb{E}[X]|\le \mathbb{E}[|X_n-X|]\to 0$$로부터 즉시 따른다. \(\square\)
확률변수들의 족 \(\mathcal{X}\subset L^1\)가 균등적분가능하다는 것은
$$\lim_{K\to\infty}\sup_{X\in\mathcal{X}} \mathbb{E}\!\left[|X|1_{\{|X|>K\}}\right]=0$$를 만족하는 것을 말한다. 직관적으로는 “꼬리 부분의 질량이 집합 전체에서 균일하게 작다”는 뜻이다.
이 보조정리 A.11.5에서 쓰는 기본 객체와 가정부터 분명히 적는다. 수렴정리에서는 비음수성, 지배가능성, 그리고 균등적분가능성이 핵심 가정이다. 비음수열은 단조수렴정리와 Fatou 보조정리의 영역이고, 적분가능한 지배함수 \(Y\)가 존재하면 지배수렴정리를 사용할 수 있다. 균등적분가능성은 큰 값 꼬리의 질량이 지수열 전체에 대해 한꺼번에 작아진다는 조건이며, 확률수렴을 \(L^1\) 수렴으로 올릴 때 결정적이다.
\(X\in L^1\)이면 임의의 \(\varepsilon>0\)에 대해 어떤 \(\delta>0\)가 존재하여 \(P(A)<\delta\)인 모든 사건 \(A\)에 대하여
$$\mathbb{E}[|X|1_A] < \varepsilon.$$가정을 다시 적으면 \(X\in L^1\)이면 임의의 \(\varepsilon>0\)에 대해 어떤 \(\delta>0\)가 존재하여 \(P(A)<\delta\)인 모든 사건 \(A\)에 대하여 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(K>0\)를 택해 \(\mathbb{E}[|X|1_{\{|X|>K\}}]<\varepsilon/2\)가 되게 한다. 그런 다음 \(\delta:=\varepsilon/(2K)\)로 두면 \(P(A)<\delta\)인 모든 \(A\)에 대해
$$\mathbb{E}[|X|1_A] = \mathbb{E}[|X|1_{A\cap\{|X|\le K\}}]+\mathbb{E}[|X|1_{A\cap\{|X|>K\}}] \le KP(A)+\varepsilon/2 < \varepsilon.\qquad \square$$이 정리 A.11.6에서 쓰는 기본 객체와 가정부터 분명히 적는다. 수렴정리에서는 비음수성, 지배가능성, 그리고 균등적분가능성이 핵심 가정이다. 비음수열은 단조수렴정리와 Fatou 보조정리의 영역이고, 적분가능한 지배함수 \(Y\)가 존재하면 지배수렴정리를 사용할 수 있다. 균등적분가능성은 큰 값 꼬리의 질량이 지수열 전체에 대해 한꺼번에 작아진다는 조건이며, 확률수렴을 \(L^1\) 수렴으로 올릴 때 결정적이다.
\(X_n\to X\) in probability 이고 \(\{X_n\}_{n\ge1}\cup\{X\}\)가 균등적분가능하면 \(X_n\to X\) in \(L^1\), 즉
$$\mathbb{E}[|X_n-X|]\to 0.$$가정을 다시 적으면 \(X_n\to X\) in probability 이고 \(\{X_n\}_{n\ge1}\cup\{X\}\)가 균등적분가능하면 \(X_n\to X\) in \(L^1\), 즉 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(Y_n:=|X_n-X|\)라 두자. \(\{Y_n\}\) 역시 균등적분가능하다. 실제로 \(|X_n-X|\le |X_n|+|X|\)이므로
$$\mathbb{E}[Y_n1_{\{Y_n>K\}}]\le \mathbb{E}[|X_n|1_{\{|X_n|>K/2\}}]+\mathbb{E}[|X|1_{\{|X|>K/2\}}].$$우변의 supremum이 \(K\to\infty\)에서 0으로 가므로 UI가 성립한다.
이제 \(\varepsilon>0\)를 고정한다. UI에 의해 어떤 \(K\)가 존재해 \(\sup_n \mathbb{E}[Y_n1_{\{Y_n>K\}}]<\varepsilon/2\). 또 \(Y_n\to 0\) in probability 이므로 bounded convergence를 \(\min(Y_n,K)\)에 적용할 수 있다: \(\min(Y_n,K)\le K\)이고 \(\min(Y_n,K)\to 0\) in probability, subsequence 원리로 almost sure 수렴하는 부분수열마다 DCT가 적용되어 기대값이 0으로 간다. 따라서 전체 수열에 대해서도 \(\mathbb{E}[\min(Y_n,K)]\to0\).
결국
$$\mathbb{E}[Y_n]=\mathbb{E}[\min(Y_n,K)] + \mathbb{E}[Y_n1_{\{Y_n>K\}}] < \varepsilon$$가 \(n\) sufficiently large에서 성립한다. \(\square\)
A.12 정지시간, 멈춘 과정, 임의정지정리
효율가격이 martingale이라는 말은 “현재 정보로 본 미래 기대가격이 현재가격과 같다”는 뜻이다. 그렇다면 거래자가 임의의 규칙 \(\tau\)에 따라 중간에 멈추어도 그 공정성이 남아 있는가? 이 질문에 답하는 정리가 Optional Stopping Theorem이다.
\(\tau:\Omega\to\{0,1,2,\dots\}\cup\{\infty\}\)가 모든 \(n\)에 대해 \(\{\tau\le n\}\in\mathcal{F}_n\)를 만족하면 \(\tau\)를 stopping time이라 한다. 멈춘 과정은
$$X_n^\tau := X_{n\wedge \tau}$$로 정의한다.
이 보조정리 A.12.2에서 쓰는 기본 객체와 가정부터 분명히 적는다. 정지시간 \(\tau\)는 시점 \(n\)까지의 정보만으로 사건 \(\{\tau\le n\}\)의 참거짓을 판별할 수 있는 확률변수다. 멈춘 과정은 \(X_{n\wedge\tau}\)로 정의한다. Optional Stopping 정리는 적절한 적분가능성이나 균등적분가능성 아래에서 멈춘 뒤에도 마팅게일의 공정성이 유지된다는 명제다.
\(\tau\wedge n\)은 정지시간이다.
가정을 다시 적으면 \(\tau\wedge n\)은 정지시간이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
임의의 \(m\)에 대해
$$\{\tau\wedge n\le m\}= \begin{cases} \Omega,& m\ge n,\\ \{\tau\le m\},& m<n. \end{cases}$$두 경우 모두 \(\mathcal{F}_m\)에 속한다. \(\square\)
마지막으로 위 계산은 가정에서 요구한 모든 조건을 정확히 사용했고, 따라서 정리의 결론이 그대로 따라온다.
이 정리 A.12.3에서 쓰는 기본 객체와 가정부터 분명히 적는다. 멈춘 과정은 \(M_n^\tau:=M_{n\wedge\tau}\)로 정의한다. 이 정리는 원래 과정 \((M_n)\)이 마팅게일이면, 정지시간 \(\tau\)에서 잘라 멈춘 과정도 같은 filtration에 대해 다시 마팅게일이 된다고 말한다. 즉 공정한 게임을 중간에 멈춘다고 해서 공정성이 깨지지 않는다.
\(M_n\)이 \((\mathcal{F}_n)\)-martingale이고 \(\tau\)가 stopping time이면 \(M_{n\wedge\tau}\)도 martingale이다.
가정을 다시 적으면 \(M_n\)이 \((\mathcal{F}_n)\)-martingale이고 \(\tau\)가 stopping time이면 \(M_{n\wedge\tau}\)도 martingale이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
적응성은 자명하다. 적분가능성도 \(\mathbb{E}|M_{n\wedge\tau}|\le \sum_{k=0}^n \mathbb{E}[|M_k|1_{\{\tau=k\}}]+\mathbb{E}[|M_n|1_{\{\tau>n\}}]<\infty\). 이제 조건부기댓값을 계산하면
$$M_{(n+1)\wedge\tau}=M_{n+1}1_{\{\tau>n\}}+M_\tau 1_{\{\tau\le n\}}.$$\(\{\tau\le n\}\in\mathcal{F}_n\), \(\{\tau>n\}\in\mathcal{F}_n\)이므로
$$\mathbb{E}[M_{(n+1)\wedge\tau}\mid\mathcal{F}_n] =1_{\{\tau>n\}}\mathbb{E}[M_{n+1}\mid\mathcal{F}_n]+1_{\{\tau\le n\}}M_\tau =1_{\{\tau>n\}}M_n+1_{\{\tau\le n\}}M_\tau =M_{n\wedge\tau}. \quad \square$$이 정리 A.12.4에서 쓰는 기본 객체와 가정부터 분명히 적는다. Optional Stopping 정리는 마팅게일을 정지시간에서 멈추어도 기대값이 보존된다는 명제다. bounded version에서는 \(\tau\le N\) a.s.라는 상계가 있어 기술적 문제가 가장 적다. 따라서 먼저 잘린 과정이 마팅게일이라는 사실을 이용해 유한 단계에서 기대값 보존을 보인 뒤 \(N\)까지 밀어붙인다.
\(M_n\)이 martingale이고 \(\tau\le N\) a.s.인 stopping time이면
$$\mathbb{E}[M_\tau]=\mathbb{E}[M_0].$$가정을 다시 적으면 \(M_n\)이 martingale이고 \(\tau\le N\) a.s.인 stopping time이면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(\tau\le N\) a.s.라고 하자. 정리 A.12.3에 의해 멈춘 과정 \(M_{n\wedge\tau}\)는 다시 마팅게일이다. 따라서 모든 \(n\)에 대해
$$\mathbb E[M_{n\wedge\tau}]=\mathbb E[M_0].$$이제 \(n=N\)을 대입하면 \(\tau\le N\) a.s.이므로 \(N\wedge\tau=\tau\) almost surely이다. 따라서
$$\mathbb E[M_\tau]=\mathbb E[M_{N\wedge\tau}]=\mathbb E[M_0].$$조금 더 일반적으로 임의의 \(m\le n\)에 대해 멈춘 과정의 마팅게일 성질은
$$\mathbb E[M_{n\wedge\tau}\mid\mathcal F_m]=M_{m\wedge\tau}$$를 준다. 여기에 다시 \(n=N\)을 넣으면
$$\mathbb E[M_\tau\mid\mathcal F_m]=M_{m\wedge\tau}.$$즉 bounded stopping time 아래에서 멈춘 값도 원래 공정성 구조를 유지한다. 특히 기대값 수준에서는 \(\mathbb E[M_\tau]=\mathbb E[M_0]\)가 성립한다. \(\square\)
이 정리 A.12.5에서 쓰는 기본 객체와 가정부터 분명히 적는다. 여기서는 bounded 가정을 버리고 대신 균등적분가능성(UI)을 넣는다. UI는 멈춘 뒤 생길 수 있는 꼬리질량을 제어해 \(M_{\tau\wedge n}\to M_\tau\)를 \(L^1\)로 끌어올리는 역할을 한다. 따라서 bounded stopping time 버전을 근사적으로 적용한 뒤 극한을 취할 수 있다.
\(M_n\)이 martingale, \(\tau\)가 stopping time, 그리고 \(\{M_{n\wedge\tau}\}_{n\ge0}\)가 균등적분가능하면
$$\mathbb{E}[M_\tau]=\mathbb{E}[M_0].$$가정을 다시 적으면 \(M_n\)이 martingale, \(\tau\)가 stopping time, 그리고 \(\{M_{n\wedge\tau}\}_{n\ge0}\)가 균등적분가능하면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
먼저 잘린 정지시간 \(\tau_n:=\tau\wedge n\)을 정의하자. 보조정리 A.12.2에 의해 각 \(\tau_n\)은 bounded stopping time이다. 따라서 방금 앞의 정리 A.12.4를 \(\tau_n\)에 적용하면
$$\mathbb E[M_{\tau_n}]=\mathbb E[M_0]\qquad\text{for every }n.$$이제 \(n\to\infty\)를 보낸다. \(\tau_n\uparrow\tau\)이므로 almost surely \(M_{\tau_n}\to M_\tau\)이다. 문제는 기대값의 극한교환인데, 바로 여기서 UI가 쓰인다. 가정상 \((M_n)\)이 균등적분가능이면 그 stopped family \((M_{\tau_n})\)도 균등적분가능하다. 실제로 \(|M_{\tau_n}|\)는 \(\{M_k:k\ge0\}\)의 원소들 중 하나를 취한 것이므로 꼬리질량이 같은 방식으로 통제된다.
균등적분가능성과 almost sure 수렴을 합치면 Vitali 정리로
$$M_{\tau_n}\to M_\tau \quad \text{in }L^1.$$따라서 기대값을 극한 안으로 넣을 수 있어
$$\mathbb E[M_\tau]=\lim_{n\to\infty}\mathbb E[M_{\tau_n}]=\mathbb E[M_0].$$즉 bounded 가정이 없어도 UI만 있으면 optional stopping의 기대값 보존이 유지된다. \(\square\)
A.13 라돈–니코딤 정리와 밀도과정
조건부기댓값이 “확률변수를 \(\sigma\)-대수 위에 직교사영한 것”이라면, 라돈–니코딤 정리는 “한 측도를 다른 측도에 대한 밀도로 표현하는 것”이다. 위험중립측도, change of numeraire, Bayes 공식은 전부 이 정리 위에 서 있다.
이 보조정리 A.13.1에서 쓰는 기본 객체와 가정부터 분명히 적는다. 측도변환에서는 두 측도 \( u,\mu\)의 절대연속성 \( u\ll\mu\)와 밀도 \(d u/d\mu\)가 기본 객체다. 절대연속성은 \(\mu\)-영집합이 항상 \( u\)-영집합이라는 뜻이고, 라돈–니코딤 정리는 이 관계를 적분밀도로 표현할 수 있게 해 준다. 확률측도 \(Q\)가 \(P\)에 절대연속이면 밀도과정 \(Z_t=\mathbb E_P[dQ/dP\mid\mathcal F_t]\)가 생기고, change of numeraire는 적절한 거래가능 자산의 할인가격을 바로 그 밀도과정으로 사용한다.
유한 signed measure \(\eta\)에 대해 \(\Omega=P\cup N\), \(P\cap N=\varnothing\) 이고, \(A\subset P\)이면 \(\eta(A)\ge0\), \(B\subset N\)이면 \(\eta(B)\le0\)가 되도록 하는 measurable sets \(P,N\)가 존재한다.
가정을 다시 적으면 유한 signed measure \(\eta\)에 대해 \(\Omega=P\cup N\), \(P\cap N=\varnothing\) 이고, \(A\subset P\)이면 \(\eta(A)\ge0\), \(B\subset N\)이면 \(\eta(B)\le0\)가 되도록 하는 measurable sets \(P,N\)가 존재한다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(\beta:=\sup\{\eta(A):A\in\mathcal{F}\}\)를 두고 \(\eta(A_n)\uparrow \beta\)가 되게 \(A_n\)을 선택한다. \(P:=\cup_n A_n\)라 두면 가법성에서 \(\eta(P)=\beta\). 이제 \(B\subset P\)인데 \(\eta(B)<0\)라고 가정하면 \(P\setminus B\)가 measurable이며 \(\eta(P\setminus B)=\eta(P)-\eta(B)>\beta\), 이는 \(\beta\)의 정의와 모순이다. 따라서 \(P\)의 부분집합은 모두 음이 아닌 질량을 갖는다. \(N:=P^c\)라 두자.
만약 \(C\subset N\)인데 \(\eta(C)>0\)이면 \(P\cup C\)가 measurable이고 \(\eta(P\cup C)=\eta(P)+\eta(C)>\beta\), 다시 모순. 그러므로 \(N\)의 부분집합은 모두 음이 아닌 질량을 가질 수 없고, 모두 \(\le0\)이다. \(\square\)
이 정리 A.13.2에서 쓰는 기본 객체와 가정부터 분명히 적는다. 측도변환에서는 두 측도 \( u,\mu\)의 절대연속성 \( u\ll\mu\)와 밀도 \(d u/d\mu\)가 기본 객체다. 절대연속성은 \(\mu\)-영집합이 항상 \( u\)-영집합이라는 뜻이고, 라돈–니코딤 정리는 이 관계를 적분밀도로 표현할 수 있게 해 준다. 확률측도 \(Q\)가 \(P\)에 절대연속이면 밀도과정 \(Z_t=\mathbb E_P[dQ/dP\mid\mathcal F_t]\)가 생기고, change of numeraire는 적절한 거래가능 자산의 할인가격을 바로 그 밀도과정으로 사용한다.
\((\Omega,\mathcal{F})\) 위의 유한 measure \(\nu,\mu\)가 \(\nu\ll\mu\)를 만족하면, 어떤 measurable \(f\ge0\)가 존재하여 모든 \(A\in\mathcal{F}\)에 대해
$$\nu(A)=\int_A f\,d\mu.$$이 \(f\)를 \(f=\frac{d\nu}{d\mu}\)라 쓴다. 또한 \(f\)는 \(\mu\)-a.s. 유일하다.
가정을 다시 적으면 \((\Omega,\mathcal{F})\) 위의 유한 measure \(\nu,\mu\)가 \(\nu\ll\mu\)를 만족하면, 어떤 measurable \(f\ge0\)가 존재하여 모든 \(A\in\mathcal{F}\)에 대해 이 \(f\)를 \(f=\frac{d\nu}{d\mu}\)라 쓴다. 또한 \(f\)는 \(\mu\)-a.s. 유일하다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
집합
$$\mathcal{C}:=\Bigl\{g\ge0\text{ measurable }:\int_A g\,d\mu\le \nu(A)\quad\forall A\in\mathcal{F}\Bigr\}$$를 생각하자. \(0\in\mathcal{C}\)이므로 공집합이 아니다. \(c:=\sup_{g\in\mathcal{C}}\int g\,d\mu\)라 두고, \(\int g_n\,d\mu\uparrow c\)가 되게 \(g_n\in\mathcal{C}\)를 선택한다. \(h_n:=\max(g_1,\dots,g_n)\)라 두면 \(h_n\uparrow h\)이고 \(h_n\in\mathcal{C}\). 실제로 각 \(A\)에 대해 \(A\)를 \(g_k\)가 최대인 부분집합들로 나누면 \(\int_A h_n d\mu\le \nu(A)\)가 성립한다. MCT로 \(\int_A h\,d\mu\le\nu(A)\), 따라서 \(h\in\mathcal{C}\)이며 \(\int h\,d\mu=c\).
이제 remainder signed measure \(\lambda(A):=\nu(A)-\int_A h\,d\mu\)를 정의한다. \(\lambda\)는 유한 signed measure이고, 만약 어떤 measurable \(B\)에 대해 \(\lambda(B)>0\)가 있다면 \(\varepsilon:=\lambda(B)/(2\mu(B))>0\)인 부분집합을 골라 \(h+\varepsilon 1_B\in\mathcal{C}\)가 되게 만들 수 있다. 그러면 \(\int(h+\varepsilon1_B)d\mu > \int h d\mu=c\)가 되어 \(c\)의 최대성에 모순이다. 엄밀히는 \(\lambda-\varepsilon\mu\)에 Hahn 분해를 적용하여 양의 집합 \(B\)를 잡으면 된다. 따라서 \(\lambda(A)\ge0\) for all \(A\). 즉 \(\nu(A)=\int_A h\,d\mu + \lambda(A)\).
그런데 \(\lambda\ll\mu\)이고 \(\lambda(\Omega)\ge0\)이다. 만약 \(\lambda(\Omega)>0\)이면 위와 동일한 증분 논리로 \(h\)를 더 키울 수 있어 모순이다. 따라서 \(\lambda(\Omega)=0\), 그리고 \(\lambda\)의 비음성성 때문에 \(\lambda(A)=0\) for all \(A\). 그러므로 \(\nu(A)=\int_A h\,d\mu\)가 된다.
유일성은 \(f,g\) 둘 다 동일 표현을 만족한다고 하자. \(B:=\{f>g\}\)에 대해
$$0=\nu(B)-\nu(B)=\int_B(f-g)\,d\mu.$$적분함수가 \(B\)에서 양수이므로 \(\mu(B)=0\). \(\{g>f\}\)도 동일하게 0-measure이므로 \(f=g\) \(\mu\)-a.s. \(\square\)
이 정리 A.13.3에서 쓰는 기본 객체와 가정부터 분명히 적는다. 마팅게일은 현재 정보 \(\mathcal F_s\)까지 알고 있을 때 미래의 조건부기댓값이 현재값과 정확히 일치하는 과정이다. 즉 \((M_t)\)가 마팅게일이라는 말은 \(\mathbb E[M_t\mid\mathcal F_s]=M_s\)가 모든 \(s\le t\)에 대해 성립한다는 뜻이다. 효율가격 \(\mu_t=\mathbb E[v\mid\mathcal F_t]\)는 바로 이 정의를 만족하는 전형적인 예다.
확률측도 \(Q\ll P\)이고 \(L:=\frac{dQ}{dP}\in L^1(P)\)라 하자. 각 \(t\)에 대해
$$Z_t := \mathbb{E}_P[L\mid \mathcal{F}_t]$$를 정의하면 \((Z_t)\)는 \(P\)-martingale이며, 모든 \(A\in\mathcal{F}_t\)에 대해
$$Q(A)=\int_A L\,dP=\int_A Z_t\,dP.$$가정을 다시 적으면 확률측도 \(Q\ll P\)이고 \(L:=\frac{dQ}{dP}\in L^1(P)\)라 하자. 각 \(t\)에 대해 를 정의하면 \((Z_t)\)는 \(P\)-martingale이며, 모든 \(A\in\mathcal{F}_t\)에 대해 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(L=dQ/dP\in L^1(P)\)라 두고 \(Z_t=\mathbb E_P[L\mid\mathcal F_t]\)를 정의한다. 조건부기댓값의 일반론에 의해 \(Z_t\)는 \(\mathcal F_t\)-가측이고 \(\mathbb E_P|Z_t|\le \mathbb E_P|L|<\infty\)이므로 적응성과 적분가능성은 성립한다.
이제 \(s\le t\)에 대해 tower property를 적용하면
$$\mathbb E_P[Z_t\mid\mathcal F_s]=\mathbb E_P\bigl[\mathbb E_P[L\mid\mathcal F_t]\mid\mathcal F_s\bigr]=\mathbb E_P[L\mid\mathcal F_s]=Z_s.$$따라서 \((Z_t)\)는 \(P\)-마팅게일이다.
또한 임의의 \(A\in\mathcal F_t\)에 대해 조건부기댓값의 정의를 쓰면
$$\int_A Z_t\,dP=\int_A L\,dP=Q(A).$$즉 시점 \(t\)까지의 모든 사건에 대해 \(Z_t\)는 \(Q\)를 \(P\)에 대해 표현하는 밀도 역할을 한다. 그래서 \(Z_t\)를 시점 \(t\)의 밀도과정이라고 부른다. \(\square\)
이 정리 A.13.4에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리에서 기본 객체는 사건 \(A,B\)와, 경우에 따라 \(\{B_i\}_{i=1}^n\)라는 분할이다. \(\{B_i\}\)가 분할이라는 것은 서로소이고 합집합이 전체공간 \(\Omega\)가 된다는 뜻이다. \(P(A\mid B)\)는 사건 \(B\)가 이미 일어났다는 정보를 반영한 뒤 사건 \(A\)의 확률이고, Bayes 갱신에서는 \(P(A)\)를 사전확률, \(P(B\mid A)\)를 likelihood, \(P(A\mid B)\)를 사후확률로 읽는다.
위와 같은 \(Q,P\)와 \(Z_t\)에 대해, 적분가능한 \(X\)와 \(s\le t\)에서
$$\mathbb{E}_Q[X\mid\mathcal{F}_s] = \frac{1}{Z_s}\,\mathbb{E}_P[Z_t X\mid\mathcal{F}_s],\qquad Q\text{-a.s. on }\{Z_s>0\}.$$가정을 다시 적으면 위와 같은 \(Q,P\)와 \(Z_t\)에 대해, 적분가능한 \(X\)와 \(s\le t\)에서 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
새 측도 \(Q\)가 \(dQ=L\,dP\)로 주어지고, 그 밀도과정이 \(Z_t=\mathbb E_P[L\mid\mathcal F_t]\)라고 하자. 보여야 할 것은
$$\mathbb E_Q[X\mid\mathcal F_s]=\frac{1}{Z_s}\,\mathbb E_P[Z_tX\mid\mathcal F_s]$$라는 식이 \(Q\)-조건부기댓값의 정의를 만족한다는 점이다. 먼저 오른쪽은 \(\mathcal F_s\)-가측이다. 실제로 \(\mathbb E_P[Z_tX\mid\mathcal F_s]\)가 \(\mathcal F_s\)-가측이고 \(Z_s\)도 \(\mathcal F_s\)-가측이기 때문이다.
이제 임의의 \(A\in\mathcal F_s\)를 잡아 적분값을 계산한다. \(dQ= LdP\)와 \(A\in\mathcal F_s\subseteq\mathcal F_t\)를 이용하면
$$\int_A \frac{1}{Z_s}\,\mathbb E_P[Z_tX\mid\mathcal F_s] \,dQ = \int_A \frac{1}{Z_s}\,\mathbb E_P[Z_tX\mid\mathcal F_s] L\,dP.$$그런데 \(A\in\mathcal F_s\) 위에서 \(L\) 대신 \(Z_s=\mathbb E_P[L\mid\mathcal F_s]\)를 써도 적분값이 같다. 따라서
$$\int_A \frac{1}{Z_s}\,\mathbb E_P[Z_tX\mid\mathcal F_s] \,dQ = \int_A \mathbb E_P[Z_tX\mid\mathcal F_s] \,dP = \int_A Z_tX\,dP.$$마지막 등식은 조건부기댓값의 defining property다. 다시 \(A\in\mathcal F_t\)이고 \(Z_t=\mathbb E_P[L\mid\mathcal F_t]\)이므로
$$\int_A Z_tX\,dP = \int_A LX\,dP = \int_A X\,dQ.$$즉 오른쪽은 \(Q\)-조건부기댓값의 두 조건을 만족한다. 따라서 원하는 식이 성립한다. \(\square\)
A.14 뉴메레르와 Change of Numeraire
시장미시구조 장을 공부하다 보면 “효율가격”이 기준이 된다. 연속시간 자산가격론에서는 그 기준 역할을 하는 것이 뉴메레르(numeraire)다. 어떤 자산을 가치의 단위로 택하느냐에 따라 martingale이 되는 측도가 달라진다.
양의 거래가능 자산 \(N_t>0\)를 하나 고정하면, 모든 가격은 \(N_t\) 단위로 표현될 수 있다. 만기 \(T\)에 지급액 \(X_T\)를 주는 계약을 뉴메레르 \(N\)로 할인한 값 \(X_T/N_T\)를 기준으로 가격을 매기는 관점을 change of numeraire라고 한다.
이 정리 A.14.2에서 쓰는 기본 객체와 가정부터 분명히 적는다. 측도변환에서는 두 측도 \( u,\mu\)의 절대연속성 \( u\ll\mu\)와 밀도 \(d u/d\mu\)가 기본 객체다. 절대연속성은 \(\mu\)-영집합이 항상 \( u\)-영집합이라는 뜻이고, 라돈–니코딤 정리는 이 관계를 적분밀도로 표현할 수 있게 해 준다. 확률측도 \(Q\)가 \(P\)에 절대연속이면 밀도과정 \(Z_t=\mathbb E_P[dQ/dP\mid\mathcal F_t]\)가 생기고, change of numeraire는 적절한 거래가능 자산의 할인가격을 바로 그 밀도과정으로 사용한다.
기본 뉴메레르를 은행계좌 \(B_t\)로 하고 그에 대응하는 위험중립측도를 \(Q^B\)라 하자. 다른 양의 거래가능 자산 \(N_t\)에 대해
$$\frac{dQ^N}{dQ^B}\Big|_{\mathcal{F}_t} := \frac{N_t/B_t}{N_0/B_0}$$로 정의하면 \(Q^N\)은 확률측도이며, 모든 거래가능 자산 \(S\)에 대해 \(S_t/N_t\)는 \(Q^N\)-martingale이 된다.
가정을 다시 적으면 기본 뉴메레르를 은행계좌 \(B_t\)로 하고 그에 대응하는 위험중립측도를 \(Q^B\)라 하자. 다른 양의 거래가능 자산 \(N_t\)에 대해 로 정의하면 \(Q^N\)은 확률측도이며, 모든 거래가능 자산 \(S\)에 대해 \(S_t/N_t\)는 \(Q^N\)-martingale이 된다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
위험중립측도 \(Q^B\) 아래에서는 모든 거래가능 자산의 할인가격 \(S_t/B_t\)가 마팅게일이다. 특히 \(N_t/B_t\)도 거래가능 자산의 할인가격이므로
$$M_t:=\frac{N_t/B_t}{N_0/B_0}$$는 양의 \(Q^B\)-마팅게일이고 \(M_0=1\)이다. 따라서 \(\mathbb E^{Q^B}[M_t]=1\)이며, 각 시점 \(t\)에 대해 \(M_t\)를 밀도로 사용하여 새로운 측도 \(Q^N\)를 정의할 수 있다.
이제 임의의 만기지급액 \(X_T\)의 가격을 \(Q^B\)로 쓰면
$$V_t=B_t\,\mathbb E^{Q^B}\!\left[\frac{X_T}{B_T}\Bigm|\mathcal F_t\right].$$여기서 \(X:=X_T/N_T\)를 두고, \(X_T/B_T=(N_T/B_T)X\)라 쓰면
$$V_t=B_t\,\mathbb E^{Q^B}\!\left[M_T\,\frac{N_0}{B_0}\,X\Bigm|\mathcal F_t\right].$$상수 \(N_0/B_0\)를 밖으로 빼고, 측도변환의 Bayes 공식을 적용하면
$$\mathbb E^{Q^B}[M_TX\mid\mathcal F_t]=M_t\,\mathbb E^{Q^N}[X\mid\mathcal F_t].$$따라서
$$V_t=B_t\,\frac{N_0}{B_0}\,M_t\,\mathbb E^{Q^N}\!\left[\frac{X_T}{N_T}\Bigm|\mathcal F_t\right].$$그런데 \(\frac{N_0}{B_0}M_t=\frac{N_t}{B_t}\)이므로 위 식은 곧
$$V_t=N_t\,\mathbb E^{Q^N}\!\left[\frac{X_T}{N_T}\Bigm|\mathcal F_t\right]$$가 된다. 특히 \(X_T=S_T\)로 두면 \(S_t/N_t=\mathbb E^{Q^N}[S_T/N_T\mid\mathcal F_t]\)이므로 \(S_t/N_t\)는 \(Q^N\)-마팅게일이다. \(\square\)
이 식은 “어떤 자산을 가치의 기준으로 삼느냐에 따라 가장 자연스러운 martingale이 달라진다”는 사실을 정식화한 것이다. 채권을 뉴메레르로 잡으면 forward measure가 나오고, 주식이나 money market account를 잡으면 각각 다른 측도 아래에서 드리프트가 정리된다.
A.15 지르사노프 정리
미시구조의 언어로 말하면 order flow가 posterior를 바꾸어 drift를 바꾼다. 확률미적분의 언어로 말하면 drift는 측도변환으로 제거되거나 새로 생긴다. 그 핵심 정리가 Girsanov 정리다. 아래에서는 유계의 예측가능 드리프트 버전을 완전하게 증명한다. 이 버전이 change of measure의 엔진을 가장 투명하게 보여준다.
이 보조정리 A.15.1에서 쓰는 기본 객체와 가정부터 분명히 적는다. Girsanov 이론의 입력은 예측가능 과정 \(\theta_t\)와 그에 대응하는 확률지수 \(Z_t=\exp\{-\int_0^t\theta_s\,dW_s-\frac12\int_0^t\theta_s^2ds\}\)이다. \(Z_t\)가 진정한 마팅게일이면 \(dQ=Z_TdP\)로 새 측도를 정의할 수 있고, 그 아래에서는 \(W_t+\int_0^t\theta_sds\)가 Brownian motion이 된다. 핵심 기술은 Itô 공식, 곱공식, 그리고 Lévy 특성화다.
연속 \((\mathcal{F}_t)\)-martingale \(M_t\)가 \(M_0=0\), \(\langle M\rangle_t=t\)를 만족하면 \(M\)은 Brownian motion이다.
가정을 다시 적으면 연속 \((\mathcal{F}_t)\)-martingale \(M_t\)가 \(M_0=0\), \(\langle M\rangle_t=t\)를 만족하면 \(M\)은 Brownian motion이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
임의의 \(u\in\mathbb{R}\)에 대해 \(F(x,t)=\exp(iux+\frac12u^2t)\)를 두고 Ito 공식을 적용하면
$$dF(M_t,t)=F(M_t,t)\Bigl(iu\,dM_t+\frac12(iu)^2\,d\langle M\rangle_t+\frac12u^2dt\Bigr)=iuF(M_t,t)\,dM_t.$$따라서 \(E_t:=\exp(iuM_t+\frac12u^2t)\)는 martingale이다. 그러면 \(s\le t\)에서
$$\mathbb{E}[e^{iu(M_t-M_s)}\mid\mathcal{F}_s] =e^{-\frac12u^2(t-s)}.$$우변은 \(\mathcal{F}_s\)와 무관한 \(N(0,t-s)\)의 characteristic function이다. 따라서 \(M_t-M_s\)는 \(\mathcal{F}_s\)와 독립이고 \(N(0,t-s)\) 분포를 가진다. 연속성은 가정되었으므로 \(M\)은 Brownian motion이다. \(\square\)
이 보조정리 A.15.2에서 쓰는 기본 객체와 가정부터 분명히 적는다. 마팅게일은 현재 정보 \(\mathcal F_s\)까지 알고 있을 때 미래의 조건부기댓값이 현재값과 정확히 일치하는 과정이다. 즉 \((M_t)\)가 마팅게일이라는 말은 \(\mathbb E[M_t\mid\mathcal F_s]=M_s\)가 모든 \(s\le t\)에 대해 성립한다는 뜻이다. 효율가격 \(\mu_t=\mathbb E[v\mid\mathcal F_t]\)는 바로 이 정의를 만족하는 전형적인 예다.
\(\theta_t=\sum_{k=0}^{m-1}\theta_k1_{(t_k,t_{k+1}]}(t)\)가 bounded predictable simple process라 하자. \(X_t:=\int_0^t\theta_s\,dW_s\), \(A_t:=\int_0^t\theta_s^2\,ds\),
$$Z_t:=\exp\!\left(-X_t-\frac12A_t\right)$$로 두면 \(Z_t\)는 양의 martingale이고 \(\mathbb{E}[Z_t]=1\).
가정을 다시 적으면 \(\theta_t=\sum_{k=0}^{m-1}\theta_k1_{(t_k,t_{k+1}]}(t)\)가 bounded predictable simple process라 하자. \(X_t:=\int_0^t\theta_s\,dW_s\), \(A_t:=\int_0^t\theta_s^2\,ds\), 로 두면 \(Z_t\)는 양의 martingale이고 \(\mathbb{E}[Z_t]=1\). 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(t=t_j\) partition points에서만 먼저 보자. 그러면
$$Z_{t_j}=\prod_{k=0}^{j-1}\exp\!\left(-\theta_k(W_{t_{k+1}}-W_{t_k})-\frac12\theta_k^2(t_{k+1}-t_k)\right).$$\(\theta_k\)는 \(\mathcal{F}_{t_k}\)-measurable이고 Brownian increment는 \(\mathcal{F}_{t_k}\)와 독립이며 \(N(0,t_{k+1}-t_k)\)이다. 그러므로
$$\mathbb{E}\!\left[\exp\!\left(-\theta_k\Delta W_k-\frac12\theta_k^2\Delta t_k\right)\Bigm|\mathcal{F}_{t_k}\right]=1.$$이를 뒤에서부터 반복적으로 conditioning하면 \(\mathbb{E}[Z_{t_j}]=1\), 더 나아가 \(\mathbb{E}[Z_{t_j}\mid\mathcal{F}_{t_i}]=Z_{t_i}\). 중간 시각 \(t\in(t_j,t_{j+1})\)에 대해서도 마지막 구간만 잘라 동일한 계산을 하면 martingale 성질이 성립한다. \(\square\)
이 정리 A.15.3에서 쓰는 기본 객체와 가정부터 분명히 적는다. 마팅게일은 현재 정보 \(\mathcal F_s\)까지 알고 있을 때 미래의 조건부기댓값이 현재값과 정확히 일치하는 과정이다. 즉 \((M_t)\)가 마팅게일이라는 말은 \(\mathbb E[M_t\mid\mathcal F_s]=M_s\)가 모든 \(s\le t\)에 대해 성립한다는 뜻이다. 효율가격 \(\mu_t=\mathbb E[v\mid\mathcal F_t]\)는 바로 이 정의를 만족하는 전형적인 예다.
\(|\theta_t|\le K\) a.s.인 bounded predictable process에 대해
$$Z_t:=\exp\!\left(-\int_0^t\theta_s\,dW_s-\frac12\int_0^t\theta_s^2\,ds\right)$$는 martingale이며 \(\mathbb{E}[Z_t]=1\).
가정을 다시 적으면 \(|\theta_t|\le K\) a.s.인 bounded predictable process에 대해 는 martingale이며 \(\mathbb{E}[Z_t]=1\). 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
bounded predictable simple processes \(\theta^{(n)}\)를 잡아 \(L^2([0,T]\times \Omega)\)에서 \(\theta^{(n)}\to\theta\)라 하자. Ito isometry로 \(X^{(n)}_T:=\int\theta^{(n)}dW\to X_T:=\int\theta dW\) in \(L^2\), 또한 \(A^{(n)}_T:=\int(\theta^{(n)})^2ds\to A_T:=\int\theta^2ds\) in \(L^1\). 부분수열을 취하면 almost surely convergence도 얻는다.
각 \(n\)에 대해 보조정리 A.15.2로 \(Z^{(n)}_T:=\exp(-X^{(n)}_T-\frac12A^{(n)}_T)\)는 \(\mathbb{E}[Z^{(n)}_T]=1\). 또한 boundedness 때문에 \(A^{(n)}_T\le K^2T\)이고, simple predictable 구조에서 conditional Gaussian 계산으로
$$\mathbb{E}\big[(Z^{(n)}_T)^2\mid \theta^{(n)}\big] =\exp(A^{(n)}_T)\le e^{K^2T}.$$따라서 \(\sup_n\mathbb{E}[(Z^{(n)}_T)^2]\le e^{K^2T}\), 즉 \(\{Z^{(n)}_T\}\)는 \(L^2\)-bounded이므로 UI이다. a.s. 수렴과 UI로부터 \(Z^{(n)}_T\to Z_T\) in \(L^1\), 따라서
$$\mathbb{E}[Z_T]=\lim_{n\to\infty}\mathbb{E}[Z^{(n)}_T]=1.$$동일한 논리를 \(t\le T\)에 대해 적용하면 \((Z_t)\)의 martingale 성질이 성립한다. \(\square\)
이 정리 A.15.4에서 쓰는 기본 객체와 가정부터 분명히 적는다. Girsanov 이론의 입력은 예측가능 과정 \(\theta_t\)와 그에 대응하는 확률지수 \(Z_t=\exp\{-\int_0^t\theta_s\,dW_s-\frac12\int_0^t\theta_s^2ds\}\)이다. \(Z_t\)가 진정한 마팅게일이면 \(dQ=Z_TdP\)로 새 측도를 정의할 수 있고, 그 아래에서는 \(W_t+\int_0^t\theta_sds\)가 Brownian motion이 된다. 핵심 기술은 Itô 공식, 곱공식, 그리고 Lévy 특성화다.
위 정리의 \(Z_T\)로 새로운 확률측도 \(Q\)를
$$\frac{dQ}{dP}\Big|_{\mathcal{F}_T}=Z_T$$로 정의하자. 그러면
$$\widetilde W_t:=W_t+\int_0^t\theta_s\,ds$$는 \(Q\)-Brownian motion이다.
가정을 다시 적으면 위 정리의 \(Z_T\)로 새로운 확률측도 \(Q\)를 로 정의하자. 그러면 는 \(Q\)-Brownian motion이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(Z_t=\exp\{-\int_0^t\theta_s\,dW_s-\frac12\int_0^t\theta_s^2ds\}\)가 양의 마팅게일이므로 \(dQ=Z_TdP\)로 새로운 확률측도 \(Q\)를 정의할 수 있다. 보여야 할 대상은
$$\widetilde W_t:=W_t+\int_0^t\theta_s\,ds$$가 \(Q\)-Brownian motion이라는 사실이다. 이를 위해 연속성, 마팅게일 성질, 그리고 이차변동이 \(t\)와 같음을 차례로 확인한다.
먼저 연속성은 자명하다. \(W\)가 연속이고 적분항 \(\int_0^t\theta_sds\)는 유한변동 연속과정이므로 \(\widetilde W\)도 연속이다.
다음으로 \(Q\)-마팅게일 성질을 보인다. Itô 곱공식을 \(Z_t\widetilde W_t\)에 적용하면
$$d(Z_t\widetilde W_t)=\widetilde W_t\,dZ_t+Z_t\,d\widetilde W_t+d\langle Z,\widetilde W angle_t.$$여기서 \(dZ_t=-\theta_tZ_t\,dW_t\), \(d\widetilde W_t=dW_t+\theta_tdt\)이고, 유한변동항은 공변동에 기여하지 않으므로 \(d\langle Z,\widetilde W angle_t=d\langle Z,W angle_t=-\theta_tZ_tdt\)이다. 따라서
$$\begin{aligned} d(Z_t\widetilde W_t) &=\widetilde W_t(-\theta_tZ_t\,dW_t)+Z_t(dW_t+\theta_tdt)-\theta_tZ_tdt\ &=Z_t(1-\theta_t\widetilde W_t)\,dW_t. \end{aligned}$$오른쪽은 적분가능한 적률을 가지는 확률적 적분이므로 \(P\)-마팅게일이다. 이제 측도변환 Bayes 공식을 적용하면 \(\widetilde W_t\)가 \(Q\)-마팅게일임을 얻는다.
마지막으로 이차변동을 계산한다. 유한변동항은 이차변동을 바꾸지 않으므로
$$\langle\widetilde W angle_t=\langle W angle_t=t.$$정리 A.15.1의 Lévy 특성화에 따르면 시작값 0의 연속 \(Q\)-마팅게일이 이차변동 \(t\)를 가지면 그것은 \(Q\)-Brownian motion이다. 따라서 \(\widetilde W\)는 \(Q\)-Brownian motion이다. \(\square\)
원래 측도 \(P\)에서 drift를 가진 과정 \(dX_t = b_tdt+\sigma_t dW_t\)가 있을 때, \(\theta_t=b_t/\sigma_t\)를 택하면 새로운 측도 아래에서는 drift가 사라져
$$dX_t=\sigma_t\,d\widetilde W_t$$꼴이 된다. 다시 말해 drift는 절대적 객체가 아니라, 어떤 측도로 보느냐에 따라 바뀌는 상대적 객체다. 시장미시구조에서 정보가 posterior를 바꾸듯이, 확률미적분에서는 density process가 drift를 바꾼다.
A.16 점프과정, Cox 과정, 생성자, Feynman–Kac
AHFT 부록의 나머지 내용은 확산만으로 설명되지 않는 도착과 점프를 다룬다. Chapter 2의 지정가 주문 체결률 \(p^\pm(\delta)\)는 뒤에서 강도(intensity) 모형으로 동태화되는데, 그 기본 언어가 바로 카운팅 과정과 생성자다.
강도 \(\lambda>0\)인 포아송 과정 \(N_t\)는 \(N_0=0\), 독립정상증분, 그리고 \(N_t-N_s\sim \text{Poisson}(\lambda(t-s))\)를 만족하는 càdlàg counting process이다. 보상 과정은
$$M_t:=N_t-\lambda t$$로 정의한다.
이 정리 A.16.2에서 쓰는 기본 객체와 가정부터 분명히 적는다. 강도 \(\lambda\)의 포아송과정 \(N_t\)는 평균적으로 시간 \(t\)까지 \(\lambda t\)번 도착한다. 따라서 \(M_t:=N_t-\lambda t\)는 실제 도착 횟수에서 예측 가능한 평균 도착 횟수를 뺀 보상과정(compensated process)이다. 이 정리는 그 보상과정이 filtration \((\mathcal F_t)\)에 대해 마팅게일임을 말한다.
보상 포아송 과정은 마팅게일이다.
가정을 다시 적으면 보상 포아송 과정은 마팅게일이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
\(M_t:=N_t-\lambda t\)로 두자. 먼저 \(N_t\)는 counting process이므로 \(\mathcal F_t\)-adapted이고 \(\mathbb E[N_t]=\lambda t<\infty\)이다. 따라서 \(M_t\)도 적응이고 적분가능하다.
이제 \(0\le s\le t\)를 고정하고 조건부기댓값을 계산한다. 포아송과정의 독립증분 성질에 의해 \(N_t-N_s\)는 \(\mathcal F_s\)와 독립이고 평균이 \(\lambda(t-s)\)인 포아송 분포를 갖는다. 따라서
$$\mathbb E[N_t-N_s\mid\mathcal F_s]=\mathbb E[N_t-N_s]=\lambda(t-s).$$이 식을 사용하여
$$\mathbb E[M_t\mid\mathcal F_s]=\mathbb E[N_t-\lambda t\mid\mathcal F_s]$$ $$=\mathbb E[N_s+(N_t-N_s)-\lambda t\mid\mathcal F_s]$$ $$=N_s+\mathbb E[N_t-N_s\mid\mathcal F_s]-\lambda t$$ $$=N_s+\lambda(t-s)-\lambda t=N_s-\lambda s=M_s.$$마팅게일의 세 조건이 모두 확인되었으므로 \(M_t=N_t-\lambda t\)는 \((\mathcal F_t)\)-마팅게일이다. \(\square\)
이 정리 A.16.3에서 쓰는 기본 객체와 가정부터 분명히 적는다. 점프모형에서 counting process \(N_t\)는 사건 발생 횟수를 세고, compensator를 뺀 \(M_t=N_t-\int_0^t\lambda_sds\)가 마팅게일이 된다. 생성자 \(\mathcal L\)는 짧은 시간 동안 기대증분의 1차 근사를 담고 있고, Feynman–Kac 정리는 그 생성자에 대응하는 PDE와 조건부기댓값 표현을 연결한다.
비음의 adapted intensity \(\Lambda_t\)가 주어졌다고 하자. Cox process \(N_t\)는 intensity path가 주어졌을 때
$$P\!\left(N_t-N_s=n\mid \mathcal{F}_s\vee \sigma(\Lambda_u:s\le u\le t)\right) = e^{-\int_s^t \Lambda_u\,du}\frac{\left(\int_s^t\Lambda_u\,du\right)^n}{n!}$$를 만족하는 counting process이다.
가정을 다시 적으면 비음의 adapted intensity \(\Lambda_t\)가 주어졌다고 하자. Cox process \(N_t\)는 intensity path가 주어졌을 때 를 만족하는 counting process이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
Cox 과정의 정의는 "강도 경로를 조건으로 고정하면 그 아래에서 포아송과정이 된다"는 것이다. 따라서 \(\mathcal G:=\sigma(\lambda_u:0\le u\le t)\)에 대해, 구간 \([s,t]\)의 증가분 \(N_t-N_s\)는 \(\mathcal G\)를 조건으로 평균
$$\Lambda_{s,t}:=\int_s^t \lambda_u\,du$$를 갖는 포아송 분포를 따른다. 이를 식으로 쓰면 임의의 \(k=0,1,2,\dots\)에 대해
$$\mathbb P(N_t-N_s=k\mid\mathcal G)=e^{-\Lambda_{s,t}}\frac{\Lambda_{s,t}^k}{k!}.$$이 식은 생성함수로도 확인된다. 실제로
$$\mathbb E[z^{N_t-N_s}\mid\mathcal G]=\sum_{k=0}^\infty z^k e^{-\Lambda_{s,t}}\frac{\Lambda_{s,t}^k}{k!}=\exp\big((z-1)\Lambda_{s,t}\big),$$이는 정확히 평균 \(\Lambda_{s,t}\)인 포아송 분포의 generating function이다. 따라서 조건부 분포 주장이 성립한다. \(\square\)
이 정리 A.16.4에서 쓰는 기본 객체와 가정부터 분명히 적는다. 점프모형에서 counting process \(N_t\)는 사건 발생 횟수를 세고, compensator를 뺀 \(M_t=N_t-\int_0^t\lambda_sds\)가 마팅게일이 된다. 생성자 \(\mathcal L\)는 짧은 시간 동안 기대증분의 1차 근사를 담고 있고, Feynman–Kac 정리는 그 생성자에 대응하는 PDE와 조건부기댓값 표현을 연결한다.
확산 \(dX_t=\mu(t,X_t)dt+\sigma(t,X_t)dW_t\)의 생성자를
$$\mathcal{L}_t f(x)=\mu(t,x)f_x(x)+\frac12\sigma^2(t,x)f_{xx}(x)$$라 하자. \(u(t,x)\)가
$$\partial_tu+\mathcal{L}_tu-r(t,x)u+f(t,x)=0,\qquad u(T,x)=g(x)$$를 만족하면
$$u(t,x)=\mathbb{E}\!\left[\int_t^T e^{-\int_t^s r(u,X_u)\,du}f(s,X_s)\,ds+e^{-\int_t^T r(u,X_u)\,du}g(X_T)\Bigm|X_t=x\right].$$가정을 다시 적으면 확산 \(dX_t=\mu(t,X_t)dt+\sigma(t,X_t)dW_t\)의 생성자를 라 하자. \(u(t,x)\)가 를 만족하면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
확률과정 \(X_t\)가 생성자 \(\mathcal L\)를 갖는 Markov 과정이고,
$$u(t,x):=\mathbb E_{t,x}\Big[e^{-\int_t^T r(u,X_u)\,du}\,g(X_T)+\int_t^T e^{-\int_t^s r(u,X_u)\,du}f(s,X_s)\,ds\Big]$$로 정의된 함수가 충분히 매끄럽다고 하자. 목표는 \(u\)가 PDE
$$\partial_t u+\mathcal Lu-r u+f=0,\qquad u(T,x)=g(x)$$를 만족함을 보이는 것이다.
할인인자 \(D_s:=\exp(-\int_t^s r(u,X_u)du)\)와 과정 \(Y_s:=D_su(s,X_s)\)를 두자. Itô 공식과 생성자 정의를 적용하면
$$dY_s=D_s\big(\partial_su+\mathcal Lu-r u\big)(s,X_s)\,ds+dM_s$$가 된다. 여기서 \(M_s\)는 적절한 적분가능성 아래의 마팅게일 부분이다. 이제 PDE를 만족한다고 가정하면 \(\partial_su+\mathcal Lu-r u=-f\)이므로
$$dY_s=-D_sf(s,X_s)\,ds+dM_s.$$양변을 \(t\)부터 \(T\)까지 적분하면
$$Y_T-Y_t=-\int_t^T D_sf(s,X_s)\,ds+M_T-M_t.$$이를 정리하면
$$u(t,X_t)=D_Tg(X_T)+\int_t^T D_sf(s,X_s)\,ds-(M_T-M_t).$$조건부기댓값 \(\mathbb E_{t,x}[\cdot]\)를 취하면 마팅게일 증분의 기대값은 0이므로 위의 기대값 표현을 얻는다. 역방향은 Dynkin 공식과 작은 시간증분 전개로 같은 PDE를 되찾는 표준 계산이다. 따라서 Feynman–Kac 공식이 성립한다. \(\square\)
여기까지 오면 Chapter 2의 수학적 엔진이 모두 갖추어진다. 조건부확률과 Bayes 갱신은 order flow를 정보로 바꾸는 장치이고, martingale은 효율가격의 수학적 표현이며, 수렴정리와 UI는 극한 교환을 정당화한다. Radon–Nikodym과 Girsanov는 측도변환과 drift 변화의 핵심이고, numeraire는 어떤 자산을 기준단위로 삼아 가격을 해석할지 결정한다. 점프과정과 Feynman–Kac은 뒤 장의 체결강도, counting process, 동적 제어 문제로 연결된다.
거래전략을 설계하고 집행할 때 부딪히는 문제들을 이해하려면, 그 전략들을 움직이게 만드는 경제학부터 보아야 한다. 이 장은 시장미시구조 문헌을 출발점으로 삼아 그 경제학을 탐구한다. 시장미시구조는 "명시적인 거래 규칙 아래에서 자산을 교환하는 과정과 그 결과를 연구하는 학문"이다(O'Hara 1995). 따라서 이 분야는 알고리즘 트레이딩과 고빈도 트레이딩을 정확히 포괄한다.
이 장의 두 축은 명확하다. 하나는 재고와 즉시성 공급의 경제학으로, 누가 어떤 비용으로 유동성을 공급하는지를 다룬다(§2.1). 다른 하나는 정보 비대칭의 경제학으로, 더 잘 아는 쪽이 어떻게 거래하고, 정보에서 뒤처진 시장조성자가 어떻게 자신을 보호하는지를 다룬다(§2.2, §2.3). 이 두 축이 만나는 지점에서 spread의 크기와 구성, 가격의 동적 조정, 그리고 시장 붕괴의 가능성까지 하나의 논리적 사슬이 완성된다.
2.1 Market Making (시장조성)
시장참가자의 중요한 한 유형이 수동적(passive) 시장조성자(MM)이다. MM은 매수호가와 매도호가를 동시에 제시하여 유동성을 공급하고, 스프레드를 벌며, 체결 기술에서 수익을 얻는다. 반대편에는 가격 움직임을 예견하여 시장에 개입하는 능동적(active) 거래자가 있다.
우리가 다루는 환경은 경쟁적인 전자거래소이므로 많은 MM이 서로 경쟁한다고 가정하는 것이 자연스럽다. MM의 핵심 역할은 자산의 종류와 무관하게 양방향 호가를 제시하여 유동성을 공급하는 것이다. 이때 유동성의 중요한 차원은 즉시성(immediacy)이다. 투자자가 지금 이 순간 자산을 사고 팔고 싶을 때, 반대 포지션을 가진 상대를 따로 찾지 않고도 거래할 수 있게 만드는 능력이다. MM은 양방향 LO를 주문장 양쪽에 올려 이 즉시성을 공급한다. 지속 가능한 사업이 되려면 MM의 매수호가는 매도호가보다 낮아야 하므로, MM은 liquidity provider이고 MO를 던지는 상대편은 liquidity taker이다.
경쟁적인 시장에서 스프레드가 무엇으로 결정되는지 설명하는 이론은 여럿 존재한다. 이론들에 들어가기 전에, 유동성을 공급하는 사람이 실제로 어떤 문제를 떠안는지 먼저 살펴봐야 한다.
2.1.1 Grossman–Miller 시장조성 모형
MM이 유동성을 공급할 때 가장 먼저 직면하는 문제는, 거래의 한쪽을 받아주는 순간부터 반대방향 수요가 등장하기 전까지 자산을 들고 있어야 한다는 점이다. 누군가 팔고 싶어 할 때 MM이 사주면, 다음에 그 물량을 사줄 다른 거래자가 올 때까지 재고를 보유해야 한다. 그 기간 동안 가격이 자신에게 불리하게 움직일 수 있다. MM은 본래 그 자산을 장기 보유하고 싶은 사람이 아니다. 나중에 다시 팔 수 있으리라는 기대 때문에 매수하고, 나중에 다시 살 수 있으리라는 기대 때문에 매도한다.
Grossman and Miller (1988)는 바로 이 문제를 포착하여, 유동성 거래자가 지불하는 유동성 프리미엄이 MM이 재고를 들고 있는 동안 노출되는 가격위험을 정확히 보상한다고 설명한다.
동일한 \(n\)명의 MM, 세 시점 \(t \in \{1,2,3\}\). 시점 1에서 유동성 거래자 LT1이 자산 \(i\)단위를 매도하려 하고, 시점 2에서 반대 방향 수요를 가진 LT2가 도착한다. 모든 참가자는 초기 현금 \(W_0\), MM은 재고 0, LT1은 \(i\)단위, LT2는 \(-i\)단위를 보유하고 시작한다.
자산의 최종 현금가치: \(S_3 = \mu + \varepsilon_2 + \varepsilon_3\), 여기서 \(\varepsilon_2, \varepsilon_3 \sim N(0, \sigma^2)\) i.i.d. \(\varepsilon_2\)는 \(t=1\)과 \(t=2\) 사이에, \(\varepsilon_3\)는 \(t=2\)와 \(t=3\) 사이에 공개된다. 모든 참가자의 효용함수: \(U(X) = -\exp(-\gamma X)\), \(\gamma > 0\).
모형을 뒤에서 앞으로 푼다. 시점 2에서 \(\varepsilon_2\)가 이미 공개되어 있고, 정규분포와 CARA 효용의 조합 덕분에 각 참가자의 최적 위험자산 보유는 닫힌형태를 갖는다.
이 정리 2.1에서 쓰는 기본 객체와 가정부터 분명히 적는다. Grossman–Miller 부분의 기본 객체는 CARA 효용 \(U(x)=-e^{-\gamma x}\), 정규적 미래가치, 그리고 시장청산조건이다. CARA–Normal 결합에서는 기대효용 극대화가 조건부기댓값과 조건부분산을 이용한 이차식 최대화와 동치가 되어 최적 보유량 \(q^*=(\mathbb E[V]-P)/(\gamma\operatorname{Var}(V))\) 꼴이 나온다. 선형 price impact에서는 한계체결가격이 거래량에 선형으로 반응한다.
시점 2 균형가격은 \(S_2 = \mu + \varepsilon_2 = \mathbb{E}[S_3 \mid \varepsilon_2]\)이고, 모든 포지션이 \(q_2^* = 0\)에서 청산된다.
가정을 다시 적으면 시점 2 균형가격은 \(S_2 = \mu + \varepsilon_2 = \mathbb{E}[S_3 \mid \varepsilon_2]\)이고, 모든 포지션이 \(q_2^* = 0\)에서 청산된다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
시점 2에서는 \(\varepsilon_2\)가 이미 관측되었으므로 참가자들이 보기에 남아 있는 유일한 불확실성은 \(\varepsilon_3\)다. 따라서 미래가치 \(S_3\)의 조건부분포는
$$S_3\mid\varepsilon_2 \sim N(\mu+\varepsilon_2,\,\sigma^2)$$가 된다. 이제 한 참가자가 시점 2 가격 \(S_2\)에서 위험자산 \(q\)단위를 보유한다고 하자. 그 참가자의 추가 terminal wealth는 \(q(S_3-S_2)\)이고, CARA 효용과 정규분포의 결합에서는 기대효용 극대화가 certainty equivalent
$$CE(q)=q\bigl(\mathbb E[S_3\mid\varepsilon_2]-S_2\bigr)-\frac{\gamma}{2}\operatorname{Var}(qS_3\mid\varepsilon_2)$$를 최대화하는 문제와 동치다. 조건부분산은 \(q^2\sigma^2\)이므로
$$CE(q)=q(\mu+\varepsilon_2-S_2)-\frac{\gamma\sigma^2}{2}q^2.$$이를 \(q\)에 대해 미분하면
$$\frac{d}{dq}CE(q)=\mu+\varepsilon_2-S_2-\gamma\sigma^2 q.$$일계조건에서 각 참가자의 최적수요는
$$q_{2,j}^*=\frac{\mu+\varepsilon_2-S_2}{\gamma\sigma^2}.$$이제 시장청산을 적용한다. 시점 2에서는 순공급이 0이므로 모든 참가자의 수요합이 0이어야 한다. 참가자가 총 \(n+2\)명이므로
$$(n+2)\frac{\mu+\varepsilon_2-S_2}{\gamma\sigma^2}=0.$$분모는 양수이므로 \(S_2=\mu+\varepsilon_2\)가 유일한 균형가격이다. 이 값을 개별수요식에 다시 대입하면 \(q_{2,j}^*=0\)가 된다. 따라서 시점 2 말에는 모든 재고가 청산된다. \(\square\)
시점 2의 해가 주어지면, 시점 1의 참가자들(\(n\)명의 MM과 LT1, 총 \(n+1\)명)은 자신들이 시점 2에서 결국 효율가격에 재고를 청산하게 된다는 사실을 알고 있다. LT1은 \(q_0^{LT1} = i\)를 보유하고 있으며 이것이 매도 공급량이 된다.
이 정리 2.2에서 쓰는 기본 객체와 가정부터 분명히 적는다. Grossman–Miller 부분의 기본 객체는 CARA 효용 \(U(x)=-e^{-\gamma x}\), 정규적 미래가치, 그리고 시장청산조건이다. CARA–Normal 결합에서는 기대효용 극대화가 조건부기댓값과 조건부분산을 이용한 이차식 최대화와 동치가 되어 최적 보유량 \(q^*=(\mathbb E[V]-P)/(\gamma\operatorname{Var}(V))\) 꼴이 나온다. 선형 price impact에서는 한계체결가격이 거래량에 선형으로 반응한다.
시점 1의 균형가격은
$$S_1 = \mu - \gamma\sigma^2 \frac{i}{n+1}$$이고, 각 에이전트가 흡수하는 수량은 \(q_{1,j}^* = \frac{i}{n+1}\)이다.
가정을 다시 적으면 시점 1의 균형가격은 이고, 각 에이전트가 흡수하는 수량은 \(q_{1,j}^* = \frac{i}{n+1}\)이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
시점 1에서는 아직 \(\varepsilon_2\)가 공개되지 않았으므로 참가자들이 알고 있는 미래 청산가격의 조건부기댓값은 \(\mu\)다. 시점 1 가격을 \(S_1\)이라 하고, 한 참가자가 \(q\)단위를 보유한다고 하자. 시점 2에 이 재고는 결국 \(S_2=\mu+\varepsilon_2\)에서 청산되므로 추가 wealth의 조건부 평균과 분산은 각각 \(q(\mu-S_1)\), \(q^2\sigma^2\)가 된다.
따라서 certainty equivalent는
$$CE(q)=q(\mu-S_1)-\frac{\gamma\sigma^2}{2}q^2$$이고, 이를 미분하면
$$\frac{d}{dq}CE(q)=\mu-S_1-\gamma\sigma^2 q.$$일계조건에서 최적보유량은
$$q_{1,j}^*=\frac{\mu-S_1}{\gamma\sigma^2}.$$이제 시장청산을 쓴다. 시점 1에는 LT1이 기존보유 \(i\)단위를 시장에 내놓고, 그것을 \(n\)명의 MM과 LT1을 포함한 총 \(n+1\)명의 참가자가 나누어 흡수한다. 따라서 총수요는 \(i\)와 같아야 하고
$$(n+1)\frac{\mu-S_1}{\gamma\sigma^2}=i.$$이를 풀면
$$S_1=\mu-\gamma\sigma^2\frac{i}{n+1}.$$이 값을 최적보유량 식에 대입하면
$$q_{1,j}^*=\frac{\mu-S_1}{\gamma\sigma^2}=\frac{i}{n+1}.$$즉 가격양보는 재고위험의 보상으로 결정되고, 공급충격은 모든 참가자에게 균등하게 분산된다. \(\square\)
이 식의 해석은 명확하다. LT1이 \(i > 0\)단위를 팔고 싶지만, 그 순간 반대 방향 수요를 가진 사람이 없다. MM이 효율가격 \(\mu\)에서 물량을 받아줄 이유가 없다. 그렇게 하면 \(\varepsilon_2\)의 위험에 노출된 채로 시점 2까지 재고를 들고 있어야 하기 때문이다. 따라서 LT1은 유동성 할인(liquidity discount)을 지불해야 한다. LT1 자신도 가격에 민감하므로 할인폭이 존재하면 전량을 한꺼번에 팔지 않고 일부를 시점 2로 미룬다. 균형에서는 MM들과 LT1이 모두 \(i/(n+1)\)단위를 보유하게 된다.
| 변수 | 효과 | 이유 |
|---|---|---|
| 주문불균형 \(|i| \uparrow\) | 가격양보 \(\uparrow\) | 더 많은 재고를 흡수해야 함 |
| 위험회피 \(\gamma \uparrow\) | 가격양보 \(\uparrow\) | 재고 부담에 더 많은 보상 요구 |
| 변동성 \(\sigma^2 \uparrow\) | 가격양보 \(\uparrow\) | 가격위험이 커짐 |
| MM 수 \(n \uparrow\) | 가격양보 \(\downarrow\) | 충격이 더 많은 참가자에게 분산 |
시장조성은 "재고를 받아주는 서비스"이며, 그 서비스 가격이 price concession이다. 경쟁(\(n\))이 증가하면 유동성 프리미엄이 0으로 수렴하고 가격은 효율 수준 \(\mu\)에 수렴한다. \(n \to \infty\)이면 \(S_1 \to \mu\).
2.1.2 거래비용 (Trading Costs)
Grossman–Miller 틀은 자산 보유가 만들어 내는 가격위험이 어떻게 거래비용과 즉시성의 부족으로 이어지는지를 보여 준다. 그런데 유동성을 제약하는 비용에는 재고위험 보상만 있는 것이 아니다. 시장에 상시 참여하기 위해 드는 참여비용(participation cost)과, 실제 거래활동에 비례하여 발생하는 거래수수료(trading fee)가 따로 존재한다.
참여비용 \(c\)는 시스템 구축비, 인력비, 시장에 상시 대기하기 위한 기회비용을 포함한다. Grossman and Miller는 이 비용이 커질수록 적극적으로 참여하는 MM 수 \(n\)이 줄어들고, 그 결과 유동성 할인이 커진다는 것을 보인다.
이제 주당 \(\eta\)의 거래수수료가 모든 거래자에게 적용된다고 하자. 수수료가 생기면 원하는 거래량이 너무 작은 유동성 거래자는 아예 거래를 포기할 수 있다. 충분히 큰 유동성 수요가 있는 경우를 분석하면, 시점 2의 효율가격은 바뀌지 않지만 시점 1의 균형가격은 달라진다.
시점 1에서 각 에이전트의 최적 portfolio를 구하면, LT1의 수요는 \(q_1^{LT1} = \frac{\mathbb{E}[S_2 - \eta] - (S_1 - \eta)}{\gamma\sigma^2}\)이고, MM의 수요는 \(q_1^{MM} = \frac{\mathbb{E}[S_2 - \eta] - (S_1 + \eta)}{\gamma\sigma^2}\)이다. 부호 차이에 주목하자. MM은 지금 사고 나중에 팔아야 하므로 두 번의 수수료를 내고, LT1은 지금만 수수료를 낸다. 시장청산조건을 풀면
흥미로운 점은 거래수수료의 대부분이 LT1에게 전가된다는 것이다. LT1은 자신의 수수료 \(\eta\)를 직접 내는 것 외에도, MM들이 부담하는 수수료 \(2\eta\) 중 \(n/(n+1)\) 비율을 더 낮아진 가격 \(S_1\)을 통해 간접 부담한다. 참여비용이 경쟁구조 자체를 바꾸는 비용이라면, 거래수수료는 기대수익을 직접 깎아내리는 비용이다.
2.1.3 유동성 측정 (Measuring Liquidity)
Grossman–Miller 모형이 Walras식 경매자 구조를 취하므로 모든 거래가 한 번에 하나의 가격에서 이루어진다고 가정한다. 이를 전자시장 언어로 바꿔 읽으면, 조급한 유동성 거래자가 MO를 던지고 그 주문이 LOB에서 MM들의 LO와 차례로 체결된다고 이해할 수 있다. 그러면 LT1이 받은 평균체결가격 \(S_1\)과 초기 midprice의 차이가 바로 거래비용이 된다.
이 시각에서 중요한 개념이 가격충격(price impact)이다. 평균체결가격을 거래량의 선형함수로 쓰면
Grossman–Miller에서 \(\lambda = \frac{\gamma\sigma^2}{n}\), \(q^{LT1} = i\cdot\frac{n}{n+1}\). \(\lambda\) 파라미터는 시장의 유동성을 나타내는 대표적 지표이며, 더 유동적인 시장은 낮은 \(\lambda\)를 가진다. 이것이 Kyle's lambda와 같은 개념적 위치에 있다.
이 정리 2.3에서 쓰는 기본 객체와 가정부터 분명히 적는다. Grossman–Miller 부분의 기본 객체는 CARA 효용 \(U(x)=-e^{-\gamma x}\), 정규적 미래가치, 그리고 시장청산조건이다. CARA–Normal 결합에서는 기대효용 극대화가 조건부기댓값과 조건부분산을 이용한 이차식 최대화와 동치가 되어 최적 보유량 \(q^*=(\mathbb E[V]-P)/(\gamma\operatorname{Var}(V))\) 꼴이 나온다. 선형 price impact에서는 한계체결가격이 거래량에 선형으로 반응한다.
한계체결가격이 \(P(q) = m + \lambda q\)이면, 총 \(Q\)주 매수 시 평균체결가격은
$$\bar{P}(Q) = \frac{1}{Q}\int_0^Q (m + \lambda x)\,dx = m + \frac{\lambda}{2}Q.$$가정을 다시 적으면 한계체결가격이 \(P(q) = m + \lambda q\)이면, 총 \(Q\)주 매수 시 평균체결가격은 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
한계체결가격이 \(P(q)=m+\lambda q\)라는 것은 주문량을 아주 조금 더 늘릴 때 마지막 한 단위를 체결하는 가격이 선형적으로 상승한다는 뜻이다. 총 \(Q\)주를 0에서 \(Q\)까지 연속적으로 집행한다고 보면 총지불금액은 각 미소구간의 체결가격을 적분한 값이다.
$$\text{총지불금액}=\int_0^Q P(x)\,dx=\int_0^Q (m+\lambda x)\,dx.$$적분을 항별로 계산하면
$$\int_0^Q m\,dx=mQ,\qquad \int_0^Q \lambda x\,dx=\lambda\frac{Q^2}{2}.$$따라서
$$\int_0^Q (m+\lambda x)\,dx=mQ+\frac{\lambda}{2}Q^2.$$평균체결가격은 총지불금액을 총수량 \(Q\)로 나눈 것이므로
$$\bar P(Q)=\frac{1}{Q}\int_0^Q (m+\lambda x)\,dx=m+\frac{\lambda}{2}Q.$$즉 한계가격 충격이 선형이면 평균체결가격은 midpoint보다 \(\lambda Q/2\)만큼 위에 놓인다. \(\square\)
두 번째 유동성 측도는 가격변화의 자기공분산이다. 시점 0을 추가하여 \(S_3 = \mu_0 + \varepsilon_1 + \varepsilon_2 + \varepsilon_3\)으로 확장하면 효율가격 과정 \(\mu_t\)는 martingale이 된다. 실제 거래가격은 유동성 충격 때문에 일시적으로 효율가격에서 밀려난다. 연속된 두 가격변화 \(\Delta_1 = S_1 - S_0\), \(\Delta_2 = S_2 - S_1\)에 대해
이 정리 2.4에서 쓰는 기본 객체와 가정부터 분명히 적는다. Grossman–Miller 부분의 기본 객체는 CARA 효용 \(U(x)=-e^{-\gamma x}\), 정규적 미래가치, 그리고 시장청산조건이다. CARA–Normal 결합에서는 기대효용 극대화가 조건부기댓값과 조건부분산을 이용한 이차식 최대화와 동치가 되어 최적 보유량 \(q^*=(\mathbb E[V]-P)/(\gamma\operatorname{Var}(V))\) 꼴이 나온다. 선형 price impact에서는 한계체결가격이 거래량에 선형으로 반응한다.
가정을 다시 적으면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
가정에 따라 첫 번째 가격변화와 두 번째 가격변화는
$$\Delta_1=\varepsilon_1+\lambda q^{LT1},\qquad \Delta_2=\varepsilon_2-\lambda q^{LT1}$$로 주어진다. 이제 공분산 정의를 그대로 전개한다.
$$\operatorname{Cov}(\Delta_1,\Delta_2)=\operatorname{Cov}(\varepsilon_1+\lambda q^{LT1},\,\varepsilon_2-\lambda q^{LT1}).$$공분산의 쌍선형성을 사용하면
$$\operatorname{Cov}(\Delta_1,\Delta_2)=\operatorname{Cov}(\varepsilon_1,\varepsilon_2)-\lambda\operatorname{Cov}(\varepsilon_1,q^{LT1})+\lambda\operatorname{Cov}(q^{LT1},\varepsilon_2)-\lambda^2\operatorname{Var}(q^{LT1}).$$여기서 \(\varepsilon_1,\varepsilon_2\)는 서로 독립이고, 두 충격은 모두 유동성 주문량 \(q^{LT1}\)과도 독립이므로 앞의 세 항은 모두 0이다. 따라서 남는 것은
$$\operatorname{Cov}(\Delta_1,\Delta_2)=-\lambda^2\operatorname{Var}(q^{LT1}).$$분산은 음이 아니고, 비퇴화한 유동성충격이 있으면 양수이므로 자기공분산은 음수다. 이것이 일시적 가격충격 뒤의 되돌림을 수학적으로 표현한 식이다. \(\square\)
시점 1에 큰 매도충격이 들어오면 가격이 내려간다. 이후 inventory가 소화되면서 가격 일부가 되돌아온다(mean reversion). 따라서 \(\Delta_1 < 0 \Rightarrow \Delta_2 > 0\)의 경향이 생겨 자기공분산이 음수다. 유동성이 증가하여 \(\lambda \to 0\)이 되면 자기공분산도 0으로 수렴하고, 가격과정은 효율가격 martingale에 가까워진다.
2.1.4 지정가주문을 이용한 시장조성
Grossman–Miller 모형이 평균체결가격으로 문제를 설명했다면, 실제 전자시장에서 MM의 더 직접적인 질문은 "주문장 어디에 LO를 둘 것인가"다. Ho and Stoll(1981)의 원래 모형은 동적 확률제어 문제이지만, 여기서는 핵심 trade-off를 포착하는 정태적 버전을 먼저 본다.
현재 midprice를 \(S_t\)라 하고, 매도 LO를 \(S_t + \delta^+\), 매수 LO를 \(S_t - \delta^-\)에 위치시킨다고 하자. 주문장의 다른 LO들의 분포가 지수분포 파라미터 \(\kappa_\pm\)로 주어지면, 체결 확률은
$$p_+ e^{-\kappa_+ \delta^+} \quad \text{(매도 LO)}, \qquad p_- e^{-\kappa_- \delta^-} \quad \text{(매수 LO)}$$가 된다. quote를 더 멀리 둘수록 거래당 이익 \(\delta^\pm\)은 커지지만 체결확률은 떨어진다. MM은 마진과 체결빈도의 곱을 최대화한다.
이 정리 2.5에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리들에서는 midprice로부터의 거리 \(\delta\) 또는 inventory \(q\)가 통제변수다. \(\delta\)를 키우면 건당 마진은 커지지만 체결확률은 감소한다. \(q\)가 커지면 다음 거래에서 추가로 떠안게 되거나 줄일 재고에 대한 한계비용이 바뀐다. 따라서 최적 호가는 기대수익과 체결강도, 그리고 inventory cost의 한계차이를 동시에 반영한다.
목적함수가 \(\Pi(\delta^+, \delta^-) = p_+ P_+(\delta^+) \delta^+ + p_- P_-(\delta^-) \delta^-\)이고 \(P_\pm(\delta) = e^{-\kappa_\pm \delta}\)이면, 최적 깊이는
$$\delta^{\pm,*} = \frac{1}{\kappa_\pm}.$$가정을 다시 적으면 목적함수가 \(\Pi(\delta^+, \delta^-) = p_+ P_+(\delta^+) \delta^+ + p_- P_-(\delta^-) \delta^-\)이고 \(P_\pm(\delta) = e^{-\kappa_\pm \delta}\)이면, 최적 깊이는 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
매수측과 매도측은 서로 대칭이므로 한쪽만 풀면 된다. \(\kappa>0\)를 고정하고
$$f(\delta)=\delta e^{-\kappa\delta}$$를 최대화하자. 여기서 \(\delta\)는 체결당 마진이고, \(e^{-\kappa\delta}\)는 그 마진을 설정했을 때의 체결확률이다. 목적함수를 미분하면 곱미분법에 의해
$$f'(\delta)=1\cdot e^{-\kappa\delta}+\delta\cdot(-\kappa)e^{-\kappa\delta}=e^{-\kappa\delta}(1-\kappa\delta).$$지수항은 모든 \(\delta\)에서 양수이므로 일계조건 \(f'(\delta^*)=0\)은
$$1-\kappa\delta^*=0$$와 동치다. 따라서
$$\delta^*=\frac{1}{\kappa}.$$극대인지 확인하려면 한 번 더 미분한다.
$$f''(\delta)=(-\kappa)e^{-\kappa\delta}(1-\kappa\delta)+e^{-\kappa\delta}(-\kappa)=e^{-\kappa\delta}(\kappa^2\delta-2\kappa).$$최적점 \(\delta^*=1/\kappa\)를 대입하면
$$f''(\delta^*)=e^{-1}(\kappa-2\kappa)=-\kappa e^{-1}<0.$$따라서 \(\delta^*=1/\kappa\)는 진정한 최대점이다. 매수측과 매도측에 각각 적용하면 \(\delta^{\pm,*}=1/\kappa_\pm\)가 된다. \(\square\)
\(\kappa\)가 클수록 체결강도가 quote 거리 변화에 민감하다. 그럴수록 최적 quote는 mid에 더 가깝게 둔다. 최적 depth \(\delta^* = 1/\kappa\)는 LOB의 평균 depth와 일치한다. 이것이 마진 \(\times\) 체결률 최적화의 핵심 결론이다. 이 정태적 모형은 재고비용도, 정보 문제도, 다른 거래자와의 전략적 상호작용도 제거되어 있다. 이런 풍부한 요소들은 Part II의 동적 모형에서 다뤄진다.
limit order를 주문장에 올려두는 행위는 단지 "좋은 가격에 거래하겠다"는 것이 아니다. 두 가지 위험을 동시에 안는다. 첫 번째는 비체결위험(non-execution risk)으로, 원하는 가격에 주문을 내도 체결이 되지 않을 수 있다. 두 번째는 역선택위험(adverse selection risk)으로, 주문이 체결되었는데 그 체결이 상대가 더 좋은 정보를 갖고 있어서 일어난 것일 수 있다. 이 두 위험의 trade-off가 §2.1.4의 핵심이며, §2.3으로 자연스럽게 이어진다.
2.2 정보우위를 이용한 거래 — Kyle (1985)
지금까지는 정보 격차를 의도적으로 제거했다. 그러나 실제 거래의 많은 부분은 현금 수요 때문이 아니라, 한쪽이 현재 가격에 아직 반영되지 않은 정보를 더 잘 알고 있다고 믿기 때문에 발생한다. Kyle (1985)은 자산 가치에 대해 강력한 정보우위를 가진 거래자가 어떻게 최적으로 거래하는지, 그리고 가격이 어떻게 그 정보를 흡수하는지를 분석한 기준 모형이다.
자산의 최종 현금흐름 가치: \(v \sim N(\mu, \sigma_v^2)\). 세 유형의 참가자.
- 정보우위 거래자(insider): \(v\)를 정확히 알고 있으며 최적 주문량 \(x(v)\)를 선택한다.
- 가격무감형 유동성 거래자(noise trader): 가격과 무관하게 총수요 \(u \sim N(0, \sigma_u^2)\), \(u \perp v\)를 제출한다.
- 경쟁적 MM: 순 order flow만 관측하며 경쟁적으로 가격을 설정한다.
게임 순서: (i) insider가 \(v\)를 관측, (ii) \(x(v)\)를 선택, (iii) \(u\) 실현, (iv) MM이 순 order flow \(y = x(v) + u\)를 관측, (v) 경쟁적으로 가격 설정 \(S(y)\).
MM들은 insider의 존재를 알지만 누가 insider인지는 모른다. 경쟁적이고 위험중립인 MM의 zero-profit 조건(semi-strong efficiency)에서
$$S(y) = \mathbb{E}[v \mid y].$$이것이 Kyle 모형의 핵심 가격결정 원리다. 가격은 순 order flow라는 공개 정보를 조건으로 한 자산가치의 기댓값이다.
정규성 때문에 선형균형을 가정한다: \(x(v) = \beta(v - \mu)\), \(S(y) = \mu + \lambda y\). 이 가정이 자연스러운 이유는, 가우시안 환경에서 조건부기댓값이 선형이기 때문이다. 목표는 \(\beta, \lambda\)를 결정하는 것이다.
이 정리 2.6에서 쓰는 기본 객체와 가정부터 분명히 적는다. Kyle 모형의 기본 변수는 내부자 주문 \(x(v)\), 소음주문 \(u\sim N(0,\sigma_u^2)\), 총 주문흐름 \(y=x(v)+u\), 그리고 선형 가격규칙 \(S(y)=\mu+\lambda y\)다. 내부자는 \(v\)를 알고 자신의 이윤 \((v-S(y))x\)를 최대화하고, 시장조성자는 오직 공개된 \(y\)만 보고 \(\mathbb E[v\mid y]\)로 가격을 정한다.
유일한 선형균형은
$$x^*(v) = \frac{\sigma_u}{\sigma_v}(v - \mu), \qquad S(y) = \mu + \frac{\sigma_v}{2\sigma_u} y.$$즉 \(\beta = \sigma_u/\sigma_v\), \(\lambda = \sigma_v/(2\sigma_u)\)이다.
가정을 다시 적으면 유일한 선형균형은 즉 \(\beta = \sigma_u/\sigma_v\), \(\lambda = \sigma_v/(2\sigma_u)\)이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
선형균형을 \(x(v)=\beta(v-\mu)\), \(S(y)=\mu+\lambda y\)로 가정한다. 먼저 시장조성자의 가격규칙부터 구한다. 총주문흐름은 \(y=\beta(v-\mu)+u\)이고, \(v\)와 \(u\)는 jointly Gaussian이다. 선형-정규 환경에서는 조건부기댓값이 선형이므로
$$\mathbb E[v\mid y]=\mu+\frac{\operatorname{Cov}(v,y)}{\operatorname{Var}(y)}y.$$여기서
$$\operatorname{Cov}(v,y)=\operatorname{Cov}(v,\beta(v-\mu)+u)=\beta\sigma_v^2,$$ $$\operatorname{Var}(y)=\beta^2\sigma_v^2+\sigma_u^2.$$따라서 경쟁적 시장조성자의 가격은
$$S(y)=\mathbb E[v\mid y]=\mu+\frac{\beta\sigma_v^2}{\beta^2\sigma_v^2+\sigma_u^2}y,$$즉
$$\lambda=\frac{\beta\sigma_v^2}{\beta^2\sigma_v^2+\sigma_u^2}.\tag{1}$$이제 내부자의 최적화를 본다. 내부자가 \(v\)를 관측했을 때 주문량 \(x\)를 선택하면 기대이윤은
$$\mathbb E[(v-S(x+u))x\mid v]=(v-\mu-\lambda x)x.$$이를 \(x\)에 대한 이차식으로 보면
$$\psi(x)=(v-\mu)x-\lambda x^2.$$미분하면
$$\psi'(x)=v-\mu-2\lambda x.$$일계조건 \(\psi'(x)=0\)에서 최적주문은
$$x^*(v)=\frac{v-\mu}{2\lambda}.$$이계도함수는 \(\psi''(x)=-2\lambda<0\)이므로 최대점이다. 따라서 균형에서 \(\beta=1/(2\lambda)\)여야 한다. 이를 (1)에 대입하면
$$\lambda=\frac{\frac{1}{2\lambda}\sigma_v^2}{\frac{1}{4\lambda^2}\sigma_v^2+\sigma_u^2}.$$양변에 분모를 곱해 정리하면
$$\lambda\left(\frac{\sigma_v^2}{4\lambda^2}+\sigma_u^2\right)=\frac{\sigma_v^2}{2\lambda},$$ $$\frac{\sigma_v^2}{4\lambda}+\lambda\sigma_u^2=\frac{\sigma_v^2}{2\lambda},$$ $$\lambda\sigma_u^2=\frac{\sigma_v^2}{4\lambda},$$ $$4\lambda^2\sigma_u^2=\sigma_v^2.$$\(\lambda>0\)인 해를 취하면
$$\lambda=\frac{\sigma_v}{2\sigma_u},\qquad \beta=\frac{1}{2\lambda}=\frac{\sigma_u}{\sigma_v}.$$따라서 유일한 선형균형은
$$x^*(v)=\frac{\sigma_u}{\sigma_v}(v-\mu),\qquad S(y)=\mu+\frac{\sigma_v}{2\sigma_u}y$$이다. \(\square\)
Kyle's lambda \(\lambda\)는 순 order flow 한 단위 증가에 대한 가격 반응을 나타낸다. 이 파라미터는 두 가지 방향으로 해석된다.
가격충격 관점: \(\lambda\)가 클수록 같은 주문에도 가격이 더 크게 움직인다. 즉 시장의 유동성이 낮다. Grossman–Miller에서 \(\lambda = \gamma\sigma^2/n\)이었는데, 여기서는 \(\lambda = \sigma_v/(2\sigma_u)\)로 나타난다. 두 모형이 서로 다른 원천에서 같은 형태의 가격충격을 도출한다는 점이 흥미롭다.
역선택 관점: \(\sigma_v\)가 클수록(fundamental uncertainty가 클수록), \(\sigma_u\)가 작을수록(noise trading이 적을수록) \(\lambda\)가 커진다. MM은 order flow를 보고 "이 주문이 정보에 기반한 것일 가능성이 얼마나 되는가"를 Bayes 방식으로 판단하고, 그에 맞게 가격을 조정한다.
Insider 전략 관점: 유동성 노이즈 \(\sigma_u\)가 클수록 insider는 자신의 주문을 noise 속에 더 잘 위장할 수 있어 더 공격적으로 거래한다(\(\beta\)가 커진다). 반대로 noise가 적으면 insider가 조심스럽게 소량씩 분할해서 거래한다.
두 모형의 공통점은 가격이 order flow와 함께 움직인다는 것이다. 그러나 이유가 전혀 다르다. Grossman–Miller에서 가격충격은 재고위험 보상이고, Kyle에서 가격충격은 정보 역선택 비용이다. 두 모형 모두 order flow에 비례하는 선형 가격 이동을 예측하지만, 그 경제적 원천은 별개다. 실제 시장에서는 두 효과가 동시에 작용한다.
2.3 정보 열위 시장조성 — Glosten–Milgrom (1985)
Kyle 모형이 정보우위 거래자의 문제에 초점을 맞췄다면, Glosten and Milgrom (1985)은 정보에서 뒤처진 MM의 문제를 전면에 놓는다. MM은 어떻게 bid와 ask를 설정하는가? 더 잘 아는 상대와 거래할 때 어떻게 자신을 보호하는가?
설정을 단순하게 만들기 위해 자산의 미래가치는 두 값 중 하나만 가진다고 하자.
자산 가치: \(v \in \{V_H, V_L\}\), \(V_H > V_L\). 사전확률: \(P(v = V_H) = p\). 모든 주문은 1단위. MM은 ask에 1단위 매도 LO, bid에 1단위 매수 LO를 제출한다.
인구 비율: informed \(\alpha\)명, uninformed \(1-\alpha\)명.
- Informed trader: \(v = V_H\)이면 반드시 buy(ask 치기), \(v = V_L\)이면 반드시 sell(bid 치기).
- Uninformed trader: 확률 1/2로 buy, 1/2로 sell (가격무감적).
경쟁적 MM들이 기대이윤을 0으로 만드는 zero-profit 조건을 사용한다. ask와 bid를 \(a = \mu + \Delta_a\), \(b = \mu - \Delta_b\)로 나타내면(여기서 \(\mu = \mathbb{E}[v]\)는 공개 정보에 기반한 현재 자산 기대가치), half-spread를 결정하는 조건을 도출할 수 있다.
이 정리 2.7에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리에서 숨은 상태는 자산의 근본가치 \(v\), 관측되는 신호는 매수사건 \(B\) 또는 매도사건 \(S\)다. 경쟁적인 시장조성자는 거래 상대방에게 기대이윤을 남기지 않는 zero-profit 호가를 제시하므로 ask와 bid는 각각 \(\mathbb E[v\mid B]\), \(\mathbb E[v\mid S]\) 또는 여기에 재고비용 조정항을 더한 값으로 결정된다. posterior \(\mu_B,\mu_S\)는 주문방향을 본 뒤 \(V_H\)가 실현되었을 확률이다.
가정을 다시 적으면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
가치가 높은 상태 \(v=V_H\)에서는 정보거래자가 항상 매수하고, 가치가 낮은 상태 \(v=V_L\)에서는 항상 매도한다. 한편 유동성거래자는 각 방향을 확률 \(1/2\)로 선택한다. 정보거래자가 도착할 확률이 \(\alpha\), 유동성거래자가 도착할 확률이 \(1-\alpha\)이므로, \(v=V_H\)에서 매수주문이 도착할 조건부확률은
$$P(B\mid V_H)=\alpha\cdot1+(1-\alpha)\cdot\frac12=\frac{1+\alpha}{2}.$$같은 상태에서 매도주문은 오직 유동성거래자로부터만 오므로
$$P(S\mid V_H)=\alpha\cdot0+(1-\alpha)\cdot\frac12=\frac{1-\alpha}{2}.$$상태가 \(v=V_L\)이면 내부자의 방향이 뒤집히므로
$$P(B\mid V_L)=\frac{1-\alpha}{2},\qquad P(S\mid V_L)=\frac{1+\alpha}{2}.$$즉 높은 가치 상태에서는 매수주문이 상대적으로 더 자주 나타나고, 낮은 가치 상태에서는 매도주문이 상대적으로 더 자주 나타난다. \(\square\)
이제 buy order가 들어왔을 때의 사후확률을 계산하자. 이것이 MM이 ask를 결정하는 핵심 입력이다.
이 정리 2.8에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리에서 숨은 상태는 자산의 근본가치 \(v\), 관측되는 신호는 매수사건 \(B\) 또는 매도사건 \(S\)다. 경쟁적인 시장조성자는 거래 상대방에게 기대이윤을 남기지 않는 zero-profit 호가를 제시하므로 ask와 bid는 각각 \(\mathbb E[v\mid B]\), \(\mathbb E[v\mid S]\) 또는 여기에 재고비용 조정항을 더한 값으로 결정된다. posterior \(\mu_B,\mu_S\)는 주문방향을 본 뒤 \(V_H\)가 실현되었을 확률이다.
경쟁적 zero-profit MM의 ask price: \(a = \mathbb{E}[v \mid B] = \mu_B V_H + (1-\mu_B) V_L\).
가정을 다시 적으면 경쟁적 zero-profit MM의 ask price: \(a = \mathbb{E}[v \mid B] = \mu_B V_H + (1-\mu_B) V_L\). 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
사후확률 \(\mu_B=P(v=V_H\mid B)\)에 Bayes 공식을 적용한다.
$$\mu_B=\frac{P(B\mid V_H)P(v=V_H)}{P(B)}=\frac{P(B\mid V_H)\mu}{P(B)}.$$정리 2.7에서 \(P(B\mid V_H)=(1+\alpha)/2\)이고, 전체확률의 법칙으로
$$P(B)=P(B\mid V_H)\mu+P(B\mid V_L)(1-\mu).$$여기에 \(P(B\mid V_L)=(1-\alpha)/2\)를 대입하면
$$P(B)=\frac{1+\alpha}{2}\mu+\frac{1-\alpha}{2}(1-\mu).$$괄호를 전개해 정리하면
$$P(B)=\frac{1+\alpha\mu+1-\alpha-\mu+\alpha\mu}{2}=\frac{1+\alpha(2\mu-1)}{2}.$$따라서
$$\mu_B=\frac{\frac{1+\alpha}{2}\mu}{\frac{1+\alpha(2\mu-1)}{2}}=\frac{\mu(1+\alpha)}{1+\alpha(2\mu-1)}.$$경쟁적인 시장조성자는 기대이윤이 0이 되도록 ask를 설정하므로 ask price는 buy가 왔다는 사실까지 반영한 조건부기댓값이다. 즉
$$a=\mathbb E[v\mid B]=\mu_BV_H+(1-\mu_B)V_L.$$이것이 원하는 식이다. \(\square\)
이 정리 2.9에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리에서 숨은 상태는 자산의 근본가치 \(v\), 관측되는 신호는 매수사건 \(B\) 또는 매도사건 \(S\)다. 경쟁적인 시장조성자는 거래 상대방에게 기대이윤을 남기지 않는 zero-profit 호가를 제시하므로 ask와 bid는 각각 \(\mathbb E[v\mid B]\), \(\mathbb E[v\mid S]\) 또는 여기에 재고비용 조정항을 더한 값으로 결정된다. posterior \(\mu_B,\mu_S\)는 주문방향을 본 뒤 \(V_H\)가 실현되었을 확률이다.
Competitive bid: \(b = \mathbb{E}[v \mid S] = \mu_S V_H + (1-\mu_S) V_L\).
가정을 다시 적으면 Competitive bid: \(b = \mathbb{E}[v \mid S] = \mu_S V_H + (1-\mu_S) V_L\). 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
매도사건 \(S\)에 대해 같은 계산을 반복한다. Bayes 공식으로
$$\mu_S=P(v=V_H\mid S)=\frac{P(S\mid V_H)\mu}{P(S)}.$$정리 2.7에서 \(P(S\mid V_H)=(1-\alpha)/2\), \(P(S\mid V_L)=(1+\alpha)/2\)이므로 전체확률의 법칙에 의해
$$P(S)=\frac{1-\alpha}{2}\mu+\frac{1+\alpha}{2}(1-\mu)=\frac{1-\alpha(2\mu-1)}{2}.$$따라서
$$\mu_S=\frac{\frac{1-\alpha}{2}\mu}{\frac{1-\alpha(2\mu-1)}{2}}=\frac{\mu(1-\alpha)}{1-\alpha(2\mu-1)}.$$경쟁적 bid는 매도사건을 조건으로 한 기대가치이므로
$$b=\mathbb E[v\mid S]=\mu_SV_H+(1-\mu_S)V_L.$$즉 매도주문은 \(V_H\)의 posterior를 낮추고, 그만큼 bid도 내려간다. \(\square\)
이 정리 2.10에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리에서 숨은 상태는 자산의 근본가치 \(v\), 관측되는 신호는 매수사건 \(B\) 또는 매도사건 \(S\)다. 경쟁적인 시장조성자는 거래 상대방에게 기대이윤을 남기지 않는 zero-profit 호가를 제시하므로 ask와 bid는 각각 \(\mathbb E[v\mid B]\), \(\mathbb E[v\mid S]\) 또는 여기에 재고비용 조정항을 더한 값으로 결정된다. posterior \(\mu_B,\mu_S\)는 주문방향을 본 뒤 \(V_H\)가 실현되었을 확률이다.
\(\mu = 1/2\)이면
$$a - b = \alpha(V_H - V_L).$$가정을 다시 적으면 \(\mu = 1/2\)이면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
대칭 prior는 \(\mu=1/2\)라는 뜻이다. 정리 2.8과 정리 2.9의 posterior 식에 \(\mu=1/2\)를 대입하면 분모의 \(2\mu-1\) 항이 0이 되어
$$\mu_B=\frac{1+\alpha}{2},\qquad \mu_S=\frac{1-\alpha}{2}.$$이제 ask와 bid를 각각 계산한다.
$$a=\mu_BV_H+(1-\mu_B)V_L=\frac{1+\alpha}{2}V_H+\frac{1-\alpha}{2}V_L,$$ $$b=\mu_SV_H+(1-\mu_S)V_L=\frac{1-\alpha}{2}V_H+\frac{1+\alpha}{2}V_L.$$두 식을 빼면
$$\begin{aligned} a-b&=\left(\frac{1+\alpha}{2}-\frac{1-\alpha}{2}\right)V_H+\left(\frac{1-\alpha}{2}-\frac{1+\alpha}{2}\right)V_L\ &=\alpha V_H-\alpha V_L=\alpha(V_H-V_L). \end{aligned}$$따라서 대칭 prior 아래 spread는 독성 빈도 \(\alpha\)와 상태 간 가치차 \(V_H-V_L\)의 곱으로 정확히 주어진다. \(\square\)
spread의 크기는 두 가지 요소의 곱으로 결정된다. 독성의 빈도 \(\alpha\)(informed trader의 비중)와 독성의 크기 \(V_H - V_L\)(fundamental uncertainty). MM이 spread를 벌리는 것은 단순한 이익 추구가 아니라, 더 잘 아는 상대와 거래할 때 평균적으로 당하는 손실을 상쇄하기 위한 보험료 역할이다.
중요한 관찰: buy order가 들어오면 \(\mu_B > \mu > \mu_S\)가 성립한다. Bayes 갱신에서 buy는 \(V_H\)의 확률을 올리고 sell은 내린다. 이 비대칭이 spread의 존재를 설명한다. 만약 \(\alpha = 0\)이면 spread는 0이 된다. 정보 비대칭이 없다면 경쟁적 시장에서 MM은 spread를 벌 수 없다.
이제 정보 효과와 재고 효과를 통합한 quote 공식을 보자.
이 정리 2.11에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리에서 숨은 상태는 자산의 근본가치 \(v\), 관측되는 신호는 매수사건 \(B\) 또는 매도사건 \(S\)다. 경쟁적인 시장조성자는 거래 상대방에게 기대이윤을 남기지 않는 zero-profit 호가를 제시하므로 ask와 bid는 각각 \(\mathbb E[v\mid B]\), \(\mathbb E[v\mid S]\) 또는 여기에 재고비용 조정항을 더한 값으로 결정된다. posterior \(\mu_B,\mu_S\)는 주문방향을 본 뒤 \(V_H\)가 실현되었을 확률이다.
Inventory \(q\), inventory cost \(C(q)\), 체결 사건 \(B\) 또는 \(S\)가 있을 때
$$a(q) = \mathbb{E}[v \mid B] + C(q-1) - C(q), \qquad b(q) = \mathbb{E}[v \mid S] + C(q) - C(q+1).$$가정을 다시 적으면 Inventory \(q\), inventory cost \(C(q)\), 체결 사건 \(B\) 또는 \(S\)가 있을 때 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
inventory가 현재 \(q\)이고, 시장조성자의 재고비용이 \(C(q)\)라고 하자. 먼저 ask를 유도한다. buy order가 ask에서 체결되면 시장조성자는 한 주를 팔기 때문에 체결 직후 재고가 \(q-1\)이 된다. buy가 발생한 상태에서 그 후 보유포지션의 기대가치는 \((q-1)\mathbb E[v\mid B]-C(q-1)\)이다.
반면 체결 전 현재 포지션의 기대가치는 \(q\mathbb E[v\mid B]-C(q)\)다. 경쟁적 무차별 조건은 체결 직전 가치와 체결가격 plus 체결 직후 가치가 같아야 한다는 것이므로
$$a(q)+(q-1)\mathbb E[v\mid B]-C(q-1)=q\mathbb E[v\mid B]-C(q).$$이 식을 \(a(q)\)에 대해 풀면
$$a(q)=\mathbb E[v\mid B]+C(q-1)-C(q).$$이제 bid를 본다. sell order가 bid에서 체결되면 시장조성자는 한 주를 사므로 재고가 \(q+1\)이 된다. sell이 발생한 상태에서 무차별 조건은
$$-b(q)+(q+1)\mathbb E[v\mid S]-C(q+1)=q\mathbb E[v\mid S]-C(q).$$이를 정리하면
$$b(q)=\mathbb E[v\mid S]+C(q)-C(q+1).$$따라서 총 호가는 정보에 의한 조건부기댓값과, 재고를 한 단위 줄이거나 늘릴 때의 한계재고비용 차이가 더해진 형태로 분해된다. \(\square\)
\(C(q) = \frac{\kappa}{2}q^2\)일 때 명시형: \(a(q) = \mathbb{E}[v|B] - \kappa q + \kappa/2\), \(b(q) = \mathbb{E}[v|S] - \kappa q - \kappa/2\). 따라서
$$a(q) - b(q) = \underbrace{(\mathbb{E}[v|B] - \mathbb{E}[v|S])}_{\text{adverse selection spread}} + \underbrace{\kappa}_{\text{inventory spread}}.$$시장조성자의 총 spread는 두 성분의 합이다. Adverse selection spread는 주문이 드러내는 정보를 반영하고, inventory spread는 재고 위험을 보상한다. Market making = inventory management + adverse selection management.
2.3.1 가격 동학 (Price Dynamics)
이제 Glosten–Milgrom 모형에 시간 차원을 추가한다. MM들은 서로 다른 buy/sell 주문 시퀀스를 관측하면서 Bayes 업데이트를 통해 \(v\)의 분포를 조정한다. 이자율을 0으로 두고, 자산의 현금가치가 결정되는 시점을 \(T\)로 놓는다.
시점 \(t\)의 공개 정보를 filtration \(\mathcal{F}_t\)로 나타내면, MM들은 순 order flow 시퀀스를 관측할 때마다 Bayes 갱신을 통해 \(P_t = P(v = V_H \mid \mathcal{F}_t)\)와 효율가격 \(\mu_t = \mathbb{E}[v \mid \mathcal{F}_t]\)를 업데이트한다.
동적 호가는
$$a_t = \mathbb{E}[v \mid \mathcal{F}_t, \text{buy at }t], \qquad b_t = \mathbb{E}[v \mid \mathcal{F}_t, \text{sell at }t].$$체결이 일어날 때마다 filtration이 갱신되고 호가가 동적으로 조정된다.
이 정리 2.12에서 쓰는 기본 객체와 가정부터 분명히 적는다. 마팅게일은 현재 정보 \(\mathcal F_s\)까지 알고 있을 때 미래의 조건부기댓값이 현재값과 정확히 일치하는 과정이다. 즉 \((M_t)\)가 마팅게일이라는 말은 \(\mathbb E[M_t\mid\mathcal F_s]=M_s\)가 모든 \(s\le t\)에 대해 성립한다는 뜻이다. 효율가격 \(\mu_t=\mathbb E[v\mid\mathcal F_t]\)는 바로 이 정의를 만족하는 전형적인 예다.
효율가격 과정 \((\mu_t)\)는 \((\mathcal{F}_t)\)-martingale이다. 따라서 실현 체결가격 과정도 적절한 filtration에 대해 martingale이다.
가정을 다시 적으면 효율가격 과정 \((\mu_t)\)는 \((\mathcal{F}_t)\)-martingale이다. 따라서 실현 체결가격 과정도 적절한 filtration에 대해 martingale이다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
효율가격을 \(\mu_t=\mathbb E[v\mid\mathcal F_t]\)로 정의하면, 이것이 마팅게일이라는 사실은 Part A의 정리 A.5.3에서 이미 증명했다. 여기서는 그 결론을 다시 한 줄씩 써 보인다.
먼저 \(\mu_t\)는 \(\mathcal F_t\)-가측이고 적분가능하다. 이제 \(s\le t\)에서 tower property를 적용하면
$$\mathbb E[\mu_t\mid\mathcal F_s]=\mathbb E\bigl[\mathbb E[v\mid\mathcal F_t]\mid\mathcal F_s\bigr]=\mathbb E[v\mid\mathcal F_s]=\mu_s.$$따라서 \((\mu_t)\)는 \((\mathcal F_t)\)-마팅게일이다. 실현 체결가격은 buy나 sell이라는 사건까지 filtration에 포함시켜 조건부기댓값을 취한 값이므로, 그때그때의 자연 filtration에 대해 동일한 공정성 관계를 만족한다. 즉 가격은 새로운 정보가 들어오면 뛰지만, 현재 정보까지 알고 난 뒤의 미래 평균변화는 0이다. \(\square\)
이 정리 2.13에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리에서 숨은 상태는 자산의 근본가치 \(v\), 관측되는 신호는 매수사건 \(B\) 또는 매도사건 \(S\)다. 경쟁적인 시장조성자는 거래 상대방에게 기대이윤을 남기지 않는 zero-profit 호가를 제시하므로 ask와 bid는 각각 \(\mathbb E[v\mid B]\), \(\mathbb E[v\mid S]\) 또는 여기에 재고비용 조정항을 더한 값으로 결정된다. posterior \(\mu_B,\mu_S\)는 주문방향을 본 뒤 \(V_H\)가 실현되었을 확률이다.
직전 prior가 \(\mu\), buy 후 posterior \(\mu_B\), sell 후 posterior \(\mu_S\)라 하면
$$\mu_B - \mu_- = (\mu_B - \mu)(V_H - V_L), \qquad \mu_S - \mu_- = (\mu_S - \mu)(V_H - V_L).$$가정을 다시 적으면 직전 prior가 \(\mu\), buy 후 posterior \(\mu_B\), sell 후 posterior \(\mu_S\)라 하면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
buy 직전의 효율가격을
$$p_-:=\mu V_H+(1-\mu)V_L$$라 두고, buy가 관측된 뒤의 가격을
$$p_B:=\mu_BV_H+(1-\mu_B)V_L$$라 두자. 두 가격의 차이를 직접 계산하면
$$\begin{aligned} p_B-p_-&=\bigl(\mu_BV_H+(1-\mu_B)V_L\bigr)-\bigl(\mu V_H+(1-\mu)V_L\bigr)\ &=(\mu_B-\mu)V_H- (\mu_B-\mu)V_L\ &=(\mu_B-\mu)(V_H-V_L). \end{aligned}$$sell의 경우도 완전히 같은 방식으로
$$p_S-p_-=(\mu_S-\mu)(V_H-V_L)$$를 얻는다. 즉 가격점프의 크기는 posterior 확률이 얼마나 움직였는지와 상태 간 가치차가 얼마나 큰지의 곱이다. \(\square\)
이 정리 2.14에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리에서 숨은 상태는 자산의 근본가치 \(v\), 관측되는 신호는 매수사건 \(B\) 또는 매도사건 \(S\)다. 경쟁적인 시장조성자는 거래 상대방에게 기대이윤을 남기지 않는 zero-profit 호가를 제시하므로 ask와 bid는 각각 \(\mathbb E[v\mid B]\), \(\mathbb E[v\mid S]\) 또는 여기에 재고비용 조정항을 더한 값으로 결정된다. posterior \(\mu_B,\mu_S\)는 주문방향을 본 뒤 \(V_H\)가 실현되었을 확률이다.
가정을 다시 적으면 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
가격변화를 \(\Delta\mu_t:=\mu_t-\mu_{t-1}\)로 두자. 이미 정리 2.12에서 \((\mu_t)\)가 \((\mathcal F_t)\)-마팅게일임을 보였다. 따라서
$$\mathbb E[\mu_t\mid\mathcal F_{t-1}]=\mu_{t-1}.$$이 식의 양변에서 \(\mu_{t-1}\)를 빼면
$$\mathbb E[\mu_t-\mu_{t-1}\mid\mathcal F_{t-1}]=0,$$즉
$$\mathbb E[\Delta\mu_t\mid\mathcal F_{t-1}]=0.$$따라서 가격변화는 예측 가능한 drift가 아니라 오직 새 정보가 유입되었을 때 발생하는 surprise다. \(\square\)
마지막으로 위 계산은 가정에서 요구한 모든 조건을 정확히 사용했고, 따라서 정리의 결론이 그대로 따라온다.
가격은 주문이 들어왔다는 사실 자체 때문에 기계적으로 움직이는 것이 아니라, 그 주문이 만들어 낸 posterior belief 변화량만큼 움직인다. Buy order가 오면 \(\mu_B > \mu\)이므로 가격이 상승하고, sell order가 오면 \(\mu_S < \mu\)이므로 가격이 하락한다. 이것이 가격변화 = 정보 surprise라는 명제다.
또한 \(\mu_B > \mu > \mu_S\)라는 사실은 buy와 sell 주문이 항상 반대 방향으로 가격을 움직인다는 것을 뜻한다. Spread의 존재가 이 비대칭에서 자연스럽게 나온다.
실현 체결가격(\(a_t\) 또는 \(b_t\))의 martingale성과 효율가격 \(\mu_t\)의 martingale성은 서로 다른 filtration에 대한 명제이므로 구분해서 읽어야 한다. \(\mu_t\)는 체결 전 공개 정보만 반영한 공정가치이고, \(a_t, b_t\)는 체결 사건 자체까지 포함한 조건부평균이다.
시점 \(t\)에서 prior가 \(\mu_t = \mathbb{E}[v \mid \mathcal{F}_t]\)라 하자. 다음 주문 관측 \(Y_{t+1}\)이 들어오면 새 filtration이 만들어지고
$$\mu_{t+1} = \mathbb{E}[v \mid \mathcal{F}_t \vee \sigma(Y_{t+1})].$$가격변화 \(\Delta \mu_{t+1} = \mu_{t+1} - \mu_t\)는 Tower property로부터 \(\mathbb{E}[\Delta \mu_{t+1} \mid \mathcal{F}_t] = 0\)이 성립한다. 즉 예측 가능한 drift가 없다. 다만 실현 경로에서는 order flow가 오면 가격이 점프하거나 이동할 수 있다. 이것이 가격 동학의 본질이다.
2.3.2 가격민감 유동성 거래자 (Price Sensitive Liquidity Traders)
지금까지의 모형은 유동성 거래자가 "무슨 가격이든 반드시 거래한다"고 가정했다. 이제 이 단순화를 버린다. 각 유동성 거래자 \(i\)는 거래를 완수했을 때 얻는 외생적 현금등가 편익(urgency parameter) \(C_i\)를 가진다. 만약 half-spread \(\Delta\)가 이 편익보다 크면 그 거래자는 거래를 포기한다.
urgency parameter \(C\)의 누적분포함수를 \(F\), 밀도함수를 \(f\)라 두자. Ask가 \(a = \mu + \Delta_a\)일 때 유동성 매수자는 \(C \ge \Delta_a\)이면 거래한다. 따라서 실제 ask hit 강도는
$$\lambda_+(a) = \Lambda \cdot P(C \ge \Delta_a) = \Lambda(1 - F(\Delta_a))$$이며, quote가 높아질수록 체결강도도 떨어진다.
이 정리 2.15에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리들에서 \(F\)는 고객의 체결의향 또는 reservation value의 누적분포함수이고, \(f=F'\)는 밀도함수다. 참여비율 \(\pi(\Delta)=1-F(\Delta)\)는 half-spread \(\Delta\)가 커질수록 줄어드는 체결확률이다. inverse hazard rate \((1-F(\Delta))/f(\Delta)\)는 마진을 키웠을 때 수요가 얼마나 빨리 사라지는지를 요약하는 지표다.
\(F\)가 증가함수이면 참여비율 \(\pi(\Delta) := 1 - F(\Delta)\)는 \(\Delta\)의 감소함수다.
가정을 다시 적으면 \(F\)가 증가함수이면 참여비율 \(\pi(\Delta) := 1 - F(\Delta)\)는 \(\Delta\)의 감소함수다. 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
참여비율을 \(\pi(\Delta)=1-F(\Delta)\)로 정의하자. \(F\)가 누적분포함수이므로 단조증가한다는 것은 \(\Delta_1<\Delta_2\)이면
$$F(\Delta_1)\le F(\Delta_2)$$가 성립한다는 뜻이다. 이 부등식의 양변에 \(-1\)을 곱하고 1을 더하면 부등호 방향이 바뀌어
$$1-F(\Delta_1)\ge 1-F(\Delta_2)$$를 얻는다. 즉
$$\pi(\Delta_1)\ge \pi(\Delta_2),$$따라서 \(\pi\)는 \(\Delta\)의 감소함수다.
만약 \(F\)가 미분가능하면 미분하여도 같은 결론이 나온다.
$$\pi'(\Delta)=\frac{d}{d\Delta}(1-F(\Delta))=-f(\Delta)\le 0.$$즉 quote를 멀리 둘수록 참여확률, 곧 체결강도가 약해진다. \(\square\)
가격민감 유동성 거래자를 포함하면 MM의 zero-profit 조건이 달라진다. 기존 ask half-spread 공식에 uninformed buy 집단의 크기가 줄어든 것을 반영해야 한다.
이 정리 2.16에서 쓰는 기본 객체와 가정부터 분명히 적는다. 이 정리들에서 \(F\)는 고객의 체결의향 또는 reservation value의 누적분포함수이고, \(f=F'\)는 밀도함수다. 참여비율 \(\pi(\Delta)=1-F(\Delta)\)는 half-spread \(\Delta\)가 커질수록 줄어드는 체결확률이다. inverse hazard rate \((1-F(\Delta))/f(\Delta)\)는 마진을 키웠을 때 수요가 얼마나 빨리 사라지는지를 요약하는 지표다.
MM의 ask side 기대이익 \(g(\Delta_a) = \Delta_a (1 - F(\Delta_a))\)를 최대화하는 최적 half-spread \(\Delta_a^*\)는
$$1 - F(\Delta_a^*) = \Delta_a^* \cdot f(\Delta_a^*), \qquad \text{즉} \qquad \Delta_a^* = \frac{1 - F(\Delta_a^*)}{f(\Delta_a^*)}.$$가정을 다시 적으면 MM의 ask side 기대이익 \(g(\Delta_a) = \Delta_a (1 - F(\Delta_a))\)를 최대화하는 최적 half-spread \(\Delta_a^*\)는 이다. 이제 목표는 이 결론이 왜 성립하는지를 중간 단계를 건너뛰지 않고 확인하는 것이다. 아래에서는 정의에서 출발하여 각 등식이 성립하는 이유와 사용한 성질을 한 줄씩 분리해서 적는다.
ask side에서 상수배를 제외한 기대이익은
$$g(\Delta_a)=\Delta_a\bigl(1-F(\Delta_a)\bigr)$$이다. 첫 번째 항 \(\Delta_a\)는 건당 마진이고, 두 번째 항 \(1-F(\Delta_a)\)는 그 마진을 제시했을 때 거래가 실제로 성사될 확률이다. 최적 \(\Delta_a^*\)를 구하려면 \(g\)를 미분한다. 곱미분법을 쓰면
$$g'(\Delta_a)=1\cdot(1-F(\Delta_a))+\Delta_a\cdot(-f(\Delta_a))=(1-F(\Delta_a)) - \Delta_a f(\Delta_a).$$내부해 \(\Delta_a^*\)에서는 일계조건 \(g'(\Delta_a^*)=0\)이 필요하므로
$$1-F(\Delta_a^*)=\Delta_a^*f(\Delta_a^*).$$양변을 \(f(\Delta_a^*)\)로 나누면
$$\Delta_a^*=\frac{1-F(\Delta_a^*)}{f(\Delta_a^*)}.$$오른쪽은 바로 inverse hazard rate이다. 따라서 최적 markup은 남아 있는 수요꼬리의 크기를 그 지점의 밀도로 나눈 값과 일치한다. \(\square\)
최적 markup은 "가격을 조금 올렸을 때 수요가 얼마나 빨리 사라지는가"로 결정된다. Hazard rate \(f(\Delta_a)/(1-F(\Delta_a))\)가 클수록 최적 markup이 낮아진다. 즉 MM이 spread를 넓히면 adverse selection 방어에는 유리하지만, 동시에 유동성 고객이 줄어들어 거래기회가 감소한다. 이 trade-off가 spread 결정의 핵심이다.
urgency parameter가 충분히 작은 집단의 경우, 위 방정식은 극단적인 해 \(\Delta_a = V_H - \mu\), \(\Delta_b = \mu - V_L\)만 가질 수 있다. 이 spread에서는 어떤 uninformed 거래자도 거래 이득이 없다. 남는 거래는 informed trader가 무차별한 상태에서 하는 거래뿐이며, 그 체결 즉시 자산가치가 드러나 가격은 strong-efficient가 된다.
이것이 market collapse다. 그 메커니즘은 thin market → higher toxicity → wider spread → thinner market의 악순환이다. 정보 비대칭이 극단적일 때 시장이 완전히 작동하지 않을 수 있다는 이 결론은, 단순한 이론적 흥미를 넘어 실제 시장 설계에서 중요한 함의를 가진다. 가격민감 유동성 거래자의 존재는 이 붕괴를 막는 완충장치이며, 이들이 시장에 참여함으로써 시장 자체가 유지된다.
이 장의 두 축이 하나의 결론으로 수렴한다.
재고 축(Grossman–Miller): 재고위험이 spread와 price concession을 만드는 이유를 설명한다. 경쟁이 클수록, 위험회피가 낮을수록, 변동성이 낮을수록 유동성 프리미엄이 줄어든다. 최적 LO 위치는 마진과 체결률의 곱을 최대화하는 \(\delta^* = 1/\kappa\)에서 결정된다.
정보 축(Kyle → Glosten–Milgrom): Kyle은 정보우위 거래자가 optimal하게 주문을 분산하고, 가격이 order flow에 선형으로 반응함을 보인다(\(\lambda = \sigma_v/2\sigma_u\)). Glosten–Milgrom은 MM이 주문 자체를 정보로 읽어 posterior mean으로 가격을 설정함을 보인다. 두 모형 모두 \(a = \mathbb{E}[v \mid B]\), \(b = \mathbb{E}[v \mid S]\)라는 한 공식으로 수렴한다.
통합 결과: 실제 시장조성 quote는 두 요소의 합이다.
$$a(q) = \mathbb{E}[v|B] + C(q-1) - C(q), \qquad b(q) = \mathbb{E}[v|S] + C(q) - C(q+1).$$정보 신호와 재고 상태를 동시에 반영해야 하며, 이것이 뒤 장들의 동적 최적 시장조성 문제의 출발점이다. 가격변화는 예측 가능한 드리프트 없이 오직 새로운 정보 유입에 의해서만 발생하며, 이 사실이 효율가격의 martingale성으로 수학적으로 표현된다.
'Financial Engineering > ALGORITHMIC AND HIGH-FREQUENCY TRADING' 카테고리의 다른 글
| Chapter 6. Optimal Execution with Continuous Trading I (0) | 2026.03.22 |
|---|---|
| Chapter 5. Stochastic Optimal Control and Stopping (0) | 2026.03.22 |
| Chapter 4. Empirical and Statistical Evidence: Activity and Market Quality (0) | 2026.03.22 |
| Chapter 3. Empirical and Statistical Evidence: Prices and Returns (0) | 2026.03.22 |
| Chapter 1. Electronic Markets and the Limit Order Book (0) | 2026.03.22 |