본문 바로가기

Financial Engineering/ALGORITHMIC AND HIGH-FREQUENCY TRADING

Chapter 4. Empirical and Statistical Evidence: Activity and Market Quality

 

Algorithmic and High-Frequency Trading
Chapter 4. Empirical and Statistical Evidence: Activity and Market Quality

이 장을 읽기 전에

제4장은 거래량, 시장구조 지표, 스프레드, 변동성, 시장 심도, 가격충격, 취소 활동, 숨겨진 주문을 데이터로 분석하는 실증 장이다. 수식 도구로는 OLS 회귀, 시계열 통계, 분포 추정, 생존 함수, 가격충격 선형 회귀가 등장한다. Part A는 이 분석들이 기반으로 삼는 통계적·계량경제학적 선수지식을 정리한다.


Part A — 선수지식


1. 기술통계량 — 분포의 다섯 얼굴

어떤 변수의 표본을 들여다볼 때 가장 먼저 해야 할 일은 그 분포를 요약하는 것이다. 제4장에서는 스프레드, 거래량, 변동성 등의 분포를 기술통계량으로 요약한 표들이 반복 등장한다. 이 표들에서 사용되는 통계량들을 정확히 이해해야 숫자를 읽을 수 있다.

정의 1.1 — 표본 평균, 분산, 표준편차

크기 \(n\)인 표본 \(\{x_1, x_2, \ldots, x_n\}\)에 대해:

\[\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i, \qquad s^2 = \frac{1}{n-1}\sum_{i=1}^n (x_i - \bar{x})^2, \qquad s = \sqrt{s^2}\]

표본평균은 분포의 중심을, 표본표준편차는 퍼짐 정도를 나타낸다.

정의 1.2 — 분위수 (Quantile)

표본을 오름차순 정렬했을 때 하위 \(p \times 100\%\)에 해당하는 값을 \(p\)-분위수 또는 \(p\)-퍼센타일이라 한다. 주요 분위수:

  • \(Q1\) (제1사분위수): 하위 25% 값, 즉 25번째 퍼센타일
  • Median (중위수): 하위 50% 값, 즉 50번째 퍼센타일
  • \(Q3\) (제3사분위수): 하위 75% 값, 즉 75번째 퍼센타일
  • P01, P99: 각각 1번째, 99번째 퍼센타일

사분위범위(IQR)는 \(IQR = Q3 - Q1\)이며, 이상치에 강건한 퍼짐의 척도다.

정의 1.3 — 왜도와 첨도
\[\text{Skewness} = \frac{1}{n}\sum_{i=1}^n\left(\frac{x_i - \bar{x}}{s}\right)^3, \qquad \text{Kurtosis} = \frac{1}{n}\sum_{i=1}^n\left(\frac{x_i - \bar{x}}{s}\right)^4\]

왜도는 분포의 비대칭성을 나타낸다. 양의 왜도는 오른쪽 꼬리가 두꺼운 것을 의미한다. 첨도는 꼬리의 두께를 측정한다. 정규분포의 첨도는 3이며, 초과 첨도(excess kurtosis)는 첨도에서 3을 뺀 값이다. 제4장에서 등장하는 고빈도 거래량 데이터는 왜도 6.14, 첨도 60.83의 극단적 값을 보인다.

왜 평균과 표준편차만으로 충분하지 않은가

금융 시계열 데이터, 특히 거래량이나 스프레드 같은 변수들은 정규분포를 따르지 않는다. 이들은 오른쪽으로 긴 꼬리를 가지며(right-skewed), 이상치가 빈번하다. 이런 경우 평균과 표준편차는 대표성이 낮고, 중위수와 IQR이 더 신뢰할 만한 요약통계량이다. 제4장의 모든 표들이 평균·표준편차와 함께 P01, Q1, 중위수, Q3, P99를 함께 보고하는 이유가 바로 이것이다.


2. OLS 회귀와 강건 회귀

제4장 4.1절에서는 일별 거래량과 변동성의 관계를 회귀분석으로 추정한다. 이 절의 회귀 모형들을 이해하려면 OLS와 강건 회귀(robust regression)의 원리를 알아야 한다.

정의 2.1 — 선형 회귀 모형

피설명변수(종속변수) \(y_t\)와 설명변수(독립변수) 벡터 \(\mathbf{x}_t = (x_{1t}, x_{2t}, \ldots, x_{kt})'\)의 관계를:

\[y_t = \alpha + \beta_1 x_{1t} + \beta_2 x_{2t} + \cdots + \beta_k x_{kt} + \varepsilon_t, \qquad t = 1, \ldots, T\]

로 모형화한다. 여기서 \(\alpha\)는 절편, \(\beta_j\)는 각 설명변수의 기울기 계수, \(\varepsilon_t\)는 오차항이다.

OLS 추정량 (Ordinary Least Squares)

OLS는 잔차 제곱합(RSS)을 최소화하는 계수 벡터 \(\hat{\boldsymbol{\beta}}\)를 구한다:

\[\hat{\boldsymbol{\beta}}_{OLS} = \arg\min_{\boldsymbol{\beta}} \sum_{t=1}^T (y_t - \mathbf{x}_t' \boldsymbol{\beta})^2 = (\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'\mathbf{y}\]

여기서 \(\mathbf{X}\)는 설명변수 행렬, \(\mathbf{y}\)는 피설명변수 벡터다. OLS의 핵심 가정은 (i) 오차항의 독립성, (ii) 등분산성(\(\text{Var}(\varepsilon_t) = \sigma^2\)), (iii) 정규성이다.

정의 2.2 — 강건 회귀 (Robust OLS)

금융 데이터는 이상치가 빈번하여 표준 OLS가 왜곡될 수 있다. 강건 회귀는 각 관측치에 가중치를 부여하여 이상치의 영향을 줄이는 방법이다. 가중 최소제곱법(WLS)의 형태로 쓰면:

\[\hat{\boldsymbol{\beta}}_{robust} = \arg\min_{\boldsymbol{\beta}} \sum_{t=1}^T w_t (y_t - \mathbf{x}_t' \boldsymbol{\beta})^2\]

여기서 \(w_t\)는 관측치 \(t\)의 가중치로, 잔차의 크기에 따라 이상치에 낮은 가중치를 부여한다. 제4장에서 사용하는 Winsorisation은 분포의 극단값(상위/하위 \(p\%\))을 \(p\)-분위수 값으로 대체한 뒤 OLS를 적용하는 방법이다.

정의 2.3 — 결정계수 \(R^2\)와 조정 \(R^2\)
\[R^2 = 1 - \frac{\sum_t (y_t - \hat{y}_t)^2}{\sum_t (y_t - \bar{y})^2}, \qquad \bar{R}^2 = 1 - (1 - R^2)\frac{T-1}{T-k-1}\]

\(R^2\)는 모형이 피설명변수의 분산 중 설명한 비율이다. 0에서 1 사이이며 1에 가까울수록 모형의 설명력이 높다. 조정 \(R^2\)(\(\bar{R}^2\))는 설명변수의 수 \(k\)에 대해 벌점을 부여하여 과적합을 방지한다.


3. 시계열 통계학 핵심 개념

제4장의 분석 대상인 거래량, 스프레드, 변동성은 모두 시간에 따라 변하는 시계열 변수들이다. 이들의 특성을 이해하려면 시계열의 기본 개념이 필요하다.

정의 3.1 — 자기상관 (Autocorrelation)

시계열 \(\{X_t\}\)의 시차(lag) \(\ell\)에서의 자기상관은:

\[\rho(\ell) = \frac{\text{Cov}(X_t, X_{t-\ell})}{\text{Var}(X_t)} = \frac{E[(X_t - \mu)(X_{t-\ell} - \mu)]}{\sigma^2}\]

자기상관이 크다는 것은 현재 값이 과거 값과 강하게 연결되어 있다는 뜻이다. 거래량과 변동성은 높은 양의 자기상관을 보이는 것으로 잘 알려져 있으며, 이를 시계열 지속성(persistence)이라 한다.

정의 3.2 — 정상성 (Stationarity)

시계열 \(\{X_t\}\)가 (약한 의미에서) 정상적이라는 것은 (i) \(E[X_t] = \mu\) (시간에 무관한 상수), (ii) \(\text{Var}(X_t) = \sigma^2 < \infty\), (iii) \(\text{Cov}(X_t, X_{t-\ell})\)가 \(\ell\)에만 의존하는 것이다. 비정상 시계열에 직접 OLS를 적용하면 가성 회귀(spurious regression) 문제가 발생할 수 있다.

정의 3.3 — 변동성 클러스터링

금융 수익률 시계열의 대표적 특성 중 하나로, 큰 가격변화 뒤에는 또 큰 가격변화가, 작은 변화 뒤에는 또 작은 변화가 오는 경향을 말한다. 수식으로는 \(|r_t|\)의 자기상관이 높은 것으로 표현된다:

\[\text{Corr}(|r_t|, |r_{t-\ell}|) > 0 \quad \text{for small }\ell\]

제3장에서 다룬 이 현상은 제4장에서도 거래량과 변동성의 공동 지속성으로 재등장한다.

정의 3.4 — Winsorisation

표본 \(\{x_1, \ldots, x_n\}\)을 정렬했을 때 하위 \(p\%\)와 상위 \(p\%\)에 해당하는 관측치들을 각각 하위 \(p\)-분위수값과 상위 \((1-p)\)-분위수값으로 대체하는 과정이다. 예를 들어 0.5% Winsorisation은:

\[x_i^{W} = \begin{cases} x_{(0.005)} & \text{if } x_i < x_{(0.005)} \\ x_i & \text{if } x_{(0.005)} \le x_i \le x_{(0.995)} \\ x_{(0.995)} & \text{if } x_i > x_{(0.995)} \end{cases}\]

이상치를 제거하지 않고 그 영향만 줄이므로 표본 크기가 보존된다. 제4장의 가격충격 추정(4.3.5절)에서 이 방법이 사용된다.


4. 확률 분포 — CDF, 생존 함수, 경험적 분포

정의 4.1 — 누적분포함수 (CDF)

확률변수 \(X\)의 누적분포함수는:

\[F(x) = P(X \le x)\]

CDF는 단조 비감소 함수이며 \(F(-\infty) = 0\), \(F(+\infty) = 1\)을 만족한다. 연속형 확률변수의 경우 \(F(x) = \int_{-\infty}^x f(u)\, du\)로 밀도함수 \(f\)로부터 구한다.

정의 4.2 — 생존 함수 (Survivor Function)

생존 함수(또는 보완 CDF)는:

\[S(x) = P(X > x) = 1 - F(x)\]

생존 함수는 변수가 \(x\)보다 클 확률을 나타낸다. 제4장 4.4절에서 LO의 체결 확률을 호가창으로부터의 거리의 함수로 표현할 때 이 개념이 사용된다. \(S(x)\)가 감소할수록 해당 거리에서의 체결 가능성이 낮아진다.

정의 4.3 — 경험적 CDF (ECDF)

크기 \(n\)인 표본 \(\{x_1, \ldots, x_n\}\)의 경험적 CDF는:

\[\hat{F}_n(x) = \frac{1}{n}\sum_{i=1}^n \mathbf{1}_{x_i \le x}\]

Glivenko-Cantelli 정리에 의해 \(\sup_x |\hat{F}_n(x) - F(x)| \to 0\) a.s.로 수렴한다. 제4장에서 체결 분포, 취소 분포, 메시지 분포를 분석할 때 경험적 분포가 사용된다.

정의 4.4 — 확률적 우세 (Stochastic Dominance)

두 확률변수 \(X\)와 \(Y\)에 대해 모든 \(x\)에서 \(F_X(x) \le F_Y(x)\)이면(또는 동등하게 \(S_X(x) \ge S_Y(x)\)이면), \(X\)가 \(Y\)를 1차 확률적으로 우세(first-order stochastically dominates)한다고 한다. 이는 \(X\)가 확률적으로 더 큰 값을 가지는 경향이 있음을 의미한다. 제4장 4.2.2절에서 초기 밀리초의 거래 수가 이후 밀리초를 확률적으로 우세한다는 관찰이 등장한다.


5. 시장미시구조 핵심 가격 지표

제4장에서 반복적으로 등장하는 시장미시구조 지표들의 수식 정의를 정리한다. 이들은 제1장에서 소개되었지만, 제4장에서는 통계적 분석의 대상으로 등장하므로 다시 정확히 확인한다.

핵심 가격 지표 정의 모음

Midprice (중간가격):

\[s_t = \frac{a_t + b_t}{2}\]

여기서 \(a_t\)는 최선 매도호가(ask), \(b_t\)는 최선 매수호가(bid)이다.

Quoted Spread (호가스프레드):

\[QS_t = a_t - b_t\]

Quoted Half-Spread:

\[\frac{QS_t}{2} = \frac{a_t - b_t}{2} = a_t - s_t = s_t - b_t\]

Microprice (미시가격): (제3장 식 3.3)

\[\text{Microprice}_t = \frac{V_t^b \cdot a_t + V_t^a \cdot b_t}{V_t^b + V_t^a}\]

Effective Half-Spread (실효 반스프레드):

매수 MO에 대해: \(ES_t^{buy} = p_t - s_t\)

매도 MO에 대해: \(ES_t^{sell} = s_t - p_t\)

여기서 \(p_t\)는 실제 체결 가격이다.

정의 5.1 — 시간 가중 호가스프레드 (tQS)

특정 분(minute) \(t\) 동안의 시간 가중 평균 호가스프레드는:

\[tQS_t = \sum_{i=1}^{n-1} (T_{i+1} - T_i)\, QS_{t,i}\]

여기서 \(i \in \{1, \ldots, n\}\)은 분 \(t\) 동안 호가스프레드가 변화한 시점의 인덱스이며, \(T_i\)는 그 시각이다. 이 가중 방식은 각 스프레드 수준이 유지된 시간에 비례한 가중치를 부여하는 것이다.

정의 5.2 — 수량 가중 실효스프레드 (qES)

분 \(t\) 동안의 수량 가중 평균 실효스프레드는:

\[qES_t = \frac{\sum_{j=1}^m q_j\, ES_j}{\sum_{j=1}^m q_j}\]

여기서 \(j \in \{1, \ldots, m\}\)은 분 \(t\) 동안의 개별 거래 인덱스이고, \(q_j\)는 거래 \(j\)의 주식 수, \(ES_j\)는 해당 거래의 실효스프레드이다. 이 가중 방식은 거래량이 많은 거래에 더 큰 가중치를 부여한다.


6. 베이시스 포인트 (bps) 단위와 상대화

정의 6.1 — bps (베이시스 포인트)

베이시스 포인트는 퍼센트의 100분의 1, 즉 0.01%다.

\[1\,\text{bps} = 0.01\% = 0.0001\]

스프레드를 bps로 표현할 때는 중간가격 대비 비율로 상대화한다:

\[QS_t \text{ (bps)} = \frac{QS_t}{s_t} \times 10{,}000\]

예: AAPL의 중위 호가스프레드가 13.8센트이고 중간가격이 $473이라면, 이를 bps로 변환하면 \(\frac{0.138}{473} \times 10{,}000 \approx 2.9\,\text{bps}\)가 된다. 이 상대화가 왜 중요한지는 제4장 4.3.1절에서 자세히 설명된다.


7. 실현 변동성과 측정 방법들

정의 7.1 — 실현 변동성 (Realized Volatility)

시간 구간을 \(m\)개의 소구간으로 분할하고 각 소구간에서의 수익률 \(r_j\)를 계산할 때, 해당 구간의 실현 변동성은:

\[\sigma = \sqrt{\frac{1}{m}\sum_{j=1}^m r_j^2} \quad \text{(평균이 0이라 가정)}\]

또는 표본평균을 빼는 일반적 표준편차 공식을 사용하기도 한다. 제4장에서는 15분 구간을 1분 단위로 분할한 \(m=15\)개 수익률로 실현 변동성을 계산한다.

정의 7.2 — 범위 변동성 (HL Volatility)

하루 또는 일정 구간의 가격 범위를 변동성의 대리 변수로 사용한다:

\[HL_t = \max_t P_t - \min_t P_t\]

여기서 \(\max_t P_t\)와 \(\min_t P_t\)는 해당 구간의 최고가와 최저가이다. 이 측정은 가격이 얼마나 넓은 범위를 움직였는지를 직관적으로 포착한다. 제4장 4.1절의 M2 모형에서 \(HL_t\) (HL-volat)가 거래량 예측 모형에 포함된다.

정의 7.3 — 사분위범위 기반 변동성 (IQR Volatility)

일중 1분 수익률의 사분위범위:

\[IQR\text{-vol}_t = Q3(r_{t,1}, r_{t,2}, \ldots) - Q1(r_{t,1}, r_{t,2}, \ldots)\]

사분위범위는 이상치에 강건하다는 장점이 있다. 제4장 4.3.2절에서 AAPL의 일중 변동성 패턴을 분석할 때 이 지표가 사용된다(Figure 4.7).


8. 가격충격 모형 — 영구적 충격과 일시적 충격

시장충격(market impact)은 대형 주문이 가격에 미치는 영향을 말한다. 이를 두 종류로 구분하는 것이 제4장 4.3.5절의 핵심이다.

정의 8.1 — 영구적 가격충격 (Permanent Price Impact)

순주문흐름(net order flow) \(\mu_n\)이 중간가격 변화 \(\Delta S_n\)에 미치는 선형 효과:

\[\Delta S_n = a + b \cdot \mu_n + \varepsilon_n \tag{4.2}\]

여기서 \(\Delta S_n = S_{nT} - S_{(n-1)T}\)는 구간 \([(n-1)T, nT]\)에서의 중간가격 변화, \(\mu_n\)은 같은 구간의 순주문흐름(매수 MO 거래량 - 매도 MO 거래량), \(b\)는 영구적 가격충격 계수이다. 이 영향은 거래 후에도 지속된다.

정의 8.2 — 일시적 가격충격 (Temporary Price Impact)

수량 \(Q_i\)를 체결할 때 최선 호가 대비 체결 가격의 차이:

\[s_{i,t}^{exec, ask} = s_t^{ask} + k^{ask} \cdot Q_i + \varepsilon_{i,t}\]

여기서 \(s_{i,t}^{exec, ask}\)는 수량 \(Q_i\)에 대한 평균 체결가, \(s_t^{ask}\)는 현재 최선 매도호가, \(k^{ask}\)는 일시적 가격충격 계수(단위 수량당 충격)이다. 이 충격은 LOB를 걸어가면서(walking the book) 발생하며, 거래 후 회복된다.

영구적 충격 대 일시적 충격의 비율 \(b/k\)

영구적 충격 계수 \(b\)와 일시적 충격 계수 \(k\)의 비율은 집행 전략 설계에서 핵심적인 역할을 한다. 이 비율은 "한 단위 순주문흐름이 초래하는 영구적 가격 변화"와 "LOB를 한 주 걸어갈 때의 비용" 사이의 상대적 크기를 나타낸다. 제7장의 청산 알고리즘에서 이 비율이 직접 사용된다.


9. 함수형 데이터 분석 (FDA)과 Legendre 다항식

정의 9.1 — 함수형 데이터 분석 (Functional Data Analysis)

함수형 데이터 분석은 각 관측 단위가 하나의 함수(곡선)인 경우의 통계 분석 방법이다. 제4장에서는 각 거래일의 일중 거래량 패턴을 하나의 함수로 보고, 이를 매끄러운 기저함수(basis function)의 선형결합으로 표현한다:

\[v_d(t) = \sum_{k=0}^K c_{dk}\, P_k(t) + \varepsilon_d(t)\]

여기서 \(v_d(t)\)는 날짜 \(d\)의 시각 \(t\)에서의 거래량, \(P_k(t)\)는 \(k\)차 Legendre 다항식, \(c_{dk}\)는 추정 계수이다.

정의 9.2 — Legendre 다항식

Legendre 다항식 \(P_k(t)\)는 구간 \([-1, 1]\)에서 직교하는 다항식 기저다:

\[\int_{-1}^1 P_j(t) P_k(t)\, dt = \frac{2}{2k+1} \delta_{jk}\]

처음 몇 개는 \(P_0(t) = 1\), \(P_1(t) = t\), \(P_2(t) = \frac{1}{2}(3t^2 - 1)\), \(P_3(t) = \frac{1}{2}(5t^3 - 3t)\). 시간 구간을 \([-1, 1]\)로 선형변환하여 적용하면 일중 패턴을 부드러운 곡선으로 근사할 수 있다. 이 방법은 이상치에 의해 왜곡된 원시 데이터를 매끄럽게 표현하는 데 유리하다.


10. tick size와 최소호가단위의 시장미시구조적 함의

정의 10.1 — Tick Size와 상대 Tick Size

Tick size는 LOB에서 허용되는 최소 가격 변동 단위다. 미국에서는 1달러 이상 주식의 최소 tick size가 1센트로 법적으로 고정되어 있다. 상대 tick size는:

\[\text{Relative Tick Size}_t = \frac{\text{Tick Size}}{s_t} \times 10{,}000 \quad \text{(bps)}\]

주가가 낮을수록 상대 tick size가 크다. 예를 들어 주가 $5.25의 ISNS는 상대 tick size가 약 190bps인 반면, 주가 $473의 AAPL은 약 2.1bps에 불과하다.

Tick Size 제약이 시장 질에 미치는 영향

최소 tick size 제약이 스프레드에 구속적(binding)이 될 때, 즉 "자연적" 균형 스프레드가 최소 tick size보다 작을 때 여러 왜곡이 발생한다. 스프레드가 인위적으로 높게 유지되어 거래비용이 증가하고, 가격이 작은 변동을 반영하지 못해 인위적 가격 경직성이 생긴다. 또한 최소 스프레드에서 시장조성의 수익성이 증가하여 유동성 공급이 과도해질 수 있다. 제4장에서 MENT 주식이 이런 상황의 대표적 사례로 등장한다.


11. 순주문흐름 (Net Order Flow)과 정보 비대칭

정의 11.1 — 순주문흐름 (OF)

하루 또는 일정 구간 동안의 순주문흐름은 매수 MO 거래량에서 매도 MO 거래량을 뺀 값이다:

\[OF_t = V_t^{buy} - V_t^{sell}\]

순주문흐름이 양수이면 매수 압력이 우세함을, 음수이면 매도 압력이 우세함을 나타낸다. 중간가격의 변화와 순주문흐름은 강한 양의 상관관계를 보이는 것으로 알려져 있다. 이는 정보 거래자들이 MO를 사용하여 자신의 정보를 실현한다는 이론과 일치한다.

정의 11.2 — 정보 비대칭과 시장 질

시장에 정보 거래자(informed traders)와 소음 거래자(noise traders)가 혼재할 때, 시장조성자는 자신이 정보를 가진 상대와 거래할 위험(adverse selection risk)을 스프레드에 반영한다. 소음 거래자의 비율이 높아질수록 스프레드는 좁아지고, 정보 거래자의 비율이 높아질수록 스프레드는 넓어진다. 제2장에서 이 메커니즘을 이론적으로 다뤘으며, 제4장에서 이를 실증적으로 확인한다.



12. 측도, 절대연속, Hahn 분해, Radon-Nikodym 미분

제4장은 실증 장이지만, 그 아래에는 조건부기대와 기대값 변환의 언어가 놓여 있다. 특히 “어떤 측도 아래에서 기대값을 취할 것인가”라는 질문은 Radon-Nikodym 미분, 밀도과정, 측도변환으로 이어지고, 이는 이후 뉴메레르 변경과 Girsanov 정리의 기반이 된다. 따라서 이 절에서는 부호측도, Hahn 분해, Radon-Nikodym 정리를 정의에서부터 존재 정리, 유일성 정리, 계산 규칙까지 끊지 않고 서술한다.

정의 12.1 — 측도와 절대연속

가측공간 \((\Omega,\mathcal F)\) 위의 집합함수 \(\mu:\mathcal F\to[0,\infty]\)가 다음을 만족하면 \(\mu\)를 측도라고 한다.

  1. \(\mu(\varnothing)=0\).
  2. 서로소인 가측집합열 \((A_n)_{n\ge 1}\)에 대하여 \(\mu\!\left(\bigcup_{n=1}^\infty A_n\right)=\sum_{n=1}^\infty \mu(A_n)\).

같은 가측공간 위의 두 측도 \(\nu,\mu\)에 대하여, 모든 \(A\in\mathcal F\)에 대해 \(\mu(A)=0\Rightarrow \nu(A)=0\)이면 \(\nu\ll\mu\)라 쓰고 \(\nu\)가 \(\mu\)에 대해 절대연속이라고 한다.

정의 12.2 — 부호측도

집합함수 \(\sigma:\mathcal F\to[-\infty,\infty]\)가 \(\sigma(\varnothing)=0\)이고, 서로소 가측집합열에 대해 가산가법적이며, 동시에 \(+\infty\)와 \(-\infty\)를 모두 취하지 않으면 \(\sigma\)를 부호측도라고 한다. 즉 부호측도는 음의 질량까지 허용하는 측도이다.

정의 12.3 — 양의 집합과 음의 집합

부호측도 \(\sigma\)가 주어졌을 때, 가측집합 \(P\)가 모든 가측 \(E\subset P\)에 대해 \(\sigma(E)\ge 0\)를 만족하면 \(P\)를 양의 집합이라 하고, 가측집합 \(N\)이 모든 가측 \(F\subset N\)에 대해 \(\sigma(F)\le 0\)를 만족하면 \(N\)을 음의 집합이라 한다. Hahn 분해 정리는 바로 이런 양의 집합과 음의 집합이 공간 전체를 둘로 나눌 수 있음을 말한다.

정리 12.1 — Hahn 분해 정리

유한 부호측도 \(\sigma\)가 주어지면, \(\Omega\)는 두 가측집합 \(P,N\)으로 분해되어 \(\Omega=P\cup N\), \(P\cap N=\varnothing\)이고, 모든 가측 \(E\subset P\), \(F\subset N\)에 대해

\[\sigma(E)\ge 0,\qquad \sigma(F)\le 0.\]

즉 \(P\)는 양의 집합, \(N\)은 음의 집합이 된다.

증명

증명을 여러 단계로 나누어 진행한다.

1단계. 상한의 정의. 유한 부호측도이므로 \(\sigma(A)\)는 모든 \(A\in\mathcal F\)에 대해 유한한 실수값을 가진다. 따라서

\[\beta:=\sup\{\sigma(A):A\in\mathcal F\}\]

는 잘 정의되는 유한한 실수이다.

2단계. 상한에 접근하는 집합열의 선택. 상한의 정의에 의해, 각 \(n\in\mathbb N\)에 대해

\[\beta-\frac1n < \sigma(A_n) \le \beta\]

를 만족하는 가측집합 \(A_n\)을 택할 수 있다. 이제

\[P:=\bigcup_{n=1}^{\infty}A_n\]

로 둔다. 또한 \(B_n:=\bigcup_{k=1}^n A_k\)라고 두면 \(B_n\uparrow P\)이다.

3단계. \(\sigma(P)=\beta\)임을 보이기. 각 \(B_n\)은 가측집합이므로 \(\sigma(B_n)\le \beta\)이다. 또 \(A_n\subset B_n\)이므로 \(\sigma(B_n)\ge \sigma(A_n)>\beta-1/n\)이다. 따라서

\[\beta-\frac1n < \sigma(B_n) \le \beta.\]

이 부등식에서 \(n\to\infty\)를 보내면

\[\lim_{n\to\infty}\sigma(B_n)=\beta.\]

한편 \(\sigma\)는 유한 부호측도이므로 증가하는 집합열에 대해 연속성을 가진다. 따라서

\[\sigma(P)=\sigma\!\left(\bigcup_{n=1}^\infty B_n\right)=\lim_{n\to\infty}\sigma(B_n)=\beta.\]

4단계. \(P\)가 양의 집합임을 보이기. 반대로 가정하자. 즉 어떤 가측집합 \(E\subset P\)가 존재하여

\[\sigma(E)<0\]

라고 하자. 그러면 \(P=(P\setminus E)\sqcup E\)이므로 가산가법성에서

\[\sigma(P)=\sigma(P\setminus E)+\sigma(E)\]

가 성립한다. 이를 정리하면

\[\sigma(P\setminus E)=\sigma(P)-\sigma(E).\]

그런데 \(\sigma(E)<0\)이므로 \(-\sigma(E)>0\)이고, 따라서

\[\sigma(P\setminus E)=\sigma(P)-\sigma(E)>\sigma(P)=\beta.\]

이는 \(\beta\)가 \(\{\sigma(A):A\in\mathcal F\}\)의 상한이라는 정의에 모순이다. 따라서 그런 \(E\)는 존재할 수 없고, 모든 가측 \(E\subset P\)에 대해 \(\sigma(E)\ge 0\)가 성립한다. 즉 \(P\)는 양의 집합이다.

5단계. 여집합 \(N=P^c\)가 음의 집합임을 보이기. 다시 반대로 가정하여 어떤 가측집합 \(F\subset N\)이 존재하여 \(\sigma(F)>0\)라고 하자. 그러면 \(P\)와 \(F\)는 서로소이므로

\[\sigma(P\cup F)=\sigma(P)+\sigma(F)>\sigma(P)=\beta.\]

그러나 \(P\cup F\) 역시 가측집합이므로 \(\sigma(P\cup F)\le \beta\)여야 한다. 모순이다. 따라서 모든 가측 \(F\subset N\)에 대해 \(\sigma(F)\le 0\)가 성립한다. 즉 \(N\)은 음의 집합이다.

결론적으로 \(\Omega=P\cup N\), \(P\cap N=\varnothing\), \(P\)는 양의 집합, \(N\)은 음의 집합이다. 이것이 Hahn 분해이다.

정리 12.2 — Radon-Nikodym 정리

유한측도 \(\nu,\mu\)가 같은 가측공간 \((\Omega,\mathcal F)\) 위에 있고 \(\nu\ll\mu\)라고 하자. 그러면 어떤 비음수 가측함수 \(f\)가 존재하여 모든 \(A\in\mathcal F\)에 대해

\[\nu(A)=\int_A f\,d\mu\]

가 성립한다. 이 \(f\)를 \(\dfrac{d\nu}{d\mu}\)라 쓴다.

증명

증명은 “아래에서부터 \(\nu\)를 근사하는 밀도 함수들”의 최대 원소를 구성하는 방식으로 진행한다.

1단계. 후보 함수류의 정의. 다음 집합을 생각한다.

\[\mathcal C:=\left\{g\ge 0\text{ 가측} : \int_A g\,d\mu\le \nu(A)\quad \forall A\in\mathcal F\right\}.\]

영함수 \(g\equiv 0\)는 자명하게 \(\mathcal C\)에 속하므로 \(\mathcal C\neq\varnothing\)이다.

2단계. 전체 적분의 상한 정의. 각 \(g\in\mathcal C\)에 대해 \(A=\Omega\)를 대입하면

\[\int_\Omega g\,d\mu\le \nu(\Omega)<\infty.\]

따라서

\[\alpha:=\sup_{g\in\mathcal C}\int_\Omega g\,d\mu\]

는 유한한 실수이다.

3단계. 상한에 접근하는 함수열의 선택. 상한의 정의에 의해 \(g_n\in\mathcal C\)를 잡아

\[\int_\Omega g_n\,d\mu > \alpha-\frac1n\]

가 되게 할 수 있다. 이제

\[h_n:=\max\{g_1,\dots,g_n\}\]

로 두자. 그러면 \(h_n\)은 증가하는 가측함수열이고 점wise 극한

\[f:=\sup_{n\ge 1} h_n=\lim_{n\to\infty}h_n\]

를 갖는다.

4단계. \(h_n\in\mathcal C\)임을 보이기. 먼저 두 함수 \(g,h\in\mathcal C\)를 잡자. 점wise로

\[\max(g,h)+\min(g,h)=g+h\]

가 성립한다. 따라서 임의의 \(A\in\mathcal F\)에 대해

\[\int_A \max(g,h)\,d\mu = \int_A g\,d\mu + \int_A h\,d\mu - \int_A \min(g,h)\,d\mu.\]

또한 \(0\le \min(g,h)\le g\)이므로 \(\min(g,h)\)도 \(\mathcal C\)의 조건을 만족하여

\[\int_A \min(g,h)\,d\mu\le \nu(A).\]

그리고 \(g,h\in\mathcal C\)이므로

\[\int_A g\,d\mu\le \nu(A),\qquad \int_A h\,d\mu\le \nu(A).\]

이를 결합하면

\[\int_A \max(g,h)\,d\mu\le \nu(A)+\nu(A)-\int_A\min(g,h)\,d\mu\le \nu(A).\]

따라서 \(\max(g,h)\in\mathcal C\)이다. 이 사실을 귀납적으로 적용하면 각 \(h_n\in\mathcal C\)이다.

5단계. 극한 함수 \(f\)도 \(\mathcal C\)에 속함을 보이기. \(h_n\uparrow f\)이므로 단조수렴정리로 임의의 \(A\in\mathcal F\)에 대해

\[\int_A f\,d\mu = \lim_{n\to\infty}\int_A h_n\,d\mu.\]

각 \(h_n\)이 \(\mathcal C\)에 속하므로 오른쪽은 항상 \(\nu(A)\) 이하이다. 따라서

\[\int_A f\,d\mu\le \nu(A)\qquad \forall A\in\mathcal F.\]

즉 \(f\in\mathcal C\)이다. 특히

\[\int_\Omega f\,d\mu\le \alpha.\]

반대로 \(h_n\le f\)이므로

\[\int_\Omega h_n\,d\mu\le \int_\Omega f\,d\mu\]

이고, \(n\to\infty\)를 보내면 \(\alpha\le \int_\Omega f\,d\mu\)가 된다. 따라서

\[\int_\Omega f\,d\mu = \alpha.\]

6단계. 잔여 측도의 정의. 이제

\[\lambda(A):=\nu(A)-\int_A f\,d\mu,\qquad A\in\mathcal F\]

로 놓자. 앞 단계에서 \(f\in\mathcal C\)임을 보였으므로 \(\lambda(A)\ge 0\)이다. 또한 \(\nu\)와 적분 측도 \(A\mapsto\int_A f\,d\mu\)는 둘 다 유한측도이므로 \(\lambda\)도 비음수 유한측도이다.

7단계. \(\lambda\equiv 0\)가 아님을 가정하고 모순을 만들기. 반대로 \(\lambda(\Omega)>0\)라고 가정하자. 그러면 다음 사실이 성립한다.

어떤 \(\varepsilon>0\)와 어떤 가측집합 \(B\)가 존재하여

\[\lambda(B) > \varepsilon\mu(B)\]

가 된다. 왜냐하면 만약 모든 \(\varepsilon>0\)와 모든 가측집합 \(A\)에 대해 \(\lambda(A)\le \varepsilon\mu(A)\)라면, 특히 \(A=\Omega\)에 대하여

\[\lambda(\Omega)\le \varepsilon\mu(\Omega)\]

가 모든 \(\varepsilon>0\)에서 성립한다. \(\varepsilon\downarrow 0\)를 보내면 \(\lambda(\Omega)=0\)이 되어 가정과 모순이기 때문이다.

8단계. Hahn 분해의 적용. 부호측도

\[\sigma:=\lambda-\varepsilon\mu\]

를 생각하자. 위에서 선택한 \(B\)에 대해 \(\sigma(B)=\lambda(B)-\varepsilon\mu(B)>0\)이다. 그러므로 \(\sigma\)는 0이 아닌 유한 부호측도이다. Hahn 분해 정리에 의해 어떤 양의 집합 \(P\)가 존재하여, 모든 가측집합 \(E\subset P\)에 대해

\[\sigma(E)\ge 0.\]

\[\lambda(E)-\varepsilon\mu(E)\ge 0\]

이고 따라서

\[\varepsilon\mu(E)\le \lambda(E)\qquad \forall E\subset P,\ E\in\mathcal F.\]

특히 \(E=A\cap P\)를 대입하면 임의의 \(A\in\mathcal F\)에 대해

\[\varepsilon\mu(A\cap P)\le \lambda(A\cap P).\]

9단계. 더 큰 후보함수의 구성. 이제 \(f+\varepsilon\mathbf 1_P\)를 생각한다. 임의의 \(A\in\mathcal F\)에 대해

\[\int_A (f+\varepsilon\mathbf 1_P)\,d\mu = \int_A f\,d\mu + \varepsilon\mu(A\cap P).\]

바로 위 부등식을 사용하면

\[\int_A (f+\varepsilon\mathbf 1_P)\,d\mu \le \int_A f\,d\mu + \lambda(A\cap P).\]

또 \(\lambda\)는 비음수 측도이므로 \(\lambda(A\cap P)\le \lambda(A)\)이다. 따라서

\[\int_A (f+\varepsilon\mathbf 1_P)\,d\mu \le \int_A f\,d\mu + \lambda(A) = \int_A f\,d\mu + \nu(A)-\int_A f\,d\mu = \nu(A).\]

즉 \(f+\varepsilon\mathbf 1_P\in\mathcal C\)이다.

10단계. 상한성과 모순. \(P\)가 \(\sigma\)의 양의 집합이고 \(\sigma(B)>0\)인 가측집합 \(B\)가 존재하므로 \(\mu(P)>0\)이어야 한다. 만약 \(\mu(P)=0\)이면 모든 \(E\subset P\)에 대해 \(\sigma(E)=\lambda(E)\)이므로 \(\sigma(B)>0\)가 가능하려면 \(B\)의 양의 부분이 \(P\) 안에 있어야 하고, 결국 \(\mu(P)>0\)를 얻는다. 따라서

\[\int_\Omega (f+\varepsilon\mathbf 1_P)\,d\mu = \int_\Omega f\,d\mu + \varepsilon\mu(P) > \int_\Omega f\,d\mu = \alpha.\]

그런데 \(f+\varepsilon\mathbf 1_P\in\mathcal C\)이므로 이 적분값은 \(\alpha\)보다 클 수 없다. 모순이다.

결국 가정 \(\lambda(\Omega)>0\)는 거짓이므로 \(\lambda(\Omega)=0\)이다. \(\lambda\)가 비음수 측도이므로 \(\lambda(\Omega)=0\)이면 자동으로 모든 \(A\)에 대해 \(\lambda(A)=0\)이다. 따라서

\[\nu(A)=\int_A f\,d\mu\qquad \forall A\in\mathcal F.\]

원하는 함수 \(f=d\nu/d\mu\)가 존재한다.

정리 12.3 — Radon-Nikodym 미분의 유일성

두 가측함수 \(f,g\)가 모두 모든 \(A\in\mathcal F\)에 대해 \(\nu(A)=\int_A f\,d\mu=\int_A g\,d\mu\)를 만족하면 \(f=g\)가 \(\mu\)-거의 모든 곳에서 성립한다.

증명

집합 \(B:=\{f>g\}\)를 생각하자. \(f,g\)가 가측이므로 \(B\)는 가측이다. 그리고 \(B\) 위에서는 \(f-g>0\)이므로

\[\int_B (f-g)\,d\mu \ge 0.\]

한편 가정에 의해

\[\int_B f\,d\mu = \nu(B) = \int_B g\,d\mu.\]

따라서

\[\int_B (f-g)\,d\mu = \int_B f\,d\mu - \int_B g\,d\mu = 0.\]

비음수 가측함수의 적분이 0이면 그 함수는 거의 모든 곳에서 0이다. 그러므로 \(f-g=0\)가 \(B\) 위에서 \(\mu\)-거의 모든 곳에서 성립한다. 그런데 \(B\)의 정의상 \(f-g>0\)이므로 결국 \(\mu(B)=0\)이다.

같은 방식으로 \(C:=\{g>f\}\)에 대해 \(\mu(C)=0\)를 얻는다. 따라서

\[\mu(\{f\ne g\}) = \mu(B\cup C) \le \mu(B)+\mu(C)=0.\]

즉 \(f=g\)가 \(\mu\)-거의 모든 곳에서 성립한다.


13. 조건부기대와 Bayes 공식

정의 13.1 — 조건부기대

확률공간 \((\Omega,\mathcal F,\mathbb P)\)과 부분 \(\sigma\)-대수 \(\mathcal G\subset\mathcal F\)를 고정하자. \(X\in L^1(\mathbb P)\)일 때, \(\mathcal G\)-가측 확률변수 \(Y\)가

  1. \(Y\)는 \(\mathcal G\)-가측이고,
  2. 모든 \(A\in\mathcal G\)에 대해 \(\int_A Y\,d\mathbb P=\int_A X\,d\mathbb P\)

를 만족하면 \(Y\)를 \(X\)의 \(\mathcal G\)에 대한 조건부기대라 하고 \(Y=\mathbb E[X\mid\mathcal G]\)라고 쓴다.

정의 13.2 — 조건부기대의 기본 성질

조건부기대는 평균 보존과 부분 정보에 대한 최적 집약을 동시에 수행한다. 이후의 증명에서는 다음 두 성질이 반복해서 사용된다.

  1. Tower property: \(\mathcal H\subset\mathcal G\)이면 \(\mathbb E[\mathbb E[X\mid\mathcal G]\mid\mathcal H]=\mathbb E[X\mid\mathcal H]\).
  2. Pull-out property: \(Y\)가 \(\mathcal G\)-가측이고 적절히 적분가능하면 \(\mathbb E[XY\mid\mathcal G]=Y\mathbb E[X\mid\mathcal G]\).

이 성질들은 존재와 유일성이 확보된 뒤 정의 자체로부터 도출된다.

정리 13.1 — 조건부기대의 존재와 유일성

임의의 \(X\in L^1(\mathbb P)\)와 부분 \(\sigma\)-대수 \(\mathcal G\subset\mathcal F\)에 대하여 \(\mathbb E[X\mid\mathcal G]\)는 존재하며 \(\mathbb P\)-거의 모든 곳에서 유일하다.

증명

증명은 먼저 \(X\ge 0\)인 경우에 존재를 보이고, 그 다음 일반 적분가능한 경우로 확장한 뒤, 마지막으로 유일성을 확인하는 순서로 진행한다.

1단계. \(X\ge 0\)일 때 유한측도의 구성. \(\mathcal G\) 위에서 집합함수 \(\nu\)를

\[\nu(A):=\int_A X\,d\mathbb P,\qquad A\in\mathcal G\]

로 정의하자. \(X\in L^1(\mathbb P)\)이므로 \(\nu(\Omega)=\mathbb E[X]<\infty\), 따라서 \(\nu\)는 유한측도이다. 또한 \(\mathbb P(A)=0\)이면 적분이 0이므로 \(\nu(A)=0\)이다. 즉 \(\nu\ll \mathbb P|_{\mathcal G}\)이다.

2단계. Radon-Nikodym 정리의 적용. 정리 12.2를 \(\mathcal G\) 위의 두 측도 \(\nu\)와 \(\mathbb P|_{\mathcal G}\)에 적용하면, 어떤 \(\mathcal G\)-가측 함수 \(Y\ge 0\)가 존재하여 모든 \(A\in\mathcal G\)에 대해

\[\nu(A)=\int_A Y\,d\mathbb P.\]

그런데 \(\nu(A)=\int_A X\,d\mathbb P\)였으므로

\[\int_A Y\,d\mathbb P = \int_A X\,d\mathbb P\qquad \forall A\in\mathcal G.\]

즉 \(Y\)는 정의 13.1의 조건을 만족하므로 \(Y=\mathbb E[X\mid\mathcal G]\)이다.

3단계. 일반 적분가능한 \(X\)로의 확장. 일반의 \(X\in L^1\)는

\[X=X^+-X^-\]

로 분해된다. 여기서 \(X^+,X^-\ge 0\)이고

\[|X|=X^++X^-\]

이므로 \(X\in L^1\)이면 \(X^+,X^-\in L^1\)이다. 따라서 앞 단계에 의해 \(\mathbb E[X^+\mid\mathcal G]\), \(\mathbb E[X^-\mid\mathcal G]\)가 존재한다. 이제

\[Y:=\mathbb E[X^+\mid\mathcal G]-\mathbb E[X^-\mid\mathcal G]\]

로 두자. \(Y\)는 \(\mathcal G\)-가측이다. 또한 임의의 \(A\in\mathcal G\)에 대해

\[\int_A Y\,d\mathbb P = \int_A \mathbb E[X^+\mid\mathcal G] \,d\mathbb P - \int_A \mathbb E[X^-\mid\mathcal G] \,d\mathbb P = \int_A X^+\,d\mathbb P - \int_A X^-\,d\mathbb P = \int_A X\,d\mathbb P.\]

따라서 \(Y\)는 \(X\)의 조건부기대이다.

4단계. 유일성. \(Y_1,Y_2\)가 모두 \(X\)의 \(\mathcal G\)-조건부기대라고 하자. 집합

\[A:=\{Y_1>Y_2\}\]

를 잡으면 \(A\)는 \(\mathcal G\)-가측이다. 이제

\[\int_A (Y_1-Y_2)\,d\mathbb P = \int_A Y_1\,d\mathbb P - \int_A Y_2\,d\mathbb P = \int_A X\,d\mathbb P - \int_A X\,d\mathbb P = 0.\]

그런데 \(A\) 위에서는 \(Y_1-Y_2>0\)이다. 비음수 함수의 적분이 0이면 그 함수는 거의 모든 곳에서 0이므로 \(\mathbb P(A)=0\)이다. 같은 방법으로 \(\{Y_2>Y_1\}\)도 확률 0이다. 따라서

\[\mathbb P(Y_1\ne Y_2)=0.\]

즉 조건부기대는 거의 확실하게 유일하다.

정의 13.3 — 동등측도와 우도비

확률측도 \(\mathbb Q\)와 \(\mathbb P\)가 서로 절대연속이면 \(\mathbb Q\sim\mathbb P\)라 쓴다. 이때 \(L:=\dfrac{d\mathbb Q}{d\mathbb P}\)를 우도비 또는 밀도라 부른다.

정리 13.2 — Bayes 공식

\(\mathbb Q\sim\mathbb P\), \(L=\dfrac{d\mathbb Q}{d\mathbb P}\), \(\mathcal G\subset\mathcal F\), \(X\in L^1(\mathbb Q)\)라 하자. 또한 \(Z:=\mathbb E_{\mathbb P}[L\mid\mathcal G]\)라고 두면 \(\{Z>0\}\) 위에서

\[\mathbb E_{\mathbb Q}[X\mid\mathcal G]=\frac{\mathbb E_{\mathbb P}[LX\mid\mathcal G]}{\mathbb E_{\mathbb P}[L\mid\mathcal G]}=\frac{\mathbb E_{\mathbb P}[LX\mid\mathcal G]}{Z}.\]
증명

우변을

\[Y:=\frac{\mathbb E_{\mathbb P}[LX\mid\mathcal G]}{Z}\]

라고 두자. \(\mathbb E_{\mathbb P}[LX\mid\mathcal G]\)와 \(Z\)는 모두 \(\mathcal G\)-가측이므로, \(Z>0\)인 곳에서 \(Y\)는 \(\mathcal G\)-가측이다. 이제 정의 13.1을 만족하는지를 확인하면 된다.

1단계. \(\mathcal G\)-가측성. 방금 본 대로 \(Y\)는 \(\mathcal G\)-가측이다.

2단계. 적분 동일성 확인. 임의의 \(A\in\mathcal G\)를 잡자. 그러면

\[\int_A Y\,d\mathbb Q = \int_A YL\,d\mathbb P.\]

이제 \(AY\)는 \(\mathcal G\)-가측이므로 pull-out property를 쓸 수 있다:

\[\int_A YL\,d\mathbb P = \int_A Y\,\mathbb E_{\mathbb P}[L\mid\mathcal G] \,d\mathbb P = \int_A YZ\,d\mathbb P.\]

그런데 \(YZ=\mathbb E_{\mathbb P}[LX\mid\mathcal G]\)이므로

\[\int_A YZ\,d\mathbb P = \int_A \mathbb E_{\mathbb P}[LX\mid\mathcal G]\,d\mathbb P.\]

조건부기대의 정의로부터 오른쪽은

\[\int_A LX\,d\mathbb P\]

와 같다. 다시 밀도의 정의를 쓰면

\[\int_A LX\,d\mathbb P = \int_A X\,d\mathbb Q.\]

따라서

\[\int_A Y\,d\mathbb Q = \int_A X\,d\mathbb Q\qquad \forall A\in\mathcal G.\]

즉 \(Y\)는 \(\mathbb Q\)-아래에서 \(X\)의 \(\mathcal G\)-조건부기대의 정의를 만족한다. 따라서

\[\mathbb E_{\mathbb Q}[X\mid\mathcal G]=Y=\frac{\mathbb E_{\mathbb P}[LX\mid\mathcal G]}{\mathbb E_{\mathbb P}[L\mid\mathcal G]}.\]

정리가 증명되었다.


14. 균등 적분가능성과 \(L^1\) 수렴

정의 14.1 — 균등 적분가능성

적분가능 확률변수족 \(\mathcal X\)가 균등 적분가능하다는 것은

\[\lim_{M\to\infty}\sup_{X\in\mathcal X}\mathbb E\big[|X|\mathbf 1_{\{|X|>M\}}\big]=0\]

가 성립함을 뜻한다. 직관적으로는, 가족 전체가 동시에 “꼬리에서 큰 질량을 갖지 않는다”는 뜻이다.

정리 14.1 — 지배에 의한 균등 적분가능성

확률변수열 \((X_n)\)과 적분가능한 확률변수 \(Y\ge 0\)가 있어 모든 \(n\)에 대해 \(|X_n|\le Y\) a.s.라고 하자. 그러면 \((X_n)\)은 균등 적분가능하다.

증명

임의의 \(M>0\)와 임의의 \(n\)에 대해, \(|X_n|\le Y\)이면 사건 포함관계

\[\{|X_n|>M\}\subset \{Y>M\}\]

가 성립한다. 따라서 점wise로

\[|X_n|\mathbf 1_{\{|X_n|>M\}} \le Y\mathbf 1_{\{Y>M\}}.\]

기댓값을 취하면

\[\mathbb E\big[|X_n|\mathbf 1_{\{|X_n|>M\}}\big] \le \mathbb E\big[Y\mathbf 1_{\{Y>M\}}\big].\]

오른쪽은 \(Y\in L^1\)이므로 \(M\to\infty\)에서 0으로 수렴한다. 이 상한은 \(n\)에 의존하지 않으므로

\[\sup_n \mathbb E\big[|X_n|\mathbf 1_{\{|X_n|>M\}}\big] \le \mathbb E\big[Y\mathbf 1_{\{Y>M\}}\big] \xrightarrow[M\to\infty]{}0.\]

정의 14.1에 의해 \((X_n)\)은 균등 적분가능하다.

정리 14.2 — 균등 적분가능성과 거의 확실한 수렴으로부터의 \(L^1\) 수렴

\((X_n)\)이 균등 적분가능하고 \(X_n\to X\)가 거의 확실하게 성립하면 \(X\in L^1\)이고 \(\mathbb E[|X_n-X|]\to0\)이다.

증명

증명은 먼저 \(X\)가 적분가능함을 보이고, 다음으로 꼬리와 유계 부분을 분리하여 \(L^1\)-수렴을 도출하는 방식으로 진행한다.

1단계. \(\sup_n\mathbb E|X_n|<\infty\)임을 보이기. 임의의 \(M>0\)에 대해

\[|X_n| = |X_n|\mathbf 1_{\{|X_n|\le M\}} + |X_n|\mathbf 1_{\{|X_n|>M\}}.\]

양변의 기댓값을 취하면

\[\mathbb E|X_n| = \mathbb E\big[|X_n|\mathbf 1_{\{|X_n|\le M\}}\big] + \mathbb E\big[|X_n|\mathbf 1_{\{|X_n|>M\}}\big].\]

첫째 항은 \(M\) 이하이고, 둘째 항은 균등 적분가능성에 의해 큰 \(M\)에서 일괄적으로 작아진다. 따라서

\[\sup_n \mathbb E|X_n| < \infty.\]

2단계. \(X\in L^1\)임을 보이기. Fatou의 보조정리에 의해

\[\mathbb E|X| \le \liminf_{n\to\infty}\mathbb E|X_n| < \infty.\]

따라서 \(X\)는 적분가능하다.

3단계. 꼬리항 분해. 임의의 \(M>0\)에 대해

\[|X_n-X| \le |X_n|\mathbf 1_{\{|X_n|>M\}} + |X|\mathbf 1_{\{|X|>M\}} + |X_n-X|\mathbf 1_{\{|X_n|\le M,\ |X|\le M\}}.\]

이 부등식은 다음 관찰에서 나온다. \(\{|X_n|\le M, |X|\le M\}\)에서는 마지막 항이 \(|X_n-X|\)를 그대로 담고, 그 밖의 영역에서는 적어도 하나의 꼬리항이 활성화되기 때문이다.

기댓값을 취하면

\[\mathbb E|X_n-X| \le I_{n,M}+J_M+K_{n,M},\]

여기서

\[I_{n,M}:=\mathbb E\big[|X_n|\mathbf 1_{\{|X_n|>M\}}\big],\quad J_M:=\mathbb E\big[|X|\mathbf 1_{\{|X|>M\}}\big],\quad K_{n,M}:=\mathbb E\big[|X_n-X|\mathbf 1_{\{|X_n|\le M,\ |X|\le M\}}\big].\]

4단계. 유계 부분의 수렴. 사건 \(\{|X_n|\le M, |X|\le M\}\) 위에서

\[|X_n-X|\mathbf 1_{\{|X_n|\le M,\ |X|\le M\}} \le 2M.\]

또한 \(X_n\to X\) 거의 확실하므로 이 항은 거의 확실하게 0으로 간다. 따라서 지배수렴정리에 의해, \(M\)을 고정하면

\[K_{n,M}\xrightarrow[n\to\infty]{}0.\]

5단계. 첫 번째 꼬리항 제어. 균등 적분가능성 정의에 의해

\[\lim_{M\to\infty}\sup_n I_{n,M}=0.\]

즉 \(\varepsilon>0\)가 주어지면, 충분히 큰 \(M\)에 대해 모든 \(n\)에 대해 \(I_{n,M}<\varepsilon/3\)이 되게 할 수 있다.

6단계. 두 번째 꼬리항 제어. 아직 \(X\)의 균등 적분가능성은 모른다. 대신 다음 부등식을 이용한다:

\[|X|\mathbf 1_{\{|X|>M\}} \le |X-X_n| + |X_n|\mathbf 1_{\{|X|>M\}}.\]

이 식만으로는 직접적이지 않으므로, 앞의 1단계와 2단계에서 얻은 \(X\in L^1\)를 사용한다. 적분가능 함수의 꼬리는 항상 0으로 가므로

\[J_M=\mathbb E\big[|X|\mathbf 1_{\{|X|>M\}}\big] \xrightarrow[M\to\infty]{}0.\]

따라서 충분히 큰 \(M\)에 대해 \(J_M<\varepsilon/3\)이 되게 할 수 있다.

7단계. \(\varepsilon\)-논법의 마무리. 먼저 큰 \(M\)을 골라

\[\sup_n I_{n,M}<\varepsilon/3,\qquad J_M<\varepsilon/3\]

가 되게 한다. 그런 다음 이 \(M\)을 고정하고, 4단계에서 본 \(K_{n,M}\to 0\)을 이용하여 충분히 큰 \(n\)에 대해

\[K_{n,M}<\varepsilon/3\]

가 되게 한다. 그러면 그 \(n\)에 대해

\[\mathbb E|X_n-X| \le I_{n,M}+J_M+K_{n,M}<\varepsilon.\]

따라서 \(\mathbb E|X_n-X|\to 0\), 즉 \(X_n\to X\) in \(L^1\)이다.


15. 측도변환과 밀도과정

정의 15.1 — 밀도과정

여과 \((\mathcal F_t)_{0\le t\le T}\)를 갖는 확률공간 위에서 \(\mathbb Q\ll\mathbb P\)라 하자. 최종 우도비를 \(L:=\dfrac{d\mathbb Q}{d\mathbb P}\)라 놓으면

\[Z_t:=\mathbb E_{\mathbb P}[L\mid\mathcal F_t],\qquad 0\le t\le T\]

를 \(\mathbb Q\)의 \(\mathbb P\)에 대한 밀도과정이라고 한다.

정의 15.2 — 마팅게일

적응과정 \((M_t)\)가 각 시점에서 적분가능하고, 모든 \(s\le t\)에 대해

\[\mathbb E[M_t\mid\mathcal F_s]=M_s\]

를 만족하면 \((M_t)\)를 \(\mathbb P\)-마팅게일이라고 한다. 밀도과정이 왜 마팅게일이 되는지는 “미래 전체 우도비를 현재 정보로 부분 평균한 값”이라는 정의 자체에 들어 있다.

정리 15.1 — 밀도과정은 \(\mathbb P\)-마팅게일이다

위 정의의 \((Z_t)\)는 비음수 \(\mathbb P\)-마팅게일이며, 모든 \(t\)와 모든 \(A\in\mathcal F_t\)에 대해 \(\mathbb Q(A)=\int_A Z_t\,d\mathbb P\)가 성립한다.

증명

1단계. 비음수성과 적분가능성. \(L=d\mathbb Q/d\mathbb P\)는 확률밀도이므로 \(L\ge 0\) \(\mathbb P\)-a.s.이다. 조건부기대는 비음수성을 보존하므로 \(Z_t=\mathbb E_{\mathbb P}[L\mid\mathcal F_t]\ge 0\)이다. 또한

\[\mathbb E_{\mathbb P}[Z_t]=\mathbb E_{\mathbb P}[L]=\int_\Omega \frac{d\mathbb Q}{d\mathbb P}\,d\mathbb P=\mathbb Q(\Omega)=1.\]

따라서 각 \(Z_t\)는 적분가능하다.

2단계. 마팅게일 성질. \(s\le t\)를 잡으면 tower property에 의해

\[\mathbb E_{\mathbb P}[Z_t\mid\mathcal F_s] = \mathbb E_{\mathbb P}[\mathbb E_{\mathbb P}[L\mid\mathcal F_t]\mid\mathcal F_s] = \mathbb E_{\mathbb P}[L\mid\mathcal F_s] = Z_s.\]

따라서 \((Z_t)\)는 \(\mathbb P\)-마팅게일이다.

3단계. 시점 \(t\)의 밀도 표현. 임의의 \(A\in\mathcal F_t\)에 대해, 조건부기대의 defining property를 \(X=L\), \(\mathcal G=\mathcal F_t\)에 적용하면

\[\int_A Z_t\,d\mathbb P = \int_A L\,d\mathbb P.\]

오른쪽은 밀도의 정의에 의해 \(\mathbb Q(A)\)와 같다. 즉

\[\mathbb Q(A)=\int_A Z_t\,d\mathbb P.\]

이는 “최종 밀도 \(L\) 대신 시점 \(t\)의 밀도과정 \(Z_t\)만 알아도 \(\mathcal F_t\)-사건의 확률을 계산할 수 있다”는 뜻이다.

정리 15.2 — 시점 \(t\)에서의 기대값 변환

\(X\)가 \(\mathcal F_t\)-가측이고 \(\mathbb Q\)-적분가능하면 \(\mathbb E_{\mathbb Q}[X]=\mathbb E_{\mathbb P}[Z_tX]\)이다.

증명

밀도의 정의로부터 우선

\[\mathbb E_{\mathbb Q}[X]=\int_\Omega X\,d\mathbb Q = \int_\Omega XL\,d\mathbb P = \mathbb E_{\mathbb P}[XL].\]

이제 조건부기대를 넣어

\[\mathbb E_{\mathbb P}[XL] = \mathbb E_{\mathbb P}\big[\mathbb E_{\mathbb P}[XL\mid\mathcal F_t]\big].\]

그런데 \(X\)는 \(\mathcal F_t\)-가측이므로 pull-out property를 적용할 수 있다:

\[\mathbb E_{\mathbb P}[XL\mid\mathcal F_t] = X\,\mathbb E_{\mathbb P}[L\mid\mathcal F_t] = XZ_t.\]

따라서

\[\mathbb E_{\mathbb Q}[X]=\mathbb E_{\mathbb P}[XZ_t].\]

증명이 끝났다.


16. 뉴메레르와 뉴메레르 기준 표시가격

정의 16.1 — 뉴메레르

양의 적응과정 \((N_t)_{0\le t\le T}\)가 모든 시점에서 거의 확실하게 \(N_t>0\)를 만족하면 이를 뉴메레르라고 한다. 직관적으로는 모든 자산가격을 이 과정으로 나누어 같은 단위로 재표현할 때의 기준 자산이다.

정의 16.2 — 뉴메레르 기준 표시가격

자산가격과 파생상품가격을 각각 \(S_t\), \(V_t\)라 할 때 \(\widetilde S_t:=S_t/N_t\), \(\widetilde V_t:=V_t/N_t\)를 \(N\)을 기준으로 한 표시가격이라 한다. 사용자가 요청한 표현대로 말하면, \(\widetilde V_t\)는 뉴메레르로 나눈 파생가격, 즉 뉴메레르 derivative의 핵심 대상이다.

정의 16.3 — 뉴메레르-마팅게일 측도

확률측도 \(\mathbb Q^N\)가 \(\mathbb P\)와 동등하고, 모든 거래가능 자산의 \(N\)-기준 표시가격이 \(\mathbb Q^N\)-마팅게일이면 \(\mathbb Q^N\)을 \(N\)에 대응하는 뉴메레르-마팅게일 측도라고 한다.

정리 16.1 — 뉴메레르 측도 아래의 가격 공식

어떤 확률측도 \(\mathbb Q^N\sim\mathbb P\) 아래에서 모든 거래가능 자산의 뉴메레르 기준 표시가격이 마팅게일이라고 하자. 그러면 만기 \(T\)의 현금흐름 \(X\)를 지급하는 파생상품의 시점 \(t\) 가격은

\[V_t=N_t\,\mathbb E_{\mathbb Q^N}\!\left[\frac{X}{N_T}\middle|\mathcal F_t\right]\]

이다.

증명

파생상품을 정확히 복제하는 자기금융 전략의 가치과정을 \(V\)라 하자. 가정에 의해 모든 거래가능 자산을 \(N\)으로 나눈 표시가격은 \(\mathbb Q^N\)-마팅게일이다. 자기금융 전략의 선형결합 역시 거래가능 자산들로 이루어지므로, \(\widetilde V_t:=V_t/N_t\)도 \(\mathbb Q^N\)-마팅게일이다.

마팅게일의 정의에 의해

\[\widetilde V_t = \mathbb E_{\mathbb Q^N}[\widetilde V_T\mid\mathcal F_t].\]

여기서 만기에는 파생상품의 가치가 곧 현금흐름과 같으므로 \(V_T=X\)이다. 따라서

\[\widetilde V_T = \frac{V_T}{N_T} = \frac{X}{N_T}.\]

이를 위 식에 대입하면

\[\frac{V_t}{N_t}=\mathbb E_{\mathbb Q^N}\!\left[\frac{X}{N_T}\middle|\mathcal F_t\right].\]

이제 양변에 \(N_t\)를 곱하면

\[V_t=N_t\,\mathbb E_{\mathbb Q^N}\!\left[\frac{X}{N_T}\middle|\mathcal F_t\right].\]

정리가 증명되었다.

정리 16.2 — 두 뉴메레르 사이의 측도변환

두 뉴메레르 \(N\), \(M\)에 대한 측도 \(\mathbb Q^N\), \(\mathbb Q^M\)가 각각 존재하고, 공통 기초측도 \(\mathbb P\)에 대해 밀도 \(L_T^N=\dfrac{d\mathbb Q^N}{d\mathbb P}\), \(L_T^M=\dfrac{d\mathbb Q^M}{d\mathbb P}\)를 갖는다고 하자. 그러면

\[\frac{d\mathbb Q^M}{d\mathbb Q^N}=\frac{L_T^M}{L_T^N}\]

이며, 특히 모든 만기지급액 \(X\)에 대해

\[N_t\,\mathbb E_{\mathbb Q^N}\!\left[\frac{X}{N_T}\middle|\mathcal F_t\right]=M_t\,\mathbb E_{\mathbb Q^M}\!\left[\frac{X}{M_T}\middle|\mathcal F_t\right].\]
증명

1단계. 체인 룰. 임의의 가측집합 \(A\)에 대해

\[\mathbb Q^M(A)=\int_A L_T^M\,d\mathbb P.\]

한편 \(d\mathbb Q^N=L_T^N\,d\mathbb P\)이므로, \(L_T^N>0\) \(\mathbb P\)-a.s.인 곳에서

\[L_T^M\,d\mathbb P = \frac{L_T^M}{L_T^N}\,d\mathbb Q^N.\]

따라서

\[\mathbb Q^M(A)=\int_A \frac{L_T^M}{L_T^N}\,d\mathbb Q^N.\]

Radon-Nikodym 미분의 유일성 정리 12.3에 의해

\[\frac{d\mathbb Q^M}{d\mathbb Q^N}=\frac{L_T^M}{L_T^N}.\]

2단계. 가격 공식의 불변성. 동일한 지급액 \(X\)를 갖는 동일한 파생상품의 시점 \(t\) 무차익 가격을 \(V_t\)라 하자. 정리 16.1을 뉴메레르 \(N\)에 대해 적용하면

\[V_t = N_t\,\mathbb E_{\mathbb Q^N}\!\left[\frac{X}{N_T}\middle|\mathcal F_t\right].\]

같은 정리를 뉴메레르 \(M\)에 대해 적용하면

\[V_t = M_t\,\mathbb E_{\mathbb Q^M}\!\left[\frac{X}{M_T}\middle|\mathcal F_t\right].\]

양변 모두 같은 파생상품 가격 \(V_t\)를 나타내므로

\[N_t\,\mathbb E_{\mathbb Q^N}\!\left[\frac{X}{N_T}\middle|\mathcal F_t\right]=M_t\,\mathbb E_{\mathbb Q^M}\!\left[\frac{X}{M_T}\middle|\mathcal F_t\right].\]

즉 뉴메레르를 바꾸어도 가격 자체는 바뀌지 않고, 단지 조건부기대를 취하는 측도와 나누는 기준 자산이 함께 변할 뿐이다.


17. Girsanov 정리

Girsanov 정리의 핵심은, 적절한 지수밀도로 측도를 바꾸면 Brownian motion의 드리프트를 제거하거나 새로 넣을 수 있다는 사실이다. 여기서는 증명을 완전히 쓰기 위해 단순 예측가능 드리프트 버전을 먼저 제시한다. 이 버전만으로도 왜 위험중립측도 아래에서 드리프트가 바뀌는지, 왜 뉴메레르 변경이 Brownian motion의 이동으로 나타나는지 구조를 명확히 볼 수 있다.

정의 17.1 — Brownian motion

확률과정 \((W_t)_{0\le t\le T}\)가 다음을 만족하면 Brownian motion이라 한다.

  1. \(W_0=0\) 거의 확실하게.
  2. 경로가 거의 확실하게 연속이다.
  3. 임의의 \(0\le s
  4. 서로 겹치지 않는 시간구간의 증분들은 서로 독립이다.
정의 17.2 — 단순 예측가능 드리프트

분할 \(0=t_0 \[\lambda_t:=\sum_{k=0}^{n-1}\lambda_k\mathbf 1_{(t_k,t_{k+1}]}(t)\]

를 단순 예측가능 드리프트라 한다.

정의 17.3 — 지수밀도

\((W_t)\)가 \(\mathbb P\)-Brownian motion일 때, 위 \(\lambda\)에 대해

\[Z_T:=\exp\!\left(-\int_0^T \lambda_s\,dW_s-\frac12\int_0^T \lambda_s^2\,ds\right)\]

를 지수밀도라고 한다. 단순형에서는 \(\Delta_kW:=W_{t_{k+1}}-W_{t_k}\), \(\Delta_k:=t_{k+1}-t_k\)라 쓸 때

\[Z_T=\prod_{k=0}^{n-1}\exp\!\left(-\lambda_k\Delta_kW-\frac12\lambda_k^2\Delta_k\right).\]

정리 17.1 — 지수밀도의 평균은 1이다

위 정의의 \(Z_T\)는 비음수이고 \(\mathbb E_{\mathbb P}[Z_T]=1\)이다.

증명

비음수성은 지수함수의 값이 항상 양수라는 사실에서 즉시 따라온다. 따라서 남은 일은 기대값이 1임을 보이는 것이다.

1단계. 곱형 표현. 단순 드리프트이므로

\[Z_T=\prod_{k=0}^{n-1}\exp\!\left(-\lambda_k\Delta_kW-\frac12\lambda_k^2\Delta_k\right).\]

여기서 \(\lambda_k\)는 \(\mathcal F_{t_k}\)-가측이고, \(\Delta_kW\)는 \(\mathcal F_{t_k}\)와 독립이며 \(N(0,\Delta_k)\)를 따른다.

2단계. 마지막 구간부터 조건부기대. 마지막 인수를

\[Y_{n-1}:=\exp\!\left(-\lambda_{n-1}\Delta_{n-1}W-\frac12\lambda_{n-1}^2\Delta_{n-1}\right)\]

라고 두자. \(\mathcal F_{t_{n-1}}\)에 대해 조건부기대를 취하면

\[\mathbb E_{\mathbb P}[Y_{n-1}\mid\mathcal F_{t_{n-1}}] = e^{-\frac12\lambda_{n-1}^2\Delta_{n-1}}\,\mathbb E_{\mathbb P}\big[e^{-\lambda_{n-1}\Delta_{n-1}W}\mid\mathcal F_{t_{n-1}}\big].\]

이제 \(\lambda_{n-1}\)는 조건부상수로 볼 수 있고, \(\Delta_{n-1}W\sim N(0,\Delta_{n-1})\)이므로 정규분포의 적률생성함수에서

\[\mathbb E[e^{uN}] = e^{\frac12u^2\sigma^2}\qquad (N\sim N(0,\sigma^2))\]

를 \(u=-\lambda_{n-1}\), \(\sigma^2=\Delta_{n-1}\)에 적용하면

\[\mathbb E_{\mathbb P}\big[e^{-\lambda_{n-1}\Delta_{n-1}W}\mid\mathcal F_{t_{n-1}}\big] = e^{\frac12\lambda_{n-1}^2\Delta_{n-1}}.\]

따라서

\[\mathbb E_{\mathbb P}[Y_{n-1}\mid\mathcal F_{t_{n-1}}]=1.\]

3단계. 반복 소거. 이제

\[Z_T = Z_{t_{n-1}}\,Y_{n-1}\]

로 쓸 수 있으므로 tower property에 의해

\[\mathbb E_{\mathbb P}[Z_T] = \mathbb E_{\mathbb P}\big[\mathbb E_{\mathbb P}[Z_{t_{n-1}}Y_{n-1}\mid\mathcal F_{t_{n-1}}]\big] = \mathbb E_{\mathbb P}\big[Z_{t_{n-1}}\,\mathbb E_{\mathbb P}[Y_{n-1}\mid\mathcal F_{t_{n-1}}]\big] = \mathbb E_{\mathbb P}[Z_{t_{n-1}}].\]

같은 계산을 직전 구간에 반복하면

\[\mathbb E_{\mathbb P}[Z_{t_{n-1}}]=\mathbb E_{\mathbb P}[Z_{t_{n-2}}]=\cdots=\mathbb E_{\mathbb P}[Z_{t_0}].\]

그런데 \(t_0=0\)이고 \(Z_{t_0}=1\)이므로

\[\mathbb E_{\mathbb P}[Z_T]=1.\]

정리 17.2 — Girsanov 정리의 단순 예측가능 버전

\(d\mathbb Q:=Z_T\,d\mathbb P\)로 확률측도 \(\mathbb Q\)를 정의하자. 그리고

\[W_t^{\mathbb Q}:=W_t+\int_0^t \lambda_s\,ds\]

라고 두자. 그러면 \((W_t^{\mathbb Q})_{0\le t\le T}\)는 \(\mathbb Q\)-Brownian motion이다.

증명

Brownian motion의 네 가지 정의 조건을 차례대로 확인한다.

1단계. 시작점과 연속성. \(W_0^{\mathbb Q}=W_0+0=0\)이다. 또한 \(W\)의 경로는 연속이고, \(t\mapsto\int_0^t\lambda_sds\)도 연속이므로 \(W^{\mathbb Q}\) 역시 연속경로를 가진다.

2단계. 한 구간 증분의 특성함수 계산. 분할의 한 구간 \((t_k,t_{k+1}]\)를 잡고, \(A\in\mathcal F_{t_k}\), \(u\in\mathbb R\)를 택하자. 단순 드리프트 정의에 의해

\[W_{t_{k+1}}^{\mathbb Q}-W_{t_k}^{\mathbb Q}=\Delta_kW+\lambda_k\Delta_k.\]

따라서

\[\mathbb E_{\mathbb Q}\big[\mathbf 1_A e^{iu(W_{t_{k+1}}^{\mathbb Q}-W_{t_k}^{\mathbb Q})}\big] = \mathbb E_{\mathbb P}\big[\mathbf 1_A Z_T e^{iu(\Delta_kW+\lambda_k\Delta_k)}\big].\]

3단계. \(Z_T\)의 분해. \(Z_T\)를 \(t_k\) 이전 부분, \(k\)번째 구간 부분, 이후 구간 부분으로 나누면

\[Z_T = Z_{t_k}\cdot \exp\!\left(-\lambda_k\Delta_kW-\frac12\lambda_k^2\Delta_k\right)\cdot R_k,\]

가 된다. 여기서 \(Z_{t_k}\)는 \(\mathcal F_{t_k}\)-가측이고, \(R_k\)는 \(t_{k+1}\) 이후 구간에 대한 지수인수들의 곱이다.

4단계. 미래 구간 인수의 소거. 정리 17.1의 계산을 \(\mathcal F_{t_{k+1}}\)에 대해 조건부로 적용하면

\[\mathbb E_{\mathbb P}[R_k\mid\mathcal F_{t_{k+1}}]=1.\]

따라서 tower property를 사용하면

\[\mathbb E_{\mathbb Q}\big[\mathbf 1_A e^{iu(W_{t_{k+1}}^{\mathbb Q}-W_{t_k}^{\mathbb Q})}\big] =\mathbb E_{\mathbb P}\! \left[\mathbf 1_A Z_{t_k} \exp\!\left(-\lambda_k\Delta_kW-\frac12\lambda_k^2\Delta_k\right)e^{iu(\Delta_kW+\lambda_k\Delta_k)}\right].\]

5단계. \(\mathcal F_{t_k}\)-조건부 특성함수. 이제 \(\mathcal F_{t_k}\)에 대해 조건부기대를 취한다. \(\lambda_k\)는 \(\mathcal F_{t_k}\)-가측이고 \(\Delta_kW\sim N(0,\Delta_k)\)는 \(\mathcal F_{t_k}\)와 독립이므로

\[\mathbb E_{\mathbb P}\!\left[e^{(iu-\lambda_k)\Delta_kW+iu\lambda_k\Delta_k-\frac12\lambda_k^2\Delta_k}\middle|\mathcal F_{t_k}\right] =e^{iu\lambda_k\Delta_k-\frac12\lambda_k^2\Delta_k}\,\mathbb E\!\left[e^{(iu-\lambda_k)N}\right],\]

여기서 \(N\sim N(0,\Delta_k)\)이다. 정규분포의 적률생성함수로부터

\[\mathbb E[e^{(iu-\lambda_k)N}] = \exp\!\left(\frac12(iu-\lambda_k)^2\Delta_k\right).\]

따라서 전체 지수는

\[iu\lambda_k\Delta_k-\frac12\lambda_k^2\Delta_k + \frac12(iu-\lambda_k)^2\Delta_k.\]

이제 제곱을 전개하면

\[(iu-\lambda_k)^2 = -u^2 - 2iu\lambda_k + \lambda_k^2.\]

따라서 위 지수는

\[\begin{aligned} iu\lambda_k\Delta_k-\frac12\lambda_k^2\Delta_k + \frac12(-u^2-2iu\lambda_k+\lambda_k^2)\Delta_k &= iu\lambda_k\Delta_k-\frac12\lambda_k^2\Delta_k-\frac12u^2\Delta_k-iu\lambda_k\Delta_k+\frac12\lambda_k^2\Delta_k\ &= -\frac12u^2\Delta_k. \end{aligned}\]

결국

\[\mathbb E_{\mathbb P}\!\left[e^{(iu-\lambda_k)\Delta_kW+iu\lambda_k\Delta_k-\frac12\lambda_k^2\Delta_k}\middle|\mathcal F_{t_k}\right] = e^{-u^2\Delta_k/2}.\]

6단계. 조건부분포의 결정. 앞 결과를 대입하면

\[\mathbb E_{\mathbb Q}\big[\mathbf 1_A e^{iu(W_{t_{k+1}}^{\mathbb Q}-W_{t_k}^{\mathbb Q})}\big] = e^{-u^2\Delta_k/2}\,\mathbb E_{\mathbb P}[\mathbf 1_A Z_{t_k}] = e^{-u^2\Delta_k/2}\,\mathbb E_{\mathbb Q}[\mathbf 1_A].\]

즉 \(W_{t_{k+1}}^{\mathbb Q}-W_{t_k}^{\mathbb Q}\)의 \(\mathcal F_{t_k}\)-조건부분포는 과거에 의존하지 않는 \(N(0,\Delta_k)\)이다. 이것은 그 증분이 과거와 독립이고 평균 0, 분산 \(\Delta_k\)의 정규분포를 가짐을 뜻한다.

7단계. 여러 구간 증분의 독립성. 위 계산을 각 구간에 대해 순차적으로 적용하면, 결합특성함수가 각 구간 특성함수의 곱으로 분해된다. 따라서 서로 다른 구간 증분들은 \(\mathbb Q\)-아래에서도 서로 독립이다.

연속성, 시작점 0, 정규증분, 독립증분이 모두 확인되었으므로 \(W^{\mathbb Q}\)는 \(\mathbb Q\)-Brownian motion이다.

일반형과의 연결

실무와 금융수학 교과서에서는 보통 \(\lambda\)를 일반적인 예측가능 과정으로 두고 Novikov 조건 또는 Kazamaki 조건 아래에서 위 정리를 일반화한다. 그러나 핵심 계산은 이미 위 증명에 모두 들어 있다. 측도밀도 \(Z_T\)가 정규증분의 선형항과 이차보정항을 함께 포함하기 때문에, 새 측도 아래에서는 Brownian motion에 붙어 있던 드리프트가 정확히 상쇄된다. Chapter 4 자체는 실증 장이지만, 이후 장들에서 등장하는 위험중립측도와 뉴메레르 변경을 읽으려면 이 계산 구조를 정확히 알고 있어야 한다.

Part B — Chapter 4 본문
Empirical and Statistical Evidence: Activity and Market Quality

제4장 개관

제3장이 가격과 수익률의 통계적 성질을 다뤘다면, 제4장은 거래 활동량과 시장 질(market quality)을 다룬다. 구체적으로, 4.1절은 일별 거래량과 변동성의 관계를 회귀분석으로 규명한다. 4.2절은 일중 거래량 패턴, 초(second) 내 패턴, 가격의 round number 집중 현상을 분석한다. 4.3절은 시장 질의 핵심 지표들인 스프레드, 변동성, 시장 심도, 가격충격을 체계적으로 측정하고 분석한다. 4.4절은 주문 취소 활동과 호가창으로부터의 거리에 따른 체결 패턴을 분석한다. 마지막으로 4.5절은 숨겨진 주문(hidden orders)의 역할을 다룬다. 분석 대상은 2013년 NASDAQ 데이터에서 유동성 수준이 서로 다른 네 종목 ISNS, FARO, MENT, AAPL이다.


4.1 일별 거래량과 변동성

제3장에서는 자산 가격 수준과 수익률이 하루 단위로는 예측하기 어렵고, 시장 전체적인 힘에 의해 움직인다는 점을 보았다. 단기 시간 지평에서 이 가격 변화들은 두꺼운 꼬리를 가지며, 빠른 변화에 노출되어 있고, 변화들이 시간적으로 군집하며, 이전 수준으로 되돌아가려는 경향이 있다.

하지만 거래 활동량, 보통 거래량(volume, 주식 수 또는 거래 금액으로 측정)은 다른 동학 구조를 가지며, 이는 시장 데이터를 보는 방식에 중요한 함의를 준다. Andersen & Bondarenko(2014)는 이 아이디어를 다음과 같이 포착한다:

거래량과 변동성은 높은 상관관계를 가지며 강한 시계열 지속성을 보이므로, 변동성과 상관된 어떤 변수든 미래 변동성에 대해 자연스럽게 예측력을 가질 수밖에 없다. 이는 bid-ask 스프레드, 호가 강도, 거래 건수, (정규화된) 거래량 등에 대해 모두 성립한다.

회귀 모형 M1과 M2

일별 거래량과 변동성의 관계를 정량화하기 위해, 네 종목(ISNS, FARO, MENT, AAPL)의 일별 거래량을 피설명변수로 하는 강건 OLS 회귀를 추정한다. 피설명변수는 하루 동안 거래된 주식 수의 로그인 \(\log(1 + Q_t)\)이다(일부 종목, 특히 ISNS는 거래가 없는 날이 있어 \(Q_t = 0\)인 경우가 존재하므로 1을 더한다).

설명변수들은 제3장의 일중 수익률 모형에서 사용한 변수들이다. 모형 1(M1)은 다음을 포함한다: 상수, 전날 거래량(시계열 지속성 포착), VIX와 SPY의 일중 수익률(시장 전반 변동성), 당일 자산 수익률, NASDAQ 순주문흐름(OF).

모형 M1 — 일별 거래량 회귀 (기본 모형)
\[\log(1 + Q_{t,j}) = \alpha + \beta_{1,j}\log(1 + Q_{t-1,j}) + \beta_{2,j}\,SPY_t + \beta_{3,j}\,VIX_t + \beta_{4,j}\,r_{t,j} + \beta_{5,j}\,OF_t + \varepsilon_j\]

여기서 \(Q_{t,j}\)는 자산 \(j\)의 시점 \(t\)에서의 거래량, \(SPY_t\)는 SPY ETF의 일중 수익률(시장 전반의 대리 변수), \(VIX_t\)는 VIX 지수의 일중 변화(시장 심리/불확실성의 대리 변수), \(r_{t,j}\)는 자산 \(j\)의 당일 수익률, \(OF_t\)는 NASDAQ에서의 순주문흐름(매수량 - 매도량)이다.

모형 2(M2)는 M1에 네 가지 추가 설명변수를 포함한다.

모형 M2 — 일별 거래량 회귀 (확장 모형)
\begin{align} \log(1 + Q_{t,j}) &= \alpha + \beta_{1,j}\log(1 + Q_{t-1,j}) + \beta_{2,j}\,SPY_t + \beta_{3,j}\,VIX_t + \beta_{4,j}\,r_{t,j} + \beta_{5,j}\,OF_t \\ &\quad + \beta_{6,j}(SPY_t)^2 + \beta_{7,j}(VIX_t)^2 + \beta_{8,j}\,HL_t + \beta_{9,j}(r_t)^2 + \varepsilon_j \end{align}

추가된 네 변수의 의미:

  • \((SPY_t)^2\): SPY ETF 일중 수익률의 제곱 — 시장 전반 변동성의 대리 변수
  • \((VIX_t)^2\): VIX 일중 수익률의 제곱 — 변동성의 변동성(vol-of-vol), 즉 시장 심리 일중 변화의 변동성 대리 변수
  • \(HL_t\): 당일 가격 범위(\(\max P_t - \min P_t\)) — 당일 가격 변동성의 직접 측정값
  • \((r_t)^2\): 자산 일중 수익률의 제곱 — 일중 변동성의 또 다른 별개 측정값

표 4.1: 강건 OLS 추정 결과

표 4.1 — 일중 거래량의 강건 OLS 회귀 결과 (굵은 글씨: 5% 유의)
Variables ISNS FARO MENT AAPL
M1 M2 M1 M2 M1 M2 M1 M2
constant 6.47 5.40 4.88 5.22 7.77 7.70 5.46 9.66
\(\log(1+Q_{t-1})\) 0.22 0.22 0.58 0.52 0.41 0.39 0.67 0.38
SPY(%) 0.04 0.19 -0.17 -0.21 0.03 0.07 0.00 0.03
VIX(%) 0.02 0.02 0.00 -0.01 0.01 0.02 0.00 -0.00
\(r_t\) -0.01 -0.03 0.05 0.04 0.06 0.01 0.01 -0.01
Order Flow 0.02 0.04 0.00 -0.00 -0.01 -0.00 -0.00 0.00
\((SPY_t)^2\)   -0.01   0.09   -0.11   -0.03
\((VIX_t)^2\)   0.00   -0.00   0.00   0.00
HL-volat   0.32   0.10   0.20   0.28
\((r_t)^2\)   -0.01   0.01   -0.02   -0.02
Adj. \(R^2\) 0.03 0.18 0.30 0.50 0.17 0.24 0.38 0.65

표 4.1. 일중 거래량의 강건 OLS 회귀 결과. 굵은 글씨는 5% 유의수준에서 통계적으로 유의함을 나타낸다.

표 4.1의 결과는 중요한 패턴을 드러낸다. 먼저 시장 변수(VIX, SPY)와 순주문흐름이 거래량에 미치는 유의한 효과가 없다는 점이다. 당일 수익률도 유의하지 않다 — FARO는 M1에서 양의 유의한 효과를 보이지만, 일중 변동성의 더 나은 대리 변수를 포함한 M2에서 이 효과가 사라진다. 핵심 발견은 두 가지다. 첫째, 거래량은 모든 자산에서 강한 시계열 지속성을 보인다. 전날 거래량 계수(\(\beta_1\))가 M1과 M2 모두에서 모든 자산에 대해 양의 유의한 값을 가진다. 둘째, 거래량은 변동성과 강한 '상관관계'를 보인다. M2에서 HL-변동성(\(HL_t\)) 계수가 모든 자산에서 양의 유의한 값을 가진다. 반면 수익률 제곱 \((r_t)^2\)은 HL-변동성이 존재할 때 통계적으로 유의하지 않다. 조정 \(R^2\)는 M1에서 M2로 가면서 크게 향상되는데, FARO의 경우 0.30에서 0.50으로, AAPL의 경우 0.38에서 0.65로 상승하여, 일중 변동성 변수들이 거래량을 상당 부분 설명함을 보여준다.


4.1.3 회귀계수의 수학적 의미와 증명

본문의 회귀표를 숫자 나열로만 읽으면 해석이 반쯤 멈춘다. 여기서는 제4.1절에서 사용된 회귀식이 정확히 무엇을 계산하는지, 왜 계수의 부호와 크기가 거래량과 변동성의 결합 방향을 말해 주는지, 로그-로그 회귀의 계수가 왜 탄력성으로 읽히는지를 정리와 증명으로 다시 적는다. 이 정식화는 본문 표 4.1의 계수를 해석하는 최소 단위다.

정의 4.1.3.1 — 표본 공분산과 표본 분산

관측치 \( (x_1,y_1),\ldots,(x_n,y_n) \)에 대해 표본평균을 \( \bar x = \frac{1}{n}\sum_{i=1}^n x_i \), \( \bar y = \frac{1}{n}\sum_{i=1}^n y_i \)라 두자. 표본 공분산과 표본 분산을 각각

\[ S_{xy}=\sum_{i=1}^n (x_i-\bar x)(y_i-\bar y), \qquad S_{xx}=\sum_{i=1}^n (x_i-\bar x)^2 \]

로 둔다. \(S_{xx}>0\)이면 \(x_i\)가 상수가 아니라는 뜻이다.

정의 4.1.3.2 — 절편이 있는 단순 OLS 회귀

응답변수 \(y_i\)와 설명변수 \(x_i\)에 대해

\[ y_i = \alpha + \beta x_i + \varepsilon_i \]

를 가정하고, 잔차제곱합

\[ Q(\alpha,\beta)=\sum_{i=1}^n (y_i-\alpha-\beta x_i)^2 \]

를 최소화하는 \((\hat\alpha,\hat\beta)\)를 OLS 추정량이라 한다.

정리 4.1.3 — 절편이 있는 단순 OLS의 닫힌형 해

정의 4.1.3.2의 OLS 문제에서 \(S_{xx}>0\)이면 기울기와 절편은

\[ \hat\beta = \frac{S_{xy}}{S_{xx}}, \qquad \hat\alpha = \bar y - \hat\beta\bar x \]

로 주어진다. 특히 \(\hat\beta\)의 부호는 \(S_{xy}\)의 부호와 정확히 일치한다.

증명

먼저 최소화 대상 함수 \(Q(\alpha,\beta)\)를 \(\alpha\)와 \(\beta\)에 대해 미분한다. 제곱함수의 미분법을 그대로 적용하면

\[ \frac{\partial Q}{\partial \alpha} = -2\sum_{i=1}^n (y_i-\alpha-\beta x_i), \] \[ \frac{\partial Q}{\partial \beta} = -2\sum_{i=1}^n x_i (y_i-\alpha-\beta x_i). \]

최적점에서는 두 편미분이 모두 0이어야 하므로 정규방정식은

\[ \sum_{i=1}^n (y_i-\alpha-\beta x_i)=0, \] \[ \sum_{i=1}^n x_i(y_i-\alpha-\beta x_i)=0 \]

가 된다. 첫 번째 식을 먼저 정리하면

\[ \sum_{i=1}^n y_i - n\alpha - \beta\sum_{i=1}^n x_i = 0. \]

양변을 \(n\)으로 나누면

\[ \bar y - \alpha - \beta \bar x = 0, \]

\[ \alpha = \bar y - \beta\bar x \]

를 얻는다. 이제 이를 두 번째 정규방정식에 대입한다.

\[ \sum_{i=1}^n x_i y_i - \alpha\sum_{i=1}^n x_i - \beta\sum_{i=1}^n x_i^2 = 0. \]

여기서 \(\alpha=\bar y-\beta\bar x\), \(\sum x_i = n\bar x\)를 넣으면

\[ \sum_{i=1}^n x_i y_i - (\bar y-\beta\bar x)n\bar x - \beta\sum_{i=1}^n x_i^2 = 0. \]

괄호를 풀면

\[ \sum_{i=1}^n x_i y_i - n\bar x\bar y + n\beta \bar x^2 - \beta\sum_{i=1}^n x_i^2 = 0. \]

\(\beta\)가 붙은 항들을 오른쪽으로 옮기면

\[ \sum_{i=1}^n x_i y_i - n\bar x\bar y = \beta\left(\sum_{i=1}^n x_i^2 - n\bar x^2\right). \]

이제 왼쪽과 오른쪽이 각각 무엇인지 하나씩 적는다. 먼저

\[ \sum_{i=1}^n (x_i-\bar x)(y_i-\bar y) = \sum_{i=1}^n x_i y_i - \bar y\sum_{i=1}^n x_i - \bar x\sum_{i=1}^n y_i + n\bar x\bar y. \]

\(\sum x_i=n\bar x\), \(\sum y_i=n\bar y\)를 쓰면

\[ \sum_{i=1}^n (x_i-\bar x)(y_i-\bar y)=\sum_{i=1}^n x_i y_i - n\bar x\bar y. \]

따라서 왼쪽은 \(S_{xy}\)다. 다음으로

\[ \sum_{i=1}^n (x_i-\bar x)^2 = \sum_{i=1}^n x_i^2 - 2\bar x\sum_{i=1}^n x_i + n\bar x^2 \] \[ = \sum_{i=1}^n x_i^2 - 2n\bar x^2 + n\bar x^2 = \sum_{i=1}^n x_i^2 - n\bar x^2. \]

따라서 오른쪽 괄호는 \(S_{xx}\)다. 결론적으로

\[ S_{xy}=\beta S_{xx} \]

이고 \(S_{xx}>0\)이므로

\[ \hat\beta = \frac{S_{xy}}{S_{xx}}. \]

이 값을 \(\alpha = \bar y - \beta\bar x\)에 다시 대입하면

\[ \hat\alpha = \bar y - \hat\beta\bar x \]

를 얻는다. 마지막으로 \(S_{xx}>0\)이므로 \(\hat\beta\)의 부호는 오직 \(S_{xy}\)의 부호로 결정된다. 즉 공분산이 양수면 추정 기울기가 양수이고, 공분산이 음수면 추정 기울기가 음수다.

정의 4.1.3.3 — 로그-로그 회귀

양의 변수 \(X,Y>0\)에 대해

\[ \log Y = \alpha + \beta \log X + \varepsilon \]

형태의 회귀를 로그-로그 회귀라 한다.

정리 4.1.4 — 로그-로그 계수의 탄력성 해석

정의 4.1.3.3에서 오차항을 고정하고 \(Y\)를 \(X\)의 함수로 보면

\[ Y = e^{\alpha+\varepsilon}X^{\beta} \]

가 된다. 따라서 \(\beta\)는 \(X\)에 대한 \(Y\)의 국소 탄력성

\[ \frac{d\log Y}{d\log X} \]

와 정확히 일치한다.

증명

로그-로그 회귀식을 먼저 지수화한다.

\[ \log Y = \alpha + \beta\log X + \varepsilon \] \[ Y = \exp(\alpha + \beta\log X + \varepsilon). \]

지수함수의 곱셈법칙 \(e^{u+v+w}=e^ue^ve^w\)를 쓰면

\[ Y = e^{\alpha}e^{\beta\log X}e^{\varepsilon}. \]

또한 \(e^{\beta\log X}=(e^{\log X})^{\beta}=X^{\beta}\)이므로

\[ Y = e^{\alpha+\varepsilon}X^{\beta}. \]

이제 양변의 로그를 다시 취하면

\[ \log Y = (\alpha+\varepsilon) + \beta\log X. \]

\(\log X\)를 독립변수로 생각하고 미분하면 상수항 \(\alpha+\varepsilon\)의 미분은 0이고, \(\beta\log X\)의 미분은 \(\beta\)다. 따라서

\[ \frac{d\log Y}{d\log X}=\beta. \]

같은 사실을 보통 미분으로도 확인할 수 있다. \(Y=e^{\alpha+\varepsilon}X^{\beta}\)에서 \(X\)에 대해 미분하면

\[ \frac{dY}{dX}=e^{\alpha+\varepsilon}\beta X^{\beta-1}. \]

여기에 \(X/Y\)를 곱하면

\[ \frac{X}{Y}\frac{dY}{dX} = \frac{X}{e^{\alpha+\varepsilon}X^{\beta}} \cdot e^{\alpha+\varepsilon}\beta X^{\beta-1}. \]

분자와 분모를 약분하면

\[ \frac{X}{Y}\frac{dY}{dX}=\beta. \]

그런데 좌변은 미분형 탄력성의 정의 \(d\log Y/d\log X\)와 같다. 따라서 로그-로그 회귀의 계수 \(\beta\)는 탄력성이다.

4.2 일중 거래 활동

일별 차원에서 거래량의 지속성과 변동성과의 연관을 확인했다면, 이제 하루 안에서, 그리고 더 나아가 초(second) 안에서의 거래 활동 패턴을 살펴본다. 이 패턴들을 이해하는 것은 거래 알고리즘 설계에 직접적인 실용적 함의를 가진다.

4.2.1 일중 거래량 패턴

그림 4.1 — AAPL의 일중 거래량 (2013년 7월 30일, 세 가지 시간 스케일)

그림 4.1은 AAPL의 하루 거래량을 세 가지 다른 시간 스케일로 보여준다.

상단 패널 (전일, 1분 단위): 하루 전체 거래량을 1분 단위로 집계한 것이다. 장 시작과 장 마감에 거래량이 급증하는 것이 두드러진다. 또 정오 무렵에도 세 번째 봉우리가 관찰되는데, 이는 이날 특정적인 현상으로 일반적인 패턴이 아니다. 거래량의 변동성도 매우 크다: 평균 6,898주, 표준편차 7,014주, 왜도 6.14, 첨도 60.83으로 극도로 비정규적 분포를 보인다.

하단 왼쪽 패널 (30분 창, 10초 단위): 장중 30분 창에서 10초 단위로 집계한 거래량(막대)과 1분 평균(두꺼운 선)을 비교한다. 거래 집중 기간과 상대적 조용한 기간이 교차하며 나타난다.

하단 오른쪽 패널 (1분 창, 1초/20ms 단위): 하루 중 1분의 창에서 회색 막대는 1초 단위 거래량, 큰 점들은 20ms 단위 집계다. 이 시간 스케일에서는 거래가 거의 균일하게 분산된 것처럼 보이며, 100주 단위로 체결이 이루어지는 특성이 명확히 보인다.

Figure 4.1

그림 4.1. 2013년 7월 30일 AAPL의 일중 거래량, 세 가지 시간 스케일. 출처: AHFT(2015), Figure 4.1.

Round Lot, Odd Lot, Mixed Lot

거래가 100주 단위로 집중되는 이유는 시장 제도에 있다. Round lot은 100주의 배수를 단위로 하는 주문이다. Odd lot은 100주 미만의 거래이며, 수수료가 높고 특수 규정의 적용을 받는다. Mixed lot은 round lot과 odd lot을 모두 포함하는 거래다. 미국에서 Odd lot은 때로 통합 테이프(consolidated tape)에 표시되지 않으며, 거래 규칙 변경이 진행 중이다(SEC Release No. 34-71057). 거래 알고리즘을 설계할 때 이 구분은 실무적으로 중요하다. 예를 들어 VWAP 알고리즘이나 POV 알고리즘은 자신의 주문이 시장 전체 거래량의 특정 비율을 초과하지 않도록 제한하는 경우가 많은데, 이때 Odd lot 거래를 어떻게 계산할지가 문제가 된다.

그림 4.2 — AAPL과 MENT의 일중 거래량 패턴 (2013년, 열지도와 FDA 곡선)

그림 4.2는 2013년 전체 AAPL과 MENT의 일중 거래량 패턴을 두 가지 방식으로 보여준다.

왼쪽 패널 (열지도): 하루를 5분 단위 창으로 나누고, 각 5분 창에서의 거래량 분포를 열지도로 표현한다. 색깔 선들은 Q1, 중위수, Q3를 나타낸다.

AAPL의 패턴: 장 시작 시 거래량이 매우 크고, 오후 14:00까지 점진적으로 감소한다. 14:00 이후 거래량이 다시 소폭 증가하기 시작하여 장 마감으로 가며 급증한다. 14:00 급등의 합리적 가설은 그 시각에 월별 재무부 예산 같은 경제 지표가 발표되는 경우가 많다는 것이다. 이러한 패턴은 정보 가설과 일치한다: 새로운 정보가 거래량을 늘린다.

오른쪽 패널 (FDA 곡선): 각 거래일의 5분 단위 거래량을 Legendre 다항식에 회귀하여 매끄러운 곡선으로 근사하고, 그 평균(굵은 파란 선)을 그린다. AAPL의 경우 4개의 극단적 이상치 곡선이 관찰된다: 7월 3일(독립기념일), 11월 29일(추수감사절), 12월 24일(크리스마스)의 조기 마감일(13:00 마감), 그리고 8월 22일(NASDAQ 3시간 거래 중단). 이처럼 FDA 곡선이 이상치 식별 도구로도 유용하게 활용된다.

MENT의 패턴: 장 시작과 장 마감의 거래 급증 패턴이 존재하지만 덜 규칙적이다. AAPL과 달리 초반 거래가 예외적으로 느리게 시작하는 날이 많아, 평균적으로 초반 거래량이 하루 중 나머지 시간과 큰 차이가 없다. 장 마감에는 MENT에서도 상당한 거래 집중이 관찰된다.

Figure 4.2

그림 4.2. AAPL(위)과 MENT(아래)의 일중 거래량. 왼쪽: 열지도, 오른쪽: FDA 접근. 출처: AHFT(2015), Figure 4.2.

일중 거래량 패턴의 세 가지 설명 가설

(1) 정보 가설: 새로운 정보가 더 많은 거래량을 유발한다. 장 시작 시 거래량이 크다는 것은 전날 밤 이후 누적된 정보가 가격에 반영되는 과정을 반영한다. 14:00 급등은 경제 지표 발표와 연관된다.

(2) 집행 긴박감(execution urgency) 가설: 장 마감이 가까울수록 포지션 청산 목표를 달성하지 못한 거래자들이 집행을 가속한다. 이 설명은 제7장의 최적 청산 알고리즘에서 수학적으로 정형화된다.

(3) 비용 최소화 가설: 집행 비용이 낮아지는 시간대로 비긴급 주문이 미뤄진다. 제4장 4.3.5절의 Figure 4.11에서 장 마감에 가까울수록 가격충격이 감소함이 보인다. 이 세 가설은 상호 보완적이며, 마감에 높은 거래량이 집중되는 것은 이 모두가 함께 작용하는 결과다.

4.2.2 초 내(Intrasecond) 거래량 패턴

그림 4.3 — AAPL의 초 내 거래 패턴 (2013년)

그림 4.3은 AAPL의 각 밀리초(ms)에서 발생하는 평균 거래 건수와 사분위수(Q1, 중위수, Q3)를 보여준다(이동 평균으로 평활화됨). x축은 초 내의 밀리초(0~999ms), y축은 평균 거래 건수이다.

000~020ms 구간에서 초기 급증이 관찰된 뒤, 약 100ms까지 완만히 감소하는 계곡이 형성된다. 이후에는 뚜렷한 지속적 패턴이 없다. 이 초기 급증의 그럴듯한 설명은 정확히 초가 시작될 때 자동으로 입력되는 주문들이 일부 존재하며, 우리가 관찰하는 것은 이 주문들의 지연(latency) 또는 기계들의 시계 비동기성(clock-asynchronicity)이라는 것이다.

Figure 4.3

그림 4.3. AAPL의 초 내 거래 패턴 (2013년). 출처: AHFT(2015), Figure 4.3.

그림 4.4 — 특정 밀리초에서의 거래 건수 누적분포함수

그림 4.4는 여섯 개의 특정 밀리초에서 거래 건수의 경험적 누적분포함수(CDF)를 보여준다: 초기 세 밀리초(4ms, 5ms, 6ms)와 이후 세 밀리초(104ms, 105ms, 106ms)이다.

초기 밀리초(4~6ms)의 CDF는 이후 밀리초(104~106ms)의 CDF를 확률적으로 우세(first-order stochastically dominate)한다. 즉 초기 밀리초에서 더 많은 거래가 집중됨을 의미한다. 이 패턴은 104~106ms가 아닌 다른 이후 밀리초를 선택해도 유사하게 관찰된다.

Figure 4.4

그림 4.4. 특정 밀리초의 거래 건수 CDF 비교. 출처: AHFT(2015), Figure 4.4.

4.2.3 가격 패턴 — Round Number 선호

거래량 패턴 외에도 가격 패턴을 살펴보는 것이 유익하다. 이론적으로 자산 가격은 주주들이 기업으로부터 받는 미래 이익의 현재 가치를 나타내므로, 이것이 특정 round number에 집중될 필연적 이유는 없다. 그러나 실제 데이터를 보면 전혀 다른 패턴이 관찰된다.

그림 4.5 — 가격의 센트 단위별 체결 빈도 (AAPL)

그림 4.5는 AAPL의 체결 가격을 센트 단위(0~99센트)로 분류한 빈도를 보여준다. Q1, 중위수, Q3가 실선으로 표시된다.

패턴은 매우 뚜렷하다. 정확히 달러 가격(0센트)으로 끝나는 체결이 압도적으로 많다. 50센트에서도 뚜렷한 집중이 관찰된다. 10센트 단위(10, 20, 30, ..., 90센트)와 5센트 단위(5, 15, 25, ...)에서도 평균보다 높은 체결 빈도가 나타나며, 이 차이들은 대부분 통계적으로 유의하다.

이 현상의 자연스러운 해석은 round number 가격에서 유동성을 공급하려는 선호가 존재한다는 것이다. 체결 가격은 대부분 MO가 기존 LO를 체결시킴으로써 결정되므로, round number 가격에서의 집중은 LO를 그 가격에 게시하는 유동성 공급자들에 의해 결정된다. 이는 심리적으로 round number가 '가격 지지선'이나 '저항선'으로 인식되어, 그 가격 수준에서 스톱-로스나 모멘텀 주문들이 집중된다는 가설과 일치한다.

Figure 4.5

그림 4.5. AAPL의 체결 가격 센트 단위별 빈도. 출처: AHFT(2015), Figure 4.5.


4.2.4 일중 패턴의 정식화와 증명

제4.2절의 그림들은 시장 참가자가 체감적으로 알고 있는 사실, 즉 거래가 장 개시와 종료 부근에 몰리고 가격은 호가 단위의 특정 점에 집중된다는 사실을 데이터로 확인한 것이다. 이 절의 그림을 엄밀한 문장으로 바꾸면, 첫째는 시간가변 강도를 가진 계수과정의 평균 패턴에 대한 명제이고, 둘째는 연속적인 잠재가격이 격자 단위로 관측될 때 발생하는 양자화 효과에 대한 명제다.

정의 4.2.4.1 — 시간가변 강도를 가진 계수과정

거래건수 또는 특정 시간구간의 거래량을 세는 계수과정 \(N(t)\)가 다음 성질을 가진다고 하자.

  • \(N(0)=0\).
  • 아주 짧은 구간 \([t,t+h]\)에서 \(P(N(t+h)-N(t)=1)=\lambda(t)h+o(h)\).
  • 같은 구간에서 \(P(N(t+h)-N(t)\ge 2)=o(h)\).

이때 \(\lambda(t)\)를 순간 강도(intensity)라 한다.

정리 4.2.4 — 구간별 평균 거래건수는 강도의 적분이다

정의 4.2.4.1의 조건이 성립하면 임의의 \(0\le a<b\)에 대해

\[ E[N(b)-N(a)] = \int_a^b \lambda(u)\,du \]

가 성립한다. 따라서 여러 날의 동일 시각 구간 평균을 취하면 그 평균은 강도 함수의 일중 프로파일을 추정한다.

증명

먼저 평균함수 \(m(t)=E[N(t)]\)를 둔다. 아주 작은 \(h>0\)에 대해

\[ m(t+h)-m(t)=E[N(t+h)-N(t)]. \]

증분 \(\Delta N_t(h)=N(t+h)-N(t)\)의 가능한 값을 경우로 나누면

\[ E[\Delta N_t(h)] = 0\cdot P(\Delta N_t(h)=0) + 1\cdot P(\Delta N_t(h)=1) + \sum_{k=2}^{\infty} k\,P(\Delta N_t(h)=k). \]

정의에 의해 첫 번째 비자명한 확률은 \(\lambda(t)h+o(h)\)이고, 두 개 이상 점프할 확률은 \(o(h)\)다. 마지막 합은

\[ 0 \le \sum_{k=2}^{\infty} k\,P(\Delta N_t(h)=k) \]

이며, 짧은 구간에서 점프 수의 기댓값이 유한하다는 일반적 계수과정 조건 아래 이 항 역시 \(o(h)\)로 묶인다. 따라서

\[ E[\Delta N_t(h)] = \lambda(t)h + o(h). \]

\[ m(t+h)-m(t)=\lambda(t)h+o(h). \]

양변을 \(h\)로 나누고 \(h\to 0\)을 보내면

\[ \frac{m(t+h)-m(t)}{h}=\lambda(t)+\frac{o(h)}{h} \longrightarrow \lambda(t). \]

따라서 \(m'(t)=\lambda(t)\)이고, 초기조건 \(m(0)=E[N(0)]=0\)을 갖는다. 미적분학의 기본정리에 의해

\[ m(t)=\int_0^t \lambda(u)\,du. \]

이제 \(a<b\)에 대해

\[ E[N(b)-N(a)] = E[N(b)]-E[N(a)] = m(b)-m(a). \]

방금 얻은 식을 대입하면

\[ E[N(b)-N(a)] = \int_0^b \lambda(u)\,du - \int_0^a \lambda(u)\,du = \int_a^b \lambda(u)\,du. \]

마지막 문장을 보이기 위해 각 날짜 \(d=1,\ldots,D\)에 대해 동일 구간의 관측치를 \(X_d=N_d(b)-N_d(a)\)라 두자. 날짜별 독립성과 동일한 장내 강도 구조를 가정하면

\[ E[X_d]=\int_a^b \lambda(u)\,du. \]

표본평균 \(\bar X_D = \frac{1}{D}\sum_{d=1}^D X_d\)에 대해 대수의 법칙을 적용하면

\[ \bar X_D \longrightarrow E[X_1] = \int_a^b \lambda(u)\,du \]

이므로 여러 날의 평균 막대그래프는 강도 함수의 일중 패턴을 추정한다.

정의 4.2.4.2 — 호가 단위에 의한 가격 양자화

잠재 연속가격 \(P^*\)가 실제 시장에서는 최소 호가단위 \(\Delta\)에 맞추어 관측된다고 하자. 관측가격을

\[ P^{obs}=\Delta \cdot \mathrm{round}(P^*/\Delta) \]

로 둔다.

정리 4.2.5 — 라운드 넘버 집중은 격자 구간의 확률질량이다

정수 \(k\)에 대해 \(P^{obs}=k\Delta\)일 확률은

\[ P(P^{obs}=k\Delta) = P\left((k-\tfrac12)\Delta \le P^* < (k+\tfrac12)\Delta\right) \]

와 같다. 따라서 히스토그램의 각 round number 막대는 잠재가격이 해당 반올림 구간에 들어갈 확률질량을 나타낸다.

증명

반올림 연산의 정의를 먼저 쓴다. \(\mathrm{round}(x)=k\)가 되려면 실수 \(x\)는 \(k-\tfrac12\) 이상 \(k+\tfrac12\) 미만의 구간에 있어야 한다. 이를 \(x=P^*/\Delta\)에 적용하면

\[ \mathrm{round}(P^*/\Delta)=k \quad \Longleftrightarrow \quad k-\tfrac12 \le P^*/\Delta < k+\tfrac12. \]

양변에 \(\Delta>0\)를 곱하면 부등호 방향은 변하지 않으므로

\[ \mathrm{round}(P^*/\Delta)=k \quad \Longleftrightarrow \quad (k-\tfrac12)\Delta \le P^* < (k+\tfrac12)\Delta. \]

이제 관측가격의 정의 \(P^{obs}=\Delta\cdot \mathrm{round}(P^*/\Delta)\)를 쓰면

\[ P^{obs}=k\Delta \quad \Longleftrightarrow \quad \mathrm{round}(P^*/\Delta)=k. \]

바로 위의 동치와 결합하면

\[ P^{obs}=k\Delta \quad \Longleftrightarrow \quad (k-\tfrac12)\Delta \le P^* < (k+\tfrac12)\Delta. \]

확률을 취하면 원하는 식

\[ P(P^{obs}=k\Delta) = P\left((k-\tfrac12)\Delta \le P^* < (k+\tfrac12)\Delta\right) \]

가 나온다. 즉 round number 집중은 심리적 선호만으로 해석되는 것이 아니라, 우선 관측 체계 자체가 연속가격을 격자에 투영한다는 사실에서 기계적으로도 발생한다.

4.3 거래와 시장 질 (Market Quality)

금융시장은 경제에서 중요한 역할을 한다. 기업이 자본을 조달하고, 투자자들이 경제 성장에 참여하며, 지분 보유자들이 지분을 현금으로 전환(또는 그 반대)할 수 있는 장을 제공한다. 이 역할을 얼마나 효과적으로 수행하는지를 측정하는 것이 '시장 질'이다.

시장의 효과성을 평가하는 주요 차원들은 다음과 같다. 자산의 진정한 시장 가치를 확인하기 위한 충분한 정보가 존재하는가(가격 정보 효율성), 가치에 충분히 가까운 가격에 원하는 수량을 거래할 수 있는가(실행 비용), 거래가 성사됨을 확신할 수 있는가(신뢰성). 시장 질 측정에는 스프레드, 가격충격, 변동성, 탄력성(resilience), 심도, 정보거래 확률(PIN) 등이 사용된다.

시장 질의 다차원성 — 측도들의 분류
  • 스프레드 (Spreads): 소형 거래의 즉각 실행 비용. 현재 midprice 대비 거래 가격의 차이를 측정.
  • 가격충격 (Price Impact): 대형 거래의 실행 비용. LOB를 걸어가며 발생하는 가격 열화(deterioration)를 측정.
  • 변동성 (Volatility): 가격이 자산의 진정한 가치를 얼마나 효과적으로 전달하는지를 측정. 높은 변동성은 정보 전달의 잡음이 크다는 의미.
  • 탄력성 (Resilience): 거래 후 LOB가 균형으로 얼마나 빠르게 회복되는지를 측정.
  • 심도 (Depth): LOB에서 즉시 실행 가능한 가시적 유동성의 양.
  • PIN (Probability of Informed Trading): 시장의 정보 비대칭 정도를 측정.

4.3.1 스프레드 (Spreads)

스프레드는 소형 거래의 실행 비용을 측정한다. 거래 가격이 시장 가격에 얼마나 가까운지를 측정하는 방식인데, 여기서 '진정한 시장 가격'을 어떻게 정의하느냐가 첫 번째 문제다. 가장 단순하고 흔한 접근은 중간가격을 사용하는 것이다:

중간가격과 각 스프레드 정의 (식 4.1)
\[s_t = \frac{a_t + b_t}{2} \tag{4.1}\]

중간가격 기반의 두 스프레드 측도:

\[\text{Quoted Spread:} \quad QS_t = a_t - b_t\] \[\text{매도 MO의 직접 거래비용:} \quad s_t - b_t = \frac{QS_t}{2}\] \[\text{매수 MO의 직접 거래비용:} \quad a_t - s_t = \frac{QS_t}{2}\]

실효 반스프레드 (매수 MO):

\[ES_t^{buy} = p_t^{buy} - s_t\]

실효 반스프레드 (매도 MO):

\[ES_t^{sell} = s_t - p_t^{sell}\]

여기서 \(p_t^{buy}\)와 \(p_t^{sell}\)은 각각 매수 MO와 매도 MO의 실제 체결 가격이다.

Quoted Spread는 즉각성의 잠재적 비용을 나타낸다. 어떤 시점에서나 MO로 공격적 체결을 할 경우 지불해야 하는 가격과 최선 LO를 게시할 때의 가격 간 차이다. 반면 실효스프레드(ES)는 실제 체결 가격과 midprice의 차이를 측정한다. 중요한 것은 ES가 QS와 같을 때는 거래가 visible LO와 체결되고 LOB를 걸어가지 않을 때이며, QS보다 작을 때는 hidden order 내부에서 체결될 때, QS보다 클 때는 LOB를 걸어갈 때, 심지어 음수가 될 때는 hidden order가 midprice보다 더 공격적으로 게시되어 있을 때이다.

표 4.2 — 시간 가중 Quoted Spread (단위: 센트, 2013년 전체)

각 분(minute)마다 시간 가중 평균 Quoted Spread를 계산하고, 2013년 252거래일에 걸친 통계량을 보고한다.

Asset Mean StdDev P01 Q1 Median Q3 P99
ISNS 33.2 270.8 2.0 11.0 22.0 40.0 129.2
FARO 23.9 192.0 2.4 8.9 12.0 16.6 71.0
MENT 3.5 27.4 1.0 1.0 1.1 2.0 13.9
AAPL 13.6 54.7 5.4 11.0 13.8 16.9 29.3

표 4.2. 시간 가중 Quoted Spread (단위: 센트).

표 4.2에서 직관에 반하는 결과가 보인다: AAPL이 ISNS나 FARO보다 스프레드가 좁은데도 불구하고 약 13.6센트로 상당히 크다. 이 '역설'의 해답은 상대적 tick size 조정에 있다. 각 종목의 평균 midprice는 ISNS $5.25, FARO $40.62, MENT $19.93, AAPL $473.00이다. 센트를 bps로 변환하면 중위 Quoted Spread는 ISNS 419bps, FARO 29.5bps, MENT 5.5bps, AAPL 2.9bps가 된다. 이제 거래 빈도가 높을수록 스프레드가 좁다는 기대 방향이 복원된다.

MENT의 사례는 최소 tick size 규제의 영향을 잘 보여준다. 미국에서 1달러 초과 주식의 최소 tick size는 법적으로 1센트이다. 표 4.2에서 MENT의 P01은 정확히 1.0센트이고 중위수는 1.1센트로, 거의 50%의 분(minute)에서 1센트 최소 tick size 제약이 구속적(binding)이다. 이는 MENT의 '자연적' 균형 스프레드가 1센트 미만일 수 있지만, 제도적 제약이 이를 1센트로 고정시킴을 의미한다.

이상치와 데이터 품질 문제: 2013년 8월 22일 NASDAQ 거래 중단

표 4.2의 수치들, 특히 평균과 표준편차는 2013년 8월 22일 NASDAQ 3시간 거래 중단 이벤트에 의해 오염되어 있다. 거래 중단 중에도 주문이 접수되고 타임스탬프가 찍혔으며, 많은 주문이 취소되어 bid와 ask가 극적으로 움직였고, 이는 거대하거나 심지어 음수인 인공적 스프레드를 만들어냈다. 약 100,000개 관측치를 가진 데이터셋에서 하루의 영향은 작지만, 딥러닝 등 비지도학습 알고리즘을 설계할 때는 이런 오염된 데이터가 심각한 왜곡을 일으킬 수 있다. 데이터셋의 세부 사항을 파악하는 것이 알고리즘 거래에서 얼마나 중요한지를 보여주는 사례다.

표 4.3 — 수량 가중 실효스프레드 (단위: 센트, 2013년 전체)
Asset Mean StdDev P01 Q1 Median Q3 P99
ISNS 12.56 45.00 -42.00 3.50 9.23 19.00 65.00
FARO 7.63 8.61 -10.00 3.33 6.50 10.76 32.84
MENT 1.23 1.57 0.00 1.00 1.00 1.03 5.38
AAPL 9.32 3.85 2.67 6.61 8.83 11.47 20.20

표 4.3. 수량 가중 실효스프레드 (단위: 센트). 비교를 위해 실효 반스프레드에 2를 곱했다.

표 4.3의 P01 열에서 음수 값들이 관찰된다. 이것은 데이터 오류가 아니라 숨겨진 주문이 midprice 안쪽에 게시되어 있을 때 발생하는 실제 현상이다. 매수 MO가 midprice보다 낮은 가격에 있는 hidden sell order와 매칭될 경우, 체결 가격이 midprice보다 낮아져 ES < 0이 된다. 실효스프레드가 Quoted Spread보다 덜 변동하는 이유는 체결이 스프레드가 좁은 시간에 집중되는 경향 때문이다 — 이 패턴을 4.4절에서 더 자세히 살펴본다.

그림 4.6 — AAPL의 일중 Quoted Spread 패턴 (2013년)

그림 4.6은 AAPL의 2013년 1분 단위 시간 가중 Quoted Spread의 일중 패턴을 보여준다(1분 수익률의 사분위범위로 표현). Q1, 중위수, Q3가 함께 표시된다.

패턴은 뚜렷하다: 스프레드는 장 시작 시 높고, 처음 30분 동안 빠르게 감소한 후, 오후 장 내내 거의 일정하게 유지된다. 장 마감 마지막 30분에 스프레드가 급격히 좁아진다. 이 패턴을 그림 4.2의 거래량 패턴과 비교하면 흥미로운 이중 관계가 드러난다. 오후에는 거래량과 스프레드의 기대 방향 관계(거래량 증가 → 스프레드 감소)가 성립한다. 그러나 아침에는 이와 반대로 거래량이 감소하면서도 스프레드가 같이 감소한다. 이 역전 현상은 정보 효과로 설명된다: 장 시작 시에는 전날 밤 누적된 정보가 불확실성을 높여 스프레드와 거래량이 동시에 크지만, 제2장의 이론적 예측처럼 불확실성이 클 때 최적 스프레드도 커진다.

Figure 4.6

그림 4.6. AAPL의 일중 스프레드 패턴. 출처: AHFT(2015), Figure 4.6.

4.3.2 변동성 (Volatility)

변동성은 시장 질의 또 다른 차원이다. 변동성은 가격 변동을 측정하며, 빠르게 변하는 가격이 자산의 진정한 시장 가치를 판단하기 어렵게 만든다는 의미에서 시장 질 저하(비용)를 나타낸다. 문헌에서는 근본적 변동성(fundamental volatility, 진정한 시장 가치의 변동)과 미시구조 잡음(microstructure noise, 시장 운영 방식에서 비롯된 외생적 변동)을 구분한다.

실현 변동성 측정: 15분 창, 1분 수익률 기준

15분 구간 \(t\)에서의 실현 변동성 \(\sigma_t\):

\[\sigma_t = \sqrt{\frac{1}{15}\sum_{j=1}^{15} r_j^2}\]

여기서 \(j \in \{1, \ldots, 15\}\)는 15분 구간 내 각 1분의 인덱스이고, \(r_j\)는 그 1분에서의 실현 수익률이다. 평균 수익률이 충분히 작은 짧은 시간 스케일에서는 이렇게 단순화할 수 있다. 2013년 전체에 걸쳐 매 15분 구간마다 이를 계산하여 분포를 구한다.

표 4.4 — 실현 1분 변동성 (15분 표본 기준)
Asset Mean StdDev P01 Q1 Median Q3 P99
ISNS 16.6 54.8 0.0 0.0 0.0 14.4 160.3
FARO 8.3 12.7 0.0 3.8 6.6 10.3 31.3
MENT 5.6 6.6 0.0 3.2 4.6 6.5 20.1
AAPL 5.5 4.2 1.0 3.3 4.7 6.7 18.1

표 4.4. 실현 1분 변동성 (15분 표본 기준).

표 4.5 — 1분 수익률의 사분위범위
Asset Mean StdDev P01 Q1 Median Q3 P99
ISNS 0.10 1.37 0.00 0.00 0.00 0.00 0.00
FARO 3.77 2.33 1.10 2.50 2.84 4.26 12.05
MENT 3.00 3.47 0.00 0.00 2.18 5.04 12.84
AAPL 6.23 2.85 3.72 4.72 5.28 6.45 19.47

표 4.5. 1분 수익률의 사분위범위. AAPL의 경우 5.28bps는 252거래일 중 중위 IQR이다.

표 4.6 — 1분당 ask 또는 bid 변화 횟수
Asset Mean StdDev P01 Q1 Median Q3 P99
ISNS 2 29 0 0 0 0 16
FARO 11 25 0 0 3 13 100
MENT 6 18 0 0 2 7 75
AAPL 150 149 7 64 109 185 709

표 4.6. 1분당 ask 또는 bid 변화 횟수.

세 개의 변동성 표를 종합적으로 해석하면 중요한 통찰을 얻는다. 먼저 표 4.4에서 ISNS의 중위 실현 변동성이 0이다. ISNS는 거래가 매우 드물어 15분 창에서 아예 가격 변화가 없는 경우가 많다. MENT와 FARO는 비슷한 거래 빈도를 가지지만 MENT의 변동성이 낮다. 이는 MENT에 대한 최소 tick size 제약이 구속적이기 때문이다 — 실제 가격 변화가 1센트 미만이어도 이를 반영할 수 없어 인위적 가격 경직성이 생긴다. 가장 흥미로운 것은 AAPL이다. 표 4.6에서 AAPL은 MENT나 FARO보다 두 자릿수 더 많은 가격 변화를 보이지만(평균 150회 vs 6~11회), 실현 변동성(표 4.4)은 오히려 낮거나 비슷하다. 이는 AAPL의 작은 상대 tick size(약 0.2bps)와 높은 거래 빈도의 상호작용으로 설명된다: 매우 작고 빠른 가격 변화들이 빈번하게 반전되어 누적 변동성은 낮게 유지된다. 이는 제3장에서 확인한 가격 반전 경향과도 일치한다.

그림 4.7 — AAPL의 일중 변동성 패턴 (IQR 기준, 2013년)

그림 4.7은 AAPL의 매 1분의 1분 수익률 IQR을 2013년 전체 거래일로 추정하고, 4차 다항식 곡선으로 적합화하여 일중 변동성 패턴을 보여준다. 파란 선은 표준 OLS, 빨간 선은 강건 OLS(이상치 가중치를 줄임)로 적합화한 결과다.

그림 4.2의 거래량 패턴과 비교하면 흥미롭다. 변동성(그림 4.7)은 장 시작에서 높고, 낮아지다가 정오와 15:00 사이에 plateau에 도달하고, 장 마감까지 다시 증가한다. 이는 거래량 '미소(smile)' 패턴과 유사하지만 왼쪽으로 치우쳐 있다. 반면 거래량(그림 4.2)은 더 대칭적이고 오른쪽으로 치우쳐 있다. 이 차이는 장 시작의 거래는 불확실성이 크고 정보 주도적인 반면, 장 마감의 거래는 정보보다는 포지션 청산 압박에 의해 주도된다는 해석과 일치한다.

Figure 4.7

그림 4.7. AAPL의 일중 변동성 (1분 수익률 IQR). 출처: AHFT(2015), Figure 4.7.

4.3.3 시장 심도(Market Depth)와 거래 규모

표 4.7 — Bid와 Ask의 평균 심도 (주식 수)
Asset Mean StdDev P01 Q1 Median Q3 P99
ISNS 619 787 51 150 300 750 3,250
FARO 142 125 14 86 122 171 484
MENT 661 694 117 351 527 784 2,852
AAPL 189 169 64 127 161 210 662

표 4.7. NASDAQ에서 bid와 ask의 1분 시간 가중 평균 심도 (주식 수).

표 4.7은 네 종목 모두에서 75% 분위수 이하에서도 심도가 1,000주를 넘지 않음을 보여준다. 뮤추얼펀드나 연기금이 하루에 수만 주를 거래해야 할 때, 현재 bid/ask에서 그것을 모두 채울 수 없다는 것은 자명하다. NASDAQ 내 거래 비중은 전체 거래량의 약 22%에 불과하므로, 실제 시장 전체의 심도는 이보다 크지만, 대형 주문을 체결하기 위해 LOB를 걸어가거나 여러 시간에 걸쳐 분할 체결하는 전략이 필수적임을 시사한다.

심도와 거래 규모는 독립적이지 않다. 즉각 체결 가능한 LO가 얼마나 있는지(심도)가 MO의 규모를 결정하고, 반대로 예상 MO 흐름의 크기가 얼마나 많은 유동성을 공급할지를 결정한다. 시장이 얕을수록(thin), MO는 작아지고, 긴급한 대형 주문은 LOB를 걸어가거나 시간을 두고 분산 체결해야 한다.

그림 4.8 — AAPL의 월별 평균 거래 규모 (2000~2013년)

그림 4.8은 CRSP 데이터를 이용하여 AAPL의 2000~2013년 월별 평균 거래 규모(한 번의 체결에서 거래된 평균 주식 수)를 보여준다. 점들이 월별 평균이고 진한 선이 이동 평균이다.

2000년대 초에 약 1,300주로 정점을 이룬 후, 2013년 말에는 약 200주로 급격히 감소했다. 이 추세는 지난 15년간의 제도적, 법적, 기술적, 경제적 변화가 만들어낸 결과다. 이 변화들은 고빈도 거래의 증가, 거래 단편화(fragmentation), 알고리즘 집행의 확산과 직접적으로 연관되어 있다.

Figure 4.8

그림 4.8. AAPL 월별 평균 거래 규모 (2000~2013년). 출처: AHFT(2015), Figure 4.8.

표 4.8 — 평균 거래 규모 (Q/n, 주식 수)
Asset Mean StdDev P01 Q1 Median Q3 P99
ISNS 206.2 348.7 1.0 100.0 100.0 200.0 1,600.0
FARO 99.8 76.4 1.0 64.0 100.0 100.3 374.8
MENT 199.9 172.9 6.0 100.0 150.0 240.3 867.1
AAPL 121.1 40.5 52.2 95.7 115.4 139.0 252.8

표 4.8. NASDAQ 2013년 평균 거래 규모 (총 주식 수 / 거래 건수).

그림 4.9 — AAPL의 일중 심도 패턴 (2013년)

그림 4.9는 2013년 매 분(minute)에서 bid와 ask에 게시된 평균 주식 수(로그 스케일)의 일중 패턴을 보여준다.

예상대로 장 마감으로 갈수록 심도가 증가한다. 이는 장 마감에 스프레드가 좁아지는 것(그림 4.6)과 일치한다. 다소 놀라운 것은 장 시작에도 심도가 높다는 점이다. 이론적으로 장 시작 시 가격 불확실성이 높아 더 넓은 스프레드를 게시하는 것이 최적이라고 했는데, 높은 심도도 함께 관찰된다. 이는 더 높은 주문 도착률에서 오는 시장조성 이익과 높은 불확실성에서 오는 비용 사이의 균형이 실제로는 더 많은 유동성 공급으로 해소됨을 시사한다.

Figure 4.9

그림 4.9. AAPL의 일중 심도 패턴 (로그 스케일). 출처: AHFT(2015), Figure 4.9.

4.3.4 가격충격 (Price Impact)

대형 주문을 체결하려는 거래자의 주된 관심사는 자신의 주문이 불리한 가격충격을 일으키는 것이다: 공격적으로 매수하면 가격이 상승하고, 공격적으로 매도하면 가격이 하락한다. 심도는 가격충격의 한 척도로, bid/ask에서의 심도가 해당 수준에서 zero 가격충격으로 체결 가능한 최대 MO 규모를 알려준다.

NASDAQ ITCH 데이터를 분석하면 AAPL의 2013년 7월 30일 데이터에서 다양한 이벤트 후의 MO 도착 패턴을 살펴볼 수 있다. 10ms 단위로 이벤트를 추적하며, 같은 밀리초에 같은 가격 수준에서 체결된 모든 주문을 하나의 MO로 취급한다.

표 4.9 — 체결이 MO에 미치는 시장충격 (AAPL 2013-07-30)

이 표는 다양한 이벤트 후 10ms 창에서 매수 MO와 매도 MO의 도착 분포를 보여준다. 'n=0'은 MO가 없는 경우의 비율이며, Q1/Q2/Q3는 최소 하나의 MO가 있을 때의 분포이다.

Event n Buy Market Orders Sell Market Orders
  n=0 Q1 Q2 Q3 n=0 Q1 Q2 Q3
Benchmark 2,340,000 99.6 1 1 2 99.7 1 1 2
Buy Order 6,852 70.7 1 2 3 94.3 1 1 2
Buy Order (n-o) 5,707 71.5 1 2 3 94.4 1 1 2
Buy Order-Large 532 57.5 1 2 5 92.1 1 1 2
Sell Order 7,358 94.5 1 1 2 74.9 1 2 3
Sell Order (n-o) 6,269 94.7 1 1 2 75.7 1 2 3
Sell Order-Large 347 92.2 1 1 2 62.2 1 2 4

표 4.9. 체결이 MO 도착에 미치는 영향 (AAPL 2013-07-30).

표 4.9에서 MO 체결 후 같은 방향으로 추가 MO가 따라오는 경향이 관찰된다. Benchmark에서 10ms 창에서 MO가 없는 비율이 99.6~99.7%인데 반해, 매수 MO 체결 후에는 추가 매수 MO가 없는 비율이 70.7%로 감소하여 약 30%의 경우 추가 매수가 따른다. 대형 매수 주문 후에는 이 비율이 57.5%로 더 낮아져 43%의 경우 추가 매수가 발생한다. 반대 방향(매수 체결 후 매도 MO)의 경우 94.3%로 비교적 적다.

표 4.10 — 체결이 최선 가격에 미치는 영향 — 자신의 측면 (AAPL 2013-07-30)

이 표에서 +1은 최선 가격이 midprice로부터 한 틱 멀어지는 것, -1은 한 틱 가까워지는 것이다. 즉 매수 MO의 경우 ask에서 +1은 ask 가격이 1센트 상승하는 것이고, 매도 MO의 경우 bid에서 +1은 bid 가격이 1센트 하락하는 것이다. 'Buy' 열은 모든 매수 MO 체결 후의 ask 변화 분포, 'Sell' 열은 매도 MO 체결 후의 bid 변화 분포다. '△#0'는 체결이 즉각적인 가격 변화를 수반한 경우(sweep order), '△>3c'는 3센트 이상의 대형 가격 변화가 발생한 경우이다.

Ticks Changes in ASK Changes in BID
Ask Buys △#0 △>3c Bid Sells △#0 △>3c
Obs   6,852 3,259 1,165   7,358 4,052 1,910
0 99.5 28.2 10.7 9.7 99.5 22.7 7.2 6.1
≤−5 12.8 0.1 0.0 0.0 17.2 0.3 0.4 0.2
−4 4.5 0.1 0.1 0.3 4.5 0.0 0.0 0.0
−3 5.6 0.1 0.1 0.0 5.6 0.1 0.1 0.0
−2 8.6 0.1 0.1 0.1 7.0 0.1 0.1 0.1
−1 22.6 1.1 0.4 0.7 17.9 0.8 0.4 0.5
+1 14.2 19.5 20.5 0.9 13.3 15.7 14.3 0.9
+2 7.4 13.6 13.6 0.9 7.1 11.8 11.3 0.9
+3 5.6 12.3 11.9 1.9 5.5 10.4 10.2 0.9
+4 4.4 9.8 9.2 15.3 4.3 9.5 9.4 12.2
≥+5 14.3 43.4 44.2 80.0 17.5 51.3 53.9 84.4

표 4.10. 체결이 최선 가격에 미치는 영향 — 자신의 측면 (AAPL 2013-07-30).

표 4.10에서 핵심 패턴은 매수 MO 후 ask 가격이 midprice로부터 멀어지는(양의 방향으로 이동하는) 확률이 크게 증가한다는 것이다. Benchmark에서는 ask가 변하지 않는 비율이 99.5%인데, 매수 MO 후에는 28.2%로 감소한다. 즉 71.8%의 경우 ask 가격이 이동한다. 특히 ≥+5 틱 이상의 대형 이동이 benchmark의 14.3%에서 매수 MO 후 43.4%로 급등한다. Sweep 주문(△#0, LOB를 걸어가는 주문)의 경우 이 패턴이 더욱 강화된다.

표 4.11 — 체결이 최선 가격에 미치는 영향 — 반대 측면 (AAPL 2013-07-30)

이 표는 매수(매도) MO 체결이 ask(bid) 측이 아닌 반대편 bid(ask)에 미치는 영향을 보여준다. 부호 규약은 표 4.10과 동일하게 유지된다.

Ticks Changes in BID Changes in ASK
Bid Buys △#0 △>3c Ask Sells △#0 △>3c
Obs   6,852 3,259 1,165   7,358 4,052 1,910
0 99.5 81.6 78.7 75.4 99.5 82.2 80.3 79.1
≤−5 17.5 6.9 6.5 7.7 14.3 6.0 6.0 8.3
−4 4.3 1.8 1.7 2.8 4.4 1.7 1.8 2.0
−3 5.5 1.8 1.9 3.1 5.6 2.1 2.1 2.8
−2 7.1 3.2 3.9 3.1 7.4 3.4 3.3 4.3
−1 13.3 8.7 8.2 9.1 14.2 8.0 8.1 8.5
+1 17.9 29.5 28.7 34.8 22.6 29.2 27.7 28.8
+2 7.0 10.8 11.8 11.8 8.6 11.6 12.9 13.5
+3 5.6 7.0 6.3 7.3 5.6 6.5 6.4 6.0
+4 4.5 6.1 5.0 2.4 4.5 6.8 5.6 4.5
≥+5 17.2 24.2 25.9 17.8 12.8 24.7 26.1 21.3

표 4.11. 체결이 최선 가격에 미치는 영향 — 반대 측면 (AAPL 2013-07-30).

표 4.11에서는 한 측면의 체결이 반대 측면에도 영향을 미치되 더 약하게 미침을 볼 수 있다. 매수 MO 후 bid 가격이 변하지 않는 비율이 99.5%에서 81.6%로 감소한다(자신의 측면인 ask에서 28.2%까지 감소한 것보다 약하다). +1 틱 이동 확률은 benchmark 17.9%에서 매수 MO 후 29.5%로 증가한다. 이 패턴을 표 4.10과 합치면, MO 도착 후 Quoted Spread가 확대되는 경향이 있음을 알 수 있다: 매수(매도) MO가 ask(bid)를 올리면서 동시에 bid(ask)도 같은 방향으로 이동하여 스프레드가 전체적으로 넓어진다.

표 4.12 — 시간이 지남에 따른 midprice 변화 (AAPL 2013-07-30)

이 표는 10ms에서 1,000ms(1초)까지 여러 시간 지평에서 bid와 ask 변화의 분포를 보여준다. 부호 규약은 표 4.10, 4.11과 동일하다.

Ticks Changes in ASK Changes in BID
10ms 30ms 100ms 1,000ms 10ms 30ms 100ms 1,000ms
Benchmark
≤−3 0.1 0.3 1.0 7.7 0.1 0.4 1.2 8.9
{−1,−2} 0.2 0.4 1.2 7.7 0.1 0.3 0.7 4.0
0 99.5 98.7 96.0 72.9 99.5 98.6 95.7 70.3
{1,2} 0.1 0.3 0.7 3.9 0.1 0.4 1.1 6.9
≥3 0.1 0.3 1.0 7.7 0.1 0.4 1.3 9.9
Buys
≤−3 0.2 0.3 0.4 1.3 6.9 9.8 13.2 26.2
{−1,−2} 0.8 1.0 1.4 3.1 7.4 7.8 8.3 11.3
0 28.2 26.7 24.3 16.0 81.6 77.8 72.4 49.2
{1,2} 23.8 22.4 21.8 18.4 2.2 2.4 2.6 4.1
≥3 47.0 49.6 52.1 61.3 1.9 2.2 3.5 9.2
Sells
≤−3 6.8 8.3 12.0 24.0 4.1 4.2 4.6 6.8
{−1,−2} 7.3 8.3 9.3 13.3 4.1 4.0 4.3 6.2
0 82.2 78.8 73.4 52.3 47.3 44.6 41.1 28.1
{1,2} 2.0 2.1 2.6 4.0 15.9 15.7 15.0 14.5
≥3 1.8 2.4 2.7 6.4 28.5 31.4 35.0 44.4

표 4.12. 체결 후 시간 경과에 따른 midprice 변화 (AAPL 2013-07-30).

표 4.12는 초기 가격 변화가 1초가 지나도 반전되지 않는다는 것을 보여준다. 매수 MO 후 10ms에서 ask가 ≥+3 틱 이동한 비율이 47.0%인데, 1,000ms 후에는 이 비율이 61.3%로 오히려 증가한다. 이는 단기적 반전(short-term reversal)이 일어나지 않음을 시사한다. 즉, 가격충격이 지속적임을 의미한다. 이 결과들은 모두 인과적으로 해석해서는 안 된다. MO가 임의의 시점에 도착하는 것이 아니라 스프레드가 좁을 때, 그리고 midprice에 더 가까이 게시된 주문들을 공격적으로 체결할 때 오는 경향이 있기 때문이다.

4.3.5 LOB 걷기와 영구적 가격충격

거래 알고리즘의 핵심 요소 중 하나는 투자자 자신의 행동과 다른 시장참여자들의 주문 흐름이 거래 중인 자산 가격에 어떻게 영향을 미치는지다. 여기서는 가격에 대한 두 가지 효과인 영구적 가격충격과 일시적 가격충격의 파라미터를 경험적으로 추정한다.

영구적 가격충격을 추정하기 위해 순주문흐름이 5분 구간 동안의 중간가격 변화에 미치는 영향을 추정한다. \(T = 5\text{분}\)으로 설정할 때:

영구적 가격충격 추정 (식 4.2)
\[\Delta S_n = a + b \cdot \mu_n + \varepsilon_n \tag{4.2}\]

\(\Delta S_n = S_{nT} - S_{(n-1)T}\): 시간 구간 \([(n-1)T, nT]\) 동안의 중간가격 변화량
\(\mu_n\): 같은 구간의 순주문흐름 (매수 MO 거래량 - 매도 MO 거래량)
\(b\): 영구적 가격충격 계수 (robustOLS로 추정, Winsorised 데이터 사용, 상/하위 0.5% 제외)
매일 추정하여 파라미터의 일별 변동을 포착한다.

일시적 가격충격은 LOB를 걷는 방식으로 추정한다. 매 초마다 LOB 스냅샷을 찍고, 다양한 수량 \(\{Q_1, Q_2, \ldots, Q_N\}\)에 대한 가상 MO의 체결 가격을 계산하여 최선 호가와의 차이를 선형 회귀한다:

일시적 가격충격 추정
\[s_{i,t}^{exec, ask} = s_t^{ask} + k^{ask} \cdot Q_i + \varepsilon_{i,t}\]

여기서 \(s_{i,t}^{exec, ask}\)는 수량 \(Q_i\)의 가상 MO에 대한 평균 체결 가격(ask 측), \(s_t^{ask}\)는 현재 최선 매도호가, \(k^{ask}\)는 단위 수량당 일시적 가격충격 계수이다. 매 초마다 LOB에서 계산하여 일별 평균을 구한다.

표 4.13 — NASDAQ 종목들의 영구적/일시적 가격충격 파라미터 (2013년)
  FARO SMH NTAP ORCL INTC
\(b\) (영구적 충격) \(1.41 \times 10^{-4}\) \(5.45 \times 10^{-6}\) \(5.93 \times 10^{-6}\) \(1.82 \times 10^{-6}\) \(6.15 \times 10^{-7}\)
\(\text{StdDev}(b)\) \((9.61 \times 10^{-5})\) \((4.20 \times 10^{-6})\) \((2.31 \times 10^{-6})\) \((7.19 \times 10^{-7})\) \((2.16 \times 10^{-7})\)
\(k\) (일시적 충격) \(1.86 \times 10^{-4}\) \(8.49 \times 10^{-7}\) \(3.09 \times 10^{-6}\) \(8.23 \times 10^{-7}\) \(2.50 \times 10^{-7}\)
\(\text{StdDev}(k)\) \((2.56 \times 10^{-4})\) \((8.22 \times 10^{-7})\) \((1.75 \times 10^{-6})\) \((3.78 \times 10^{-7})\) \((1.25 \times 10^{-7})\)
\(b/k\) 1.02 (0.83) 7.43 (6.24) 2.04 (0.77) 2.28 (0.74) 2.55 (0.70)

표 4.13. 영구적/일시적 가격충격 파라미터 (각 파라미터 아래 괄호는 표준편차).

그림 4.10 — INTC의 순주문흐름과 중간가격 드리프트

그림 4.10은 세 개의 패널로 구성된다.

첫 번째 패널 (영구적 충격 파라미터의 일별 변동): 2013년 각 거래일의 영구적 가격충격 파라미터 \(b\) 추정값을 시간 순서로 보여준다. 점선은 연간 평균 \(b\)를 나타낸다. 이 파라미터가 하루하루 상당히 변동함을 볼 수 있다.

두 번째 패널 (순주문흐름의 분포): 2013년 전체 데이터에서 5분 순주문흐름 \(\mu_n\)의 히스토그램이다. 분포는 0에 대해 비교적 대칭적이다. (INTC의 경우 99%의 5분 가격 변화가 [-0.1, 0.1] 범위 내에 있다.)

세 번째 패널 (조건부 기대 순주문흐름): 관찰된 가격 변화 수준에 조건화한 기대 순주문흐름과 오차막대를 보여준다. 가격 변화와 순주문흐름 사이에 양의 관계가 명확히 보인다: 순주문흐름이 양수(음수)이면, 즉 매수(매도) MO가 매도(매수) MO보다 많으면 중간가격이 상승(하락)하는 경향이 있다. 선형 관계는 분포의 중간 부분에서 잘 성립하며, 극단값에서는 관측치가 적어 비선형성이 나타날 수 있다.

Figure 4.10

그림 4.10. INTC의 순주문흐름과 중간가격 드리프트 (2013년). 출처: AHFT(2015), Figure 4.10.

그림 4.11 — INTC의 일시적 가격충격 (2013년 11월 1일)

그림 4.11은 세 개의 패널로 구성된다.

첫 번째 패널 (LOB 스냅샷, 11:00am): 2013년 11월 1일 오전 11시의 INTC LOB 스냅샷을 보여준다. x축은 수량(\(\times 10^4\)), y축은 가격이다.

두 번째 패널 (일시적 충격 곡선, 11:00~11:01): 11:00~11:01 사이 매 초마다 다양한 크기의 가상 MO가 LOB를 걷는 경우의 체결 가격 초과분을 보여준다. 각 곡선이 해당 초의 충격 함수이고, 점선은 반스프레드를 절편으로 하는 선형 회귀선(이것이 \(k\)를 추정하는 모형)이다. 충격 함수가 1분 동안에도 상당히 변동함을 볼 수 있다.

세 번째 패널 (일중 선형 충격 기울기): 하루 전체에 걸쳐 매 초의 선형 충격 기울기 추정값을 보여준다. 장 초반에 충격이 가장 크고, 하루 중 대부분은 완만한 수준을 유지하다가 장 마감에 감소한다. 이 패턴은 앞서 본 스프레드 감소와 심도 증가 패턴과 일치한다.

Figure 4.11

그림 4.11. INTC의 일시적 가격충격 추정. 출처: AHFT(2015), Figure 4.11.

그림 4.12 — INTC의 영구적/일시적 충격 관계 (2013년 일별 관측)

그림 4.12는 두 개의 패널로 구성된다.

왼쪽 패널 (산점도): 2013년 각 거래일의 \((b, k)\) 쌍의 산점도이다. 영구적 충격과 일시적 충격 사이의 명확한 양의 관계가 보인다. 이는 시장 심도와 가격충격의 이론적 관계와 일치한다: 심도가 얕은 날은 영구적 충격과 일시적 충격이 모두 크고, 심도가 깊은 날은 둘 다 작다.

오른쪽 패널 (비율 \(b/k\) 히스토그램): 2013년 일별 \(b/k\) 비율의 분포이다. 1~4 범위에서 분포하며 약 2.5를 중심으로 대칭적 분포를 보인다. 이 비율은 제7장의 청산 알고리즘과 제9장의 POV/VWAP 전략에서 직접 사용된다.

Figure 4.12

그림 4.12. INTC의 영구적/일시적 충격 관계 (2013년). 출처: AHFT(2015), Figure 4.12.


4.3.6 시장 질 지표의 수학적 분해와 증명

제4.3절은 시장 질을 스프레드, 변동성, 심도, 가격충격이라는 서로 다른 지표로 측정한다. 이 네 지표는 표면적으로는 별개 같지만, 실제로는 모두 거래가격이 중간가격에서 얼마나 벗어나는지, 그리고 그 벗어남이 즉시 소멸하는 부분과 영구적으로 남는 부분이 얼마나 되는지를 다른 각도에서 측정한다. 아래에서는 본문에서 쓰인 핵심 지표를 정식으로 정의하고, 서로의 연결식을 증명한다.

스프레드 분해

정의 4.3.6.1 — Quoted Spread, Effective Spread, Realized Spread, Adverse Selection

시각 \(t\)의 최우선 매도호가와 매수호가를 각각 \(a_t, b_t\), 중간가격을

\[ m_t = \frac{a_t+b_t}{2} \]

라 하자. 거래부호 \(q_t\)는 매수주도 거래이면 \(q_t=+1\), 매도주도 거래이면 \(q_t=-1\)로 둔다. 거래가격을 \(p_t\), 이후 시각 \(t+\tau\)의 중간가격을 \(m_{t+\tau}\)라 할 때 다음을 정의한다.

\[ QS_t = a_t-b_t, \] \[ ES_t = 2q_t(p_t-m_t), \] \[ RS_{t,\tau} = 2q_t(p_t-m_{t+\tau}), \] \[ AS_{t,\tau} = 2q_t(m_{t+\tau}-m_t). \]
정리 4.3.6 — 실효스프레드 분해

정의 4.3.6.1의 기호를 쓰면 모든 거래에 대해

\[ ES_t = RS_{t,\tau} + AS_{t,\tau} \]

가 성립한다.

증명

오른쪽을 정의대로 전개한다.

\[ RS_{t,\tau} + AS_{t,\tau} = 2q_t(p_t-m_{t+\tau}) + 2q_t(m_{t+\tau}-m_t). \]

공통인수 \(2q_t\)를 묶으면

\[ RS_{t,\tau} + AS_{t,\tau} = 2q_t\Big((p_t-m_{t+\tau}) + (m_{t+\tau}-m_t)\Big). \]

괄호 안에서 \(-m_{t+\tau}\)와 \(+m_{t+\tau}\)가 소거되므로

\[ RS_{t,\tau} + AS_{t,\tau} = 2q_t(p_t-m_t). \]

그런데 오른쪽은 바로 \(ES_t\)의 정의다. 따라서

\[ ES_t = RS_{t,\tau} + AS_{t,\tau} \]

가 성립한다. 이 식의 의미는 명확하다. 거래 순간의 비용으로 보이는 실효스프레드는 나중에 시장조성자에게 남는 부분 \(RS\)와, 거래 후 중간가격이 움직여 정보효과로 남는 부분 \(AS\)로 정확히 분해된다.

정리 4.3.7 — 최우선호가에서 체결되면 실효스프레드는 quoted spread와 일치한다

매수주도 거래가 \(p_t=a_t\)에서 체결되거나, 매도주도 거래가 \(p_t=b_t\)에서 체결되면

\[ ES_t = QS_t \]

가 성립한다.

증명

경우를 나누어 계산한다.

첫째, 매수주도 거래면 \(q_t=+1\)이고 거래가격은 \(p_t=a_t\)다. 따라서

\[ ES_t = 2(a_t-m_t). \]

중간가격 정의 \(m_t=(a_t+b_t)/2\)를 넣으면

\[ ES_t = 2\left(a_t-\frac{a_t+b_t}{2}\right). \]

분모 2를 통일하면

\[ ES_t = 2\left(\frac{2a_t-a_t-b_t}{2}\right)=2\left(\frac{a_t-b_t}{2}\right)=a_t-b_t. \]

\[ ES_t=QS_t. \]

둘째, 매도주도 거래면 \(q_t=-1\)이고 \(p_t=b_t\)다. 이때

\[ ES_t = 2(-1)(b_t-m_t) = 2(m_t-b_t). \]

다시 \(m_t=(a_t+b_t)/2\)를 넣으면

\[ ES_t = 2\left(\frac{a_t+b_t}{2}-b_t\right) = 2\left(\frac{a_t+b_t-2b_t}{2}\right) = 2\left(\frac{a_t-b_t}{2}\right) = a_t-b_t. \]

따라서 이 경우도 \(ES_t=QS_t\)다. 두 경우를 합치면 정리가 증명된다.

변동성의 시간척도 변환

정의 4.3.6.2 — 일정한 간격 수익률과 다기간 수익률

길이 \(\Delta\)인 구간수익률들을 \(r_1,\ldots,r_n\)라 하고, \(n\Delta\) 길이의 누적수익률을

\[ R_n = \sum_{i=1}^n r_i \]

로 둔다.

정리 4.3.8 — 독립 수익률 하의 제곱근 시간법칙

수익률 \(r_1,\ldots,r_n\)가 서로 독립이고 \(E[r_i]=0\), \(Var(r_i)=\sigma_\Delta^2\)이면

\[ Var(R_n)=n\sigma_\Delta^2 \]

이므로 표준편차는

\[ \sigma_{n\Delta}=\sqrt{n}\,\sigma_\Delta \]

를 만족한다.

증명

분산의 정의에서 시작한다. \(E[r_i]=0\)이므로

\[ E[R_n] = E\left[\sum_{i=1}^n r_i\right] = \sum_{i=1}^n E[r_i] = 0. \]

따라서

\[ Var(R_n)=E[R_n^2]. \]

이제 \(R_n^2\)를 전개하면

\[ R_n^2 = \left(\sum_{i=1}^n r_i\right)^2 = \sum_{i=1}^n r_i^2 + 2\sum_{1\le i<j\le n} r_i r_j. \]

기댓값을 취하면

\[ E[R_n^2] = \sum_{i=1}^n E[r_i^2] + 2\sum_{1\le i<j\le n} E[r_i r_j]. \]

독립성과 평균 0을 사용하면 \(i\neq j\)일 때

\[ E[r_i r_j] = E[r_i]E[r_j]=0. \]

따라서 교차항은 모두 사라지고

\[ E[R_n^2] = \sum_{i=1}^n E[r_i^2]. \]

또한 평균이 0이므로 \(Var(r_i)=E[r_i^2]=\sigma_\Delta^2\)다. 따라서

\[ Var(R_n)=E[R_n^2]=\sum_{i=1}^n \sigma_\Delta^2 = n\sigma_\Delta^2. \]

양변의 양의 제곱근을 취하면

\[ \sigma_{n\Delta}=\sqrt{Var(R_n)}=\sqrt{n\sigma_\Delta^2}=\sqrt{n}\,\sigma_\Delta. \]

즉 시간길이가 \(n\)배가 되면 변동성은 \(\sqrt{n}\)배가 된다.

호가창 걷기와 가격충격

정의 4.3.6.3 — 매도측 호가사다리와 누적 물량

매수 시장가주문이 매도측 호가를 소진한다고 하자. 가격수준을 \(a_1\le a_2\le \cdots\), 각 수준의 대기물량을 \(d_1,d_2,\ldots>0\)라 둔다. 누적물량을

\[ V_k = \sum_{j=1}^k d_j \]

로 둔다. 주문크기 \(v\)가 \(V_{k-1}<v\le V_k\)를 만족하면 첫 \(k-1\)개 호가는 모두 소진되고, \(k\)번째 호가에서 남은 양이 체결된다.

정리 4.3.9 — 호가창을 더 깊게 걸을수록 평균 체결가격은 낮아지지 않는다

위 정의에서 매수 시장가주문의 총체결대금을 \(C(v)\), 평균 체결가격을 \(\bar p(v)=C(v)/v\)라 하자. 그러면 \(\bar p(v)\)는 \(v\)의 증가함수다. 즉 큰 주문은 작은 주문보다 평균적으로 더 나쁜 가격에서 체결된다.

증명

먼저 총체결대금을 정확히 적는다. \(V_{k-1}<v\le V_k\)이면

\[ C(v)=\sum_{j=1}^{k-1} a_j d_j + a_k(v-V_{k-1}). \]

이 식은 의미가 분명하다. 첫 \(k-1\)개 가격수준에서는 전량 \(d_j\)가 체결되고, 마지막 수준 \(k\)에서는 남은 양 \(v-V_{k-1}\)만 체결된다.

이제 같은 구간 \(V_{k-1}<v\le V_k\) 안에서 미분하면

\[ C'(v)=a_k. \]

즉 주문량을 아주 조금 더 늘릴 때의 한계 체결가격은 현재 도달한 마지막 호가 \(a_k\)다. 평균 체결가격은

\[ \bar p(v)=\frac{C(v)}{v} \]

이므로 몫의 미분법을 적용하면

\[ \bar p'(v)=\frac{vC'(v)-C(v)}{v^2}. \]

방금 구한 \(C'(v)=a_k\)를 넣으면

\[ \bar p'(v)=\frac{va_k-C(v)}{v^2}. \]

이제 분자 \(va_k-C(v)\)를 계산한다.

\[ va_k-C(v)=va_k-\sum_{j=1}^{k-1} a_j d_j-a_k(v-V_{k-1}). \]

뒤의 마지막 항을 전개하면

\[ va_k-C(v)=va_k-\sum_{j=1}^{k-1} a_j d_j-a_kv+a_kV_{k-1}. \]

\(va_k-a_kv=0\)이므로

\[ va_k-C(v)=a_kV_{k-1}-\sum_{j=1}^{k-1} a_j d_j. \]

또한 \(V_{k-1}=\sum_{j=1}^{k-1} d_j\)이므로

\[ va_k-C(v)=\sum_{j=1}^{k-1} a_k d_j - \sum_{j=1}^{k-1} a_j d_j = \sum_{j=1}^{k-1} (a_k-a_j)d_j. \]

호가사다리에서 \(a_k\ge a_j\), 그리고 \(d_j>0\)이므로 각 항 \((a_k-a_j)d_j\)는 음이 아니다. 따라서

\[ va_k-C(v)\ge 0. \]

분모 \(v^2>0\)이므로

\[ \bar p'(v)\ge 0. \]

즉 \(\bar p(v)\)는 각 구간에서 비감소한다. 경계점에서는 왼쪽과 오른쪽 극한이 모두 정의되며, 새 수준으로 넘어갈 때 한계가격이 더 높아지거나 같아지므로 평균가격 역시 점프 하향할 수 없다. 결론적으로 \(\bar p(v)\)는 전체 구간에서 증가함수다.

4.4 메시지와 취소 활동 (Messages and Cancellation Activity)

거래소 운영 방식의 중요한 특징 중 하나는 체결되지 않은 LO를 취소할 수 있는 능력이다. 유동성을 공급하는 거래자들은 시장에 대한 시각을 바꾸거나 새로운 정보에 반응하여 LO를 취소하거나 재배치해야 한다. 뒤에서 다루는 알고리즘들(제7, 8, 10장)에서 이 능력은 핵심 요소다. 예를 들어 저지연(low-latency) 시장조성 알고리즘에서는 새 정보가 도착하거나 중간가격에 대한 단기 이탈 시각이 업데이트될 때마다 LO를 지속적으로 취소하고 재배치한다.

여기서는 ITCH 데이터를 활용하여 거래소가 기록하는 메시지 수로 거래 활동을 측정한다. ITCH 데이터에서 '메시지'는 주문 게시, 취소, 체결 중 하나이며, 전체 메시지 수는 게시된 주문 수의 약 두 배를 조금 넘는다(대부분의 주문이 전량 취소되거나 체결되기 때문).

표 4.14 — 일별 메시지 수 (단위: 1,000건)
Asset Mean StdDev P01 Q1 Median Q3 P99
ISNS 1,711 6,078 173 450 760 1,745 8,943
FARO 24,038 10,871 8,524 16,277 22,347 29,232 71,445
MENT 59,661 21,755 23,157 43,477 53,972 72,639 131,715
AAPL 531,728 166,652 280,242 417,576 500,680 614,437 1,067,248

표 4.14. 일별 메시지 수 (단위: 1,000건).

표 4.14는 종목마다 메시지 수가 크게 다름을 보여준다(MENT는 FARO의 약 2.5배). 거래 활동량을 조정하기 위해 거래 건수로 정규화한 것이 표 4.15이다.

표 4.15 — 거래 건수당 메시지 수
Asset Mean StdDev P01 Q1 Median Q3 P99
ISNS 226.7 749.1 10.8 44.4 80.7 159.1 2,885.1
FARO 88.2 55.8 20.7 57.8 79.4 106.1 223.5
MENT 70.0 21.8 29.8 54.2 66.5 83.2 134.2
AAPL 22.6 4.9 12.6 19.3 22.3 25.3 39.4

표 4.15. 거래 건수당 메시지 수.

표 4.15는 흥미로운 현상을 드러낸다: 더 자주 거래되는 자산일수록 거래 건수당 필요한 메시지 수가 적다. AAPL의 경우 거래 건수당 약 22.6개의 메시지가 필요한 반면, ISNS는 약 226.7개가 필요하다. 이는 더 유동적인 자산에서는 게시된 LO가 취소 없이 체결될 가능성이 높다는 것을 의미한다.

표 4.16 — 전체 메시지 중 취소 비율 (%)
Asset Mean StdDev P01 Q1 Median Q3 P99
ISNS 45.8 3.2 36.3 44.2 46.4 48.3 49.9
FARO 48.1 1.0 44.4 47.6 48.3 48.7 49.5
MENT 47.2 1.0 44.1 46.7 47.4 48.0 48.9
AAPL 43.1 1.9 37.8 41.8 43.3 44.3 47.1

표 4.16. 메시지 중 취소 비율 (%).

표 4.16에서 AAPL을 제외한 모든 종목에서 최소 45% 이상의 메시지가 취소다. 이것은 알고리즘 거래의 현실을 반영한다: 유동성 공급자들은 끊임없이 LO를 조정하며, 게시된 주문의 절반 정도는 체결 없이 취소된다.

호가창으로부터의 거리와 체결 패턴

일중 거래에서 bid와 ask 주변의 게시 및 취소 동학을 이해하는 것은 매우 중요하다. 표 4.17은 AAPL의 2013년 7월 30일 데이터를 사용하여 midprice로부터의 거리별로 주문 게시와 체결 패턴을 분석한 것이다.

표 4.17 — 게시 시점과 체결 시점의 midprice로부터 거리별 분석 (AAPL 2013-07-30)

이 표에는 두 관점이 있다. 왼쪽은 게시 당시(At Post) 기준이고, 오른쪽은 체결 당시(At Exit) 기준이다. 'Posts'는 해당 거리에서 게시된 주문 수, '% Exec'는 그 중 체결된 비율(%), 'Exec'는 전체 체결 중 해당 거리에서의 비율(%)이다.

Distance
to Midprice
At Post (게시 당시) At Exit (체결 당시)
Posts % Exec Exec Posts % Exec Exec
<2 905 78.6 3.3 988 88.4 4.1
2 3,053 64.7 9.2 3,508 76.4 12.5
3 5,193 55.4 13.5 6,236 67.5 19.7
4 5,617 44.4 11.7 6,448 51.5 15.6
5 6,374 34.9 10.4 7,557 45.5 16.1
6 7,626 27.6 9.8 7,586 29.9 10.6
7 7,996 20.2 7.6 7,624 20.4 7.3
8 7,826 15.9 5.8 8,062 14.2 5.4
9 7,675 12.3 4.4 7,946 7.5 2.8
10 7,967 8.6 3.2 7,487 6.1 2.1
>10 195,415 2.3 21.0 192,205 0.4 3.8

표 4.17. midprice로부터의 거리별 게시 및 체결 분포 (AAPL 2013-07-30).

그림 4.13 — 표 4.17의 시각적 표현

그림 4.13은 가상의 midprice $101.05를 기준으로 표 4.17의 내용을 시각화한다. 각 막대의 길이는 해당 거리에서 게시된 수량 절반(bid와 ask에 균등 분배)을 나타내며, 밝은 색은 체결된 주문, 어두운 색은 취소된 주문을 나타낸다.

예를 들어 midprice로부터 2틱 떨어진 곳에 총 3,053개의 주문이 게시되었다. 이는 $101.07(ask 측)과 $101.03(bid 측)에 각각 약 1,527개씩 배치된다. 이 중 64.7%(988개)가 체결되어 전체 체결의 9.2%를 차지한다.

표 4.17에서 이날의 1분 평균 Quoted Spread는 10.3센트(Q1: 8.5, 중위수: 10.2, Q3: 11.7)이므로, midprice로부터의 거리(half-spread)는 대부분 4~6센트 사이다. 게시 당시 기준으로 1~3센트 거리에서 체결된 주문은 전체의 26%, 4~6센트는 32%, 7센트 이상은 42%이다. 반면 체결 당시 기준으로는 1~3센트가 36%, 4~6센트가 42%, 7센트 이상이 22%이다. 이 차이는 체결이 스프레드가 좁아진 시점에 집중된다는 것, 즉 게시 후 스프레드가 변화하여 처음 먼 거리에 있던 주문이 나중에 더 가까운 위치에서 체결됨을 보여준다.

Figure 4.13

그림 4.13. 게시 수량과 체결 수량의 거리별 분포 시각화. 출처: AHFT(2015), Figure 4.13.

그림 4.14 — midprice로부터의 거리에 따른 체결의 생존 함수 (AAPL)

그림 4.14는 표 4.17의 누적 체결 분포를 생존 함수 \(S(x) = P(X > x) = 1 - F(x)\)의 형태로 보여준다. x축은 원래 LO가 게시된 당시의 midprice로부터의 거리(센트), y축은 해당 거리 이상에서 게시된 LO가 체결될 확률이다. 이것은 'fill probability'(체결 확률)의 근사치로 해석할 수 있다.

전체 체결 (굵은 파란 선): 표 4.17의 분포를 반영한다.

Bid 측과 Ask 측 구분: 흥미롭게도 bid 측 체결(빨간 선)이 ask 측 체결(파란 선)보다 낮다. 즉 매수 MO가 매도 MO보다 midprice에 더 가까이 게시된 주문을 체결하는 경향이 있다. 이날 AAPL 전체 순주문흐름이 양수(매수 압력 우위)이고 가격이 소폭 상승했다는 사실과 일치한다.

시간대별 구분: 장 시작 30분(Mkt Start)은 분포가 위로 이동하여 midprice로부터 더 먼 거리에서도 체결이 발생한다. 장중(Intraday)은 중간 수준이고, 장 마감 30분(Mkt Close)은 분포가 아래로 이동하여 midprice에 가까운 거리에서 체결이 집중된다. 이는 그림 4.6에서 본 장 마감 스프레드 감소와 일치한다. 그러나 그 차이는 통계적으로 유의하지 않을 수 있다.

Figure 4.14

그림 4.14. midprice로부터의 거리에 따른 체결 생존 함수. 출처: AHFT(2015), Figure 4.14.

그림 4.15 — 게시 거리에 따른 체결 비율의 로그 (AAPL)

그림 4.15는 같은 데이터를 다른 각도에서 본 것이다. 게시 당시 midprice로부터 특정 거리에 있던 주문들 중 결국 체결된 비율을 로그 스케일로 보여준다. 이 비율을 확률로 해석하면, 이 그림은 게시 거리와 체결 확률 사이의 자연 감소 관계를 보여준다.

모든 분류(전체, 공격적 매수/매도, 시간대별)에서 유사한 패턴이 나타나지만 하나의 예외가 있다: 장 시작 30분(Mkt Start)에서 6센트 거리의 주문 체결 비율이 이례적으로 높다. 이 기간의 평균 Quoted Spread는 15.2센트(Q1: 12.5, 중위수: 14.2, Q3: 19.0)였는데, 아침의 불확실성이 해소되면서 스프레드가 서서히 좁아져 약 12센트 수준이 되었을 때 6센트 거리의 주문들이 대거 체결된 것이다.

Figure 4.15

그림 4.15. 게시 거리에 따른 체결 비율 (로그 스케일). 출처: AHFT(2015), Figure 4.15.


4.4.1 취소와 체결의 경쟁위험 모형

제4.4절의 핵심 질문은 단순하다. 주문을 올려놓았을 때 그 주문은 먼저 체결되는가, 아니면 먼저 취소되는가. 그러나 이 단순한 질문을 엄밀히 쓰면 두 개의 시계가 동시에 도는 문제다. 하나는 체결까지의 시계이고, 다른 하나는 취소까지의 시계다. 실제 관측되는 것은 둘 중 더 먼저 도착한 사건뿐이다. 따라서 이 절은 경쟁위험(competing risks) 모형으로 다시 쓰는 것이 가장 자연스럽다.

정의 4.4.1 — 체결 강도와 취소 강도

호가창으로부터 거리 \(x\)에 제출된 한 지정가주문이 독립적인 두 사건에 노출된다고 하자.

  • 체결까지의 대기시간 \(T_e\), 강도 \(\lambda(x)\).
  • 취소까지의 대기시간 \(T_c\), 강도 \(\mu(x)\).

실제 관측되는 종료시간은 \(T=\min(T_e,T_c)\)다.

정리 4.4.1 — 경쟁위험 아래 생존함수와 체결확률

정의 4.4.1의 모형에서 \(\lambda(x),\mu(x)\)가 시간에 대해 상수라고 하자. 그러면

\[ P(T>t)=e^{-(\lambda(x)+\mu(x))t} \]

이고, 먼저 체결될 확률과 먼저 취소될 확률은 각각

\[ P(T_e<T_c)=\frac{\lambda(x)}{\lambda(x)+\mu(x)}, \qquad P(T_c<T_e)=\frac{\mu(x)}{\lambda(x)+\mu(x)} \]

가 된다.

증명

생존함수를 \(S(t)=P(T>t)\)라 두자. 짧은 구간 \([t,t+h]\)에서 아무 일도 일어나지 않을 확률은, 체결도 취소도 일어나지 않을 확률이므로

\[ 1-\lambda(x)h-\mu(x)h+o(h) \]

로 적을 수 있다. 따라서

\[ S(t+h)=S(t)\Big(1-(\lambda(x)+\mu(x))h+o(h)\Big). \]

양변에서 \(S(t)\)를 빼고 \(h\)로 나누면

\[ \frac{S(t+h)-S(t)}{h} = - (\lambda(x)+\mu(x))S(t) + S(t)\frac{o(h)}{h}. \]

\(h\to 0\)을 보내면

\[ S'(t)=-(\lambda(x)+\mu(x))S(t). \]

초기조건은 \(S(0)=1\)이다. 이 상미분방정식의 해는

\[ S(t)=e^{-(\lambda(x)+\mu(x))t}. \]

이제 체결이 먼저 일어날 확률을 계산한다. 시각 \(t\)까지 아무 일도 없고, 그 다음 아주 짧은 구간 \([t,t+dt]\)에서 체결이 일어날 확률은

\[ S(t)\lambda(x)\,dt. \]

이를 모든 \(t\ge 0\)에 대해 적분하면

\[ P(T_e<T_c)=\int_0^{\infty} S(t)\lambda(x)\,dt = \int_0^{\infty} \lambda(x)e^{-(\lambda(x)+\mu(x))t}\,dt. \]

상수 \(\lambda(x)\)를 적분 밖으로 꺼내면

\[ P(T_e<T_c)=\lambda(x)\int_0^{\infty} e^{-(\lambda(x)+\mu(x))t}\,dt. \]

지수함수 적분 공식을 쓰면

\[ \int_0^{\infty} e^{-ct}\,dt = \frac{1}{c} \qquad (c>0) \]

이므로 여기서는 \(c=\lambda(x)+\mu(x)\)를 넣어

\[ P(T_e<T_c)=\lambda(x)\cdot \frac{1}{\lambda(x)+\mu(x)} = \frac{\lambda(x)}{\lambda(x)+\mu(x)}. \]

취소가 먼저 일어날 확률도 완전히 같은 방식으로 계산하면

\[ P(T_c<T_e)=\frac{\mu(x)}{\lambda(x)+\mu(x)}. \]

두 확률의 합은 1이므로 계산은 서로 일관된다.

정리 4.4.2 — 호가창으로부터 멀수록 체결확률은 감소한다

\(\lambda(x)\)가 미분가능하며 비증가하고, \(\mu(x)\)가 미분가능하며 비감소한다고 하자. 그러면

\[ \phi(x)=\frac{\lambda(x)}{\lambda(x)+\mu(x)} \]

는 비증가한다. 즉 주문을 더 먼 가격에 둘수록 먼저 체결될 확률은 커지지 않는다.

증명

몫의 미분법을 적용한다. 분자 \(u(x)=\lambda(x)\), 분모 \(v(x)=\lambda(x)+\mu(x)\)라 두면

\[ \phi'(x)=\frac{u'(x)v(x)-u(x)v'(x)}{v(x)^2}. \]

이를 원래 기호로 다시 쓰면

\[ \phi'(x)=\frac{\lambda'(x)(\lambda(x)+\mu(x)) - \lambda(x)(\lambda'(x)+\mu'(x))}{(\lambda(x)+\mu(x))^2}. \]

분자를 전개하면

\[ \lambda'(x)\lambda(x)+\lambda'(x)\mu(x)-\lambda(x)\lambda'(x)-\lambda(x)\mu'(x). \]

첫째 항과 셋째 항이 정확히 상쇄되므로

\[ \phi'(x)=\frac{\lambda'(x)\mu(x)-\lambda(x)\mu'(x)}{(\lambda(x)+\mu(x))^2}. \]

분모는 제곱이므로 항상 양수다. 따라서 부호는 분자만 보면 된다. 가정에 의해 \(\lambda'(x)\le 0\), \(\mu'(x)\ge 0\), 그리고 강도는 음이 아니므로 \(\lambda(x)\ge 0\), \(\mu(x)\ge 0\)다. 그러면

\[ \lambda'(x)\mu(x) \le 0, \qquad -\lambda(x)\mu'(x) \le 0. \]

음이 아닌 두 항의 합이 아니라, 0 이하인 두 항의 합이므로

\[ \lambda'(x)\mu(x)-\lambda(x)\mu'(x)\le 0. \]

결국

\[ \phi'(x)\le 0. \]

즉 \(\phi(x)\)는 비증가한다. 이는 본문 그림에서 관찰되는 패턴, 즉 최우선호가에서 멀어질수록 체결 가능성이 내려가는 현상을 수학적으로 다시 쓴 것이다.

4.5 숨겨진 주문 (Hidden Orders)

제4.3절에서 시장 질과 스프레드를 분석할 때 실효스프레드(ES)가 Quoted Spread(QS)보다 작거나 심지어 음수가 될 수 있다고 언급했다. 그 이유 중 하나가 바로 숨겨진 주문(hidden orders)이다. 숨겨진 주문은 LOB에 등록되어 있지만 시장 참여자들에게 보이지 않으면서, 현재 bid/ask에서 또는 그보다 더 유리한 가격에서 들어오는 MO와 매칭되는 LO다.

표 4.18 — 숨겨진 주문과의 체결 (수량 및 비율)

표 4.18은 두 패널로 구성된다. 위쪽 패널은 2013년 각 분마다 NASDAQ에서 숨겨진 주문과 체결된 수량을 보여주고, 아래쪽 패널은 같은 변수를 해당 분의 전체 체결 수량 대비 비율로 보여준다.

Asset Mean StdDev P01 Q1 Median Q3 P99
숨겨진 주문과의 체결 수량 (주식 수 / 분)
ISNS 4 59 0 0 0 0 100
FARO 31 154 0 0 0 0 600
MENT 117 568 0 0 0 0 2,150
AAPL 3,849 5,905 0 1,052 2,220 4,504 26,547
전체 체결 수량 중 숨겨진 주문 체결 비율 (%)
ISNS 1.2 10.7 0.0 0.0 0.0 0.0 99.6
FARO 9.9 27.1 0.0 0.0 0.0 0.0 100.0
MENT 9.4 24.1 0.0 0.0 0.0 0.0 100.0
AAPL 44.6 16.9 0.0 33.5 44.9 56.0 83.7

표 4.18. 숨겨진 주문과의 체결 (위: 수량, 아래: 전체 체결 대비 비율).

표 4.18은 숨겨진 주문의 역할이 자산별로 극명하게 다름을 보여준다. ISNS, FARO, MENT의 경우 숨겨진 주문과의 체결이 75% 이상의 시간에 전혀 없다(Q3가 0). 하지만 발생할 때는 상당한 양이 될 수 있다(P99 값이 크다). 이들 종목에서는 체결이 드물고, 그 드문 체결이 숨겨진 주문과 연관될 경우 그 분(minute)의 전체 체결의 100%를 차지하기도 한다.

AAPL의 경우는 완전히 다르다. 75% 이상의 시간에서 숨겨진 주문과의 체결이 발생하며(Q1이 1,052주로 0이 아님), 중위수 기준 전체 체결의 약 45%가 숨겨진 주문과 이루어진다(중위수 44.9%). AAPL에서 숨겨진 주문 1건의 평균 크기는 약 127주이며(Q1: 94주, Q3: 148주), 이는 절대량 자체보다는 체결 빈도가 높음을 의미한다.

숨겨진 주문의 경쟁적 함의

AAPL에서 visible LO를 bid와 ask에 게시한 투자자는 2013년 기준 상당히 자주 더 공격적인 숨겨진 주문에 의해 앞질러졌다(trumped). 전체 체결의 절반 가까이가 숨겨진 주문에서 발생했다는 것은, visible LO 공급자들이 체결 기회를 얻기 위한 경쟁에서 숨겨진 주문 공급자들에게 불리한 위치에 있었음을 의미한다. 이는 시장 설계(market design) 관점에서 중요한 문제다: 숨겨진 주문을 허용할 경우 유동성 공급의 인센티브 구조가 어떻게 변하는가? 이 주제는 제4장의 마지막에서 언급되며, 이후 장들의 알고리즘 설계에서도 관련 고려가 필요하다.

4.5.1 숨겨진 유동성과 측정 편향의 정식화

숨겨진 주문은 단순히 "화면에 안 보이는 물량"이 아니다. 더 정확히 말하면, 화면에 보이는 호가사다리만으로 계산한 실행비용과 실제 실행비용 사이에 체계적인 차이를 만드는 메커니즘이다. 따라서 제4.5절의 핵심은 숨겨진 주문이 있다는 사실 자체보다, 그것이 시장 질 지표를 어떤 방향으로 왜곡하는가에 있다.

정의 4.5.1 — 표시 깊이, 총 깊이, 그리고 역호가함수

매수 시장가주문을 생각하자. 중간가격 이상에서 가격 \(p\)까지 누적된 표시 물량을 \(D_{vis}(p)\), 숨겨진 물량까지 포함한 총 누적물량을 \(D_{tot}(p)\)라 하자. 항상

\[ D_{tot}(p) \ge D_{vis}(p) \]

가 성립한다. 임의의 주문량 \(z>0\)에 대해 그 수량을 소화하기 위해 필요한 최저 가격을 각각

\[ p_{vis}(z)=\inf\{p : D_{vis}(p)\ge z\}, \qquad p_{tot}(z)=\inf\{p : D_{tot}(p)\ge z\} \]

로 둔다. 이를 역호가함수라 부른다.

정리 4.5.1 — 숨겨진 깊이는 평균 체결가격을 악화시키지 않는다

정의 4.5.1의 조건 아래 모든 \(z>0\)에 대해

\[ p_{tot}(z) \le p_{vis}(z) \]

가 성립한다. 따라서 주문량 \(v\)의 총체결대금

\[ C_{vis}(v)=\int_0^v p_{vis}(z)\,dz, \qquad C_{tot}(v)=\int_0^v p_{tot}(z)\,dz \]

에 대해

\[ C_{tot}(v)\le C_{vis}(v) \]

가 성립한다.

증명

먼저 역호가함수의 점별 비교부터 보인다. 임의의 \(z>0\)를 고정하자. \(p_{vis}(z)\)의 정의에 의해

\[ D_{vis}(p_{vis}(z))\ge z. \]

그런데 모든 가격 \(p\)에서 \(D_{tot}(p)\ge D_{vis}(p)\)이므로 특히 \(p=p_{vis}(z)\)를 대입하면

\[ D_{tot}(p_{vis}(z))\ge D_{vis}(p_{vis}(z))\ge z. \]

따라서 \(p_{vis}(z)\)는 집합 \({p : D_{tot}(p)\ge z}\)의 원소다. 이제 \(p_{tot}(z)\)는 그 집합의 하한이므로

\[ p_{tot}(z) \le p_{vis}(z). \]

점별 부등식을 얻었다.

이제 총체결대금을 비교한다. 각 \(z\in[0,v]\)에 대해 \(p_{tot}(z)\le p_{vis}(z)\)이므로 적분의 단조성을 적용하면

\[ \int_0^v p_{tot}(z)\,dz \le \int_0^v p_{vis}(z)\,dz. \]

\[ C_{tot}(v)\le C_{vis}(v). \]

평균 체결가격도 각각 \(\bar p_{tot}(v)=C_{tot}(v)/v\), \(\bar p_{vis}(v)=C_{vis}(v)/v\)이므로 \(v>0\)를 나누어

\[ \bar p_{tot}(v)\le \bar p_{vis}(v) \]

를 얻는다. 즉 숨겨진 유동성은 매수 시장가주문의 체결가격을 약화시키는 것이 아니라, 동일 주문량에 필요한 지불가격을 약하게나마 낮춘다.

정리 4.5.2 — 숨겨진 주문을 무시하면 가격충격은 과대측정된다

중간가격을 \(m\)이라 하고, 주문량 \(v\)에 대한 즉시 가격충격을

\[ I_{vis}(v)=p_{vis}(v)-m, \qquad I_{tot}(v)=p_{tot}(v)-m \]

로 정의하자. 그러면 모든 \(v>0\)에 대해

\[ I_{tot}(v)\le I_{vis}(v) \]

가 성립한다.

증명

정리 4.5.1에서 이미 모든 \(v>0\)에 대해

\[ p_{tot}(v)\le p_{vis}(v) \]

를 보였다. 이제 양변에서 같은 중간가격 \(m\)을 빼면 부등호 방향은 유지되므로

\[ p_{tot}(v)-m \le p_{vis}(v)-m. \]

왼쪽은 \(I_{tot}(v)\), 오른쪽은 \(I_{vis}(v)\)의 정의이므로

\[ I_{tot}(v)\le I_{vis}(v). \]

즉 표시 호가만 보고 계산한 가격충격은 실제 시장의 총 유동성을 반영한 충격보다 크거나 같다. 따라서 숨겨진 주문이 활발한 종목에서는 visible book만으로 충격을 계산하면 가격충격을 체계적으로 과대평가하게 된다.