다변량 시계열의 기본개념

February 02, 2017

다변량 시계열은 하나의 변수가 아닌 여러개의 변수의 상관관계가 있을 경우 쓰인다. N개의 변수를 각각 과거의 N개의 변수의 관계를 통해서 파악해볼 수 있다. 다변량시계열간의 공분산을 구한 다음, 행렬을 통해서 관계식을 도출할 수 있다.

공분산 행렬

다변량시계열은 하나의 변수가 다양한 변수가 시계열에 영향을 미칠때 쓰인다. 우선 다변량 시계열 벡터$X_t$를 아래와 같이 정의해보자.

\[{X_t}=\begin{bmatrix} X_{t1} \\ \vdots \\X_{tn} \end{bmatrix}\]

$X_t$의 공분산 행렬을 만들어보자. 공분산 행렬 구하기 이전에 기대값 E(X)는 아래와 같이 정의될 수 있다.

\[\mu=E(X)=\begin{bmatrix} E(X_{1t}) \\ \vdots \\E(X_{tn}) \end{bmatrix}\]

그렇다면 $X_{t1}$부터 $X_{tn}$까지 각각의 공분산을 tXt 행렬은 구해보자. 분산은 관측값에서 평균을 뺀 값이므로, 아래와 같이 표현될 수 있다. 공분산은 두개의 분산을 곱한 것이므로 아래와 $x-\mu$의 곱으로 표현될 수 있다.

\[x-\mu=\begin{bmatrix} X_{t1}-u_1 \\ \vdots \\X_{tn}-u_n \end{bmatrix} \\ (x-\mu)*(x-\mu)^T=\begin{bmatrix}&& \dots && \\ &&\vdots \\ (X-\mu_i)(X-\mu_j) && \\ \end{bmatrix}\\ E(x-\mu)*(x-\mu)^T=\begin{bmatrix}&& \dots && \\ &&\vdots \\ E(X-\mu_i)(X-\mu_j) && \\ \end{bmatrix}\]

다시 요약하자면, 다변량 변수 $X_1 \dots X_n$의 공분산은 $E(x-\mu)* (x-\mu)^T$로 표현될 수 있다. 공분산행렬을 풀어서 보면, 아래와 같이 표현될 수 있다.

\[E(XX^T-\mu X^T-X\mu^T+\mu \mu^T)\\ E(XX^T)-\mu E(X^T)-\mu^TE(X)+E(\mu \mu^T)\]

여기서 중요한 것은 $E(X^T)$의 경우, $X^T$의 평균이기 때문에 $\mu^T$로 치환이 가능하다. 그렇다면 아래와 같이 식의 변환이 가능핟.

\[E(XX^T)-\mu \mu^T-\mu^T\mu+\mu\mu^T\\ E(XX^T)-\mu^T\mu\]

다변량 시계열

Y=AX시계열을 보자 Y는Kx1행렬이고, X는 Nx1행렬이라고 가정을 하자.A는 시계열계수로 KxN행렬이다.AX는 아래와 같이 표현될수 있다.

\[Y=AX=\begin{bmatrix}a_{11}\dots a_{1n} \\ \vdots \\a_{k1} \dots a_{kn}\end{bmatrix} \begin{bmatrix} X_1 \\ \vdots \\X_n \end{bmatrix} = \begin{bmatrix} a_1^TX \\ \vdots \\a_k^TX \end{bmatrix}\]

위의 공분산 공식을 활용해서 Y의 공분산을 구해보자. 우선 Y의 평균은 행렬A의 X의 평균값을 따른다.

\[\mu_{Y}=A \mu_x\]

위의 평균과 다음에 공분산 공식을 이용해서 Y의 공분산을 구할 수 있다.

\[Cov(Y)=Cov(AX)\\ = E(AXX^{T}A^{T})-A\mu_{x}\mu_{x}A^{T}\\ =AE(XX^{T})A^{T}-A\mu_{x}\mu_{x}A^{T}\\ =A(E(XX^{T})-A\mu_{x}\mu_{x})A^{T}\]