時系列データ解析 04 ～自己相関の検定

www.asakura.co.jp

　沖本先生の本の続きです。今回は自己相関の検定です。
　そもそも時系列データに自己相関構造がなければ、モデルを構築して、そのモデルから予測を行うことも難しくなります。
　そのため、自己相関の有無を調べることは、大変重要なことになります。

　定常過程での基本統計量は、時点に依存しないため、標本統計量からすぐに計算できます。

　期待値、自己共分散、自己相関係数は、それぞれ次のようになります。

$\displaystyle \overline{y} = \frac{1}{T} \sum^{T}_{t = 1} y_{t}$

$\displaystyle \hat{\gamma}_{k} = \frac{1}{T} \sum^{T}_{t = k + 1} (y_{t} - \overline{y }) (y_{t-k} - \overline{y} ), k = 0, 1, 2, \cdots$

$\displaystyle \hat{\rho}_{k} = \frac{\hat{\gamma}_{k}}{\hat{\gamma}_{0}}, k = 1, 2, 3, \cdots$

　それぞれ、標本平均、標本自己共分散、標本自己相関係数と呼ばれます。

　この標本自己相関係数 $\hat{\rho}_{k}$ を使って、仮説検定を行います。
　帰無仮説は $H_{0} : \rho_{k} = 0$ 、つまり自己相関がないということです。
　対立仮説は、 $H_{1} : \rho \neq 0$ で、自己相関が $0$ ではないということです。

　特に、 $y_{t}$ が $iid$ 系列の場合、標本自己相関係数 $\hat{\rho}_{k}$ が、漸近的に平均 $0$ 、分散 $\frac{1}{T}$ の正規分布に従うそうです。これについて、統計量を求めることになります。

　複数の $k$ に関して、自己相関係数 $\rho_{k}$ が $0$ の場合を検定する場合は、帰無仮説は $H_{0} : \rho_{1} = \rho_{2} = \cdots = \rho_{m} = 0$ となります。対立仮説は、 $H_{1} :$ 少なくとも一つの $k \in \left[ 1, m \right]$ において $\rho_{k} = 0$ となります。

　この検定は、かばん検定(portmanteau test)と呼ばれ、Ljung Box検定が有名です。
　Ljung Box検定の統計量は、

$\displaystyle Q(m) = T(T + 2) \sum^{m}_{k = 1} \frac{\hat{\rho}^{2}_{k}}{T - k} \sim \chi^{2} (m)$

が一定の条件のもとで成立します。この検定では、小さい $m$ を選択すると高次の自己相関を見逃したり、大きい $m$ を選択すると検定の検出力が小さくなるなどの問題があります。
　 $m$ を選択する際の目安として、 $m \approx log(T)$ がありますが、実務的には複数の $m$ に関して検定を行っているようです。