マツリさんの日記

androidプログラミング初心者の奮闘日記です。たまに統計学もしてます。

時系列データ解析 04 ~ 自己相関の検定

www.asakura.co.jp


 沖本先生の本の続きです。今回は自己相関の検定です。
 そもそも時系列データに自己相関構造がなければ、モデルを構築して、そのモデルから予測を行うことも難しくなります。
 そのため、自己相関の有無を調べることは、大変重要なことになります。

 定常過程での基本統計量は、時点に依存しないため、標本統計量からすぐに計算できます。

 期待値、自己共分散、自己相関係数は、それぞれ次のようになります。

 \displaystyle \overline{y} = \frac{1}{T} \sum^{T}_{t = 1} y_{t}

 \displaystyle \hat{\gamma}_{k} = \frac{1}{T} \sum^{T}_{t = k + 1} (y_{t} - \overline{y }) (y_{t-k} - \overline{y} ), k = 0, 1, 2, \cdots

 \displaystyle \hat{\rho}_{k} = \frac{\hat{\gamma}_{k}}{\hat{\gamma}_{0}}, k = 1, 2, 3, \cdots

 それぞれ、標本平均、標本自己共分散、標本自己相関係数と呼ばれます。

 この標本自己相関係数  \hat{\rho}_{k} を使って、仮説検定を行います。
 帰無仮説は  H_{0} : \rho_{k} = 0、つまり自己相関がないということです。
 対立仮説は、  H_{1} : \rho \neq 0で、自己相関が  0 ではないということです。

 特に、  y_{t} iid 系列の場合、標本自己相関係数  \hat{\rho}_{k} が、漸近的に平均  0 、分散  \frac{1}{T}正規分布に従うそうです。これについて、統計量を求めることになります。

 複数の  k に関して、自己相関係数  \rho_{k} 0 の場合を検定する場合は、帰無仮説は  H_{0} : \rho_{1} = \rho_{2} = \cdots = \rho_{m} = 0 となります。対立仮説は、  H_{1} : 少なくとも一つの  k \in \left[ 1, m \right]において  \rho_{k} = 0 となります。

 この検定は、かばん検定(portmanteau test)と呼ばれ、Ljung Box検定が有名です。
 Ljung Box検定の統計量は、

 \displaystyle Q(m) = T(T + 2) \sum^{m}_{k = 1} \frac{\hat{\rho}^{2}_{k}}{T - k} \sim \chi^{2} (m)

が一定の条件のもとで成立します。この検定では、小さい  m を選択すると高次の自己相関を見逃したり、大きい  m を選択すると検定の検出力が小さくなるなどの問題があります。
  m を選択する際の目安として、  m \approx log(T) がありますが、実務的には複数の  m に関して検定を行っているようです。

 今更ですが、正規分布確率密度関数

 \displaystyle f(x) = \frac{1}{\sqrt{2 \pi} \sigma} exp \left\{ - \frac{(x - \mu)^{2}}{2 \sigma^{2}} \right\}

と表現されます。
 これで第1章は終了です。