読者です 読者をやめる 読者になる 読者になる

マツリさんの日記

androidプログラミング初心者の奮闘日記です。たまに統計学もしてます。

時系列データ解析 03~ 復習

 少し駆け足でしたので、主に式の展開を詳しく説明します。

 まず、確率変数  x の期待値はこのように書けます。

 \displaystyle E ( x ) = \overline{ x } = \sum_{i = 1}^{n} x_{i} = \frac{x_{1} + x_{2} + \cdots + x_{n}}{n}

 分散はこのようになります。

 \displaystyle V ( x ) = E \left[ \left\{ x - E (x) \right\}^{2} \right] = \frac{(x_{1} - \overline{x}) + (x_{2} - \overline{x}) + \cdots + (x_{n} - \overline{x})}{n - 1}

 \displaystyle V ( x ) = E ( x^{2} ) - \left\{ E ( x ) \right\}^2

  i 番目の変数との偏差を  n - 1 あるいは  n で割ったものが分散です。分散の平方根標準偏差といいます。

 以上は  1 変数ですが、 2 変数の場合、分散は変数同士の関連具合を表す共分散となります。

 \displaystyle Cov ( x, y ) = E \left[ \left\{ x - E( x ) \right\} \left\{ y - E ( y ) \right\} \right] = E \left[ ( x - \overline{x} ) ( y - \overline{y} ) \right]

 \displaystyle Cov ( x, y ) = E( x y ) - E ( x ) E ( y )

 共分散は分散を一般化したもので、自己共分散は共分散の時系列データバージョンです。

 あらためて、 k 次の自己共分散  \gamma_{k} を記述します。

 \displaystyle \gamma_{k t} = Cov ( t_{t} , y_{t - k} ) = E \left[ ( y_{t} - \mu_{t} ) ( y_{t - k} - \mu_{t - k} ) \right]

 変数  y_{t} k 次の変数  y_{t - k}との関連具合を表しています。

 続いて、相関係数はこのように記述されます。

 \displaystyle \rho_{x y} = \frac{Cov (x, y)}{\sqrt{V(x)} \sqrt{V(y)}}

 相関係数(ピアソンの積率相関係数)は、共分散をそれぞれの標準偏差で基準化したものになります。もう少し詳しく書くとこうなります。

 \displaystyle \rho_{x y} = \frac{\sum ( x - \overline{x} ) ( y - \overline{y} )}{\sqrt{\sum( x - \overline{x} )^{2}}\sqrt{\sum ( y - \overline{y} )^{2}}}

 相関係数 \rho \leq 1 となりますが、それは上の式をコーシー・シュワルツの不等式( \mid (x, y ) \mid \leq \mid x \mid \cdot \mid y \mid)により展開することで確認できます。

 \displaystyle \mid \sum ( x - \overline{x} ) ( y - \overline{y} ) \mid \leq \sqrt{\sum( x - \overline{x} )^{2}}\sqrt{\sum ( y - \overline{y} )^{2}}

 \frac{\mid \sum ( x - \overline{x} ) ( y - \overline{y} ) \mid}{\sqrt{\sum( x - \overline{x} )^{2}}\sqrt{\sum ( y - \overline{y} )^{2}}} \leq 1

 ここで、 k 次の相関係数をあらためて記述します。

 \displaystyle \rho_{k t} = \frac{Cov ( y_{t}, y_{t - k} )} { \sqrt{V (y_{t}) \cdot V ( y_{t - k} )}}

 時系列データの自己相関係数相関係数と同じものであることが分かるのではないかと思います。