時系列分析とは
期間 のおのおので決まるデータ の列を 時系列データ といいます。時系列分析では、このような時系列データに対してモデルを考え、これを解析・予測することを試みます。
自己相関
時系列データ は、もとは時刻 で決まる確率変数 であったとみることができます(すなわち 確率過程 です)。これらの期待値および分散は、やはり時刻 で規定されて、
と表すことができます。一方で、時系列データにおいては異なる時点 での相関を考えることができて、これを 自己共分散 や 自己相関係数 によって特徴づけることができます。
自己共分散
ラグ だけ離れた2つのデータ の自己共分散を次で定義します:
これをラグ の関数とみることもできます。そのような場合には自己共分散関数とよぶこともあります。
また、 であることもわかります。
自己相関係数
ラグ だけ離れた2つのデータ の自己相関係数は、
と定義できます。ラグ の関数とみる場合には自己相関関数とよび、これを実際のデータからサンプリングしてプロットしたものは コレログラム とよばれます。また、 であることもわかります。
定常性とホワイトノイズ
弱定常過程
の各種統計量について、おのおのが時刻 に依存せず決まる以下の条件:
をみたすとき、このような系列を 弱定常過程 とよびます。このとき、
であり、自己相関係数もまた時刻 に依存しません。
ホワイトノイズ
弱定常過程の時系列データ について、
が成り立つ場合、そのような系列を ホワイトノイズ といいます。定義から明らかなように、ホワイトノイズは時刻 毎に独立であるとします。
よく、 は互いに独立かつ同一な分布にしたがう()と想定することがあります。例えば、重回帰モデルの誤差項 は な正規分布 を想定します。
AR(自己回帰)モデル
AR(1)モデル
確率過程 が生み出す時系列データ において、定数 を用いて
と表されるモデルを AR(1)モデル といいます。ここで はホワイトノイズで、系列 を生成する ショック とよばれます。
すなわち、AR(1)モデルは自身の過去の状態 にショックを与えて新しい状態を回帰的に生成するモデルであることがわかります。ここで、初期状態 が に与える影響の強さは であるので、 であるならば時間ステップを経るごとに自己相関は弱まっていくことがわかります。すなわち、 であるようなAR(1)モデルは弱定常過程となります。
AR(1)モデルの統計量
AR(1)モデルにしたがう系列 について、弱定常 を仮定します。このとき、統計量は次のように与えられます:
統計量 | 表現 |
---|---|
期待値 | |
分散 | |
自己共分散 | |
自己相関係数 |
自己相関は1ステップごとに ずつ減少していき、ゼロへ漸近していくことがわかります。
AR(p)モデル
個の過去の状態 で が説明される場合、これを AR(p)モデル といい、
で表します。
MA(移動平均)モデル
MA(1)モデル
確率過程 が生み出す時系列データ において、定数 および なる期待値 を用いて
と表されるモデルを MA(1)モデル といいます。 はショック(ホワイトノイズ)です。
MA(1)モデルは過去の状態に依存せず、現在と過去のショックのみから状態を生成するモデルであるといえます。
MA(1)モデルの統計量
AR(1)モデルと異なり、MA(1)モデルは必ず弱定常過程となります。各種統計量は次のように与えられます:
統計量 | 表現 |
---|---|
期待値 | |
分散 | |
自己共分散(ラグ ) | |
自己共分散(ラグ ) |
AR(1)モデルと異なり、2ステップ以上離れた場合の自己相関は必ずゼロとなることがわかります。
MA(q)モデル
に加え、 個のホワイトノイズ で が説明される場合、これを MA(q)モデル といい、
で表します。
周波数領域における解析
定常なモデルの自己共分散関数 に対する(離散)フーリエ変換:
を スペクトラム(スペクトル密度関数) といいます。これは時間領域()から周波数領域()への変換であり、コレログラム における任意の時間領域での変換は ピリオドグラム とよばれます。ここで、
が成り立ちます。
周波数領域での分析は、時系列データがどのような周期性をもつか考えるうえでよく役に立ちます。たとえば定常()なAR(1)過程においては、 である場合にはコレログラムは大きく振動しますから、ピリオドグラムは高周波数成分を多くもちます。対して、 であればコレログラムはなめらかに単調減少していきますから、ピリオドグラムは低周波数成分を多くもちます。
系列相関の検定
ダービン・ワトソン検定
重回帰モデル:
において、これが時系列データであるとするとき、任意の誤差項 間の相関(自己相関)を検定する方法を ダービン・ワトソン検定 といいます。この検定で用いる統計量は、誤差の推定量を とするとき、
と表され、これを ダービン・ワトソン比 といいます。ここで はラグ の自己相関係数の推定量であり、 が十分大きいときに、
です。さて、帰無仮説 とすれば、帰無仮説の下での検定統計量 は に近くなるため、
- のとき
- であり、誤差は系列相関なしと判断する。
- のとき
- であり、誤差は正の系列相関をもつと判定する。
- のとき
- であり、誤差は負の系列相関をもつと判定する。
が得られます。
参考
書籍
『統計学実践ワークブック』(学術図書出版社, 2020)第27章
サイト
pythonで「計量時系列分析」を読む1 時系列分析の基礎概念 | Qiita