Autokorelace

Autokorelace náhodných složek je jev, kterým ve statistice označujeme porušení Gauss-Markovova požadavku pro možnost odhadu regresních parametrů metodou nejmenších čtverců.

Matice kovariancí $\Sigma$ , která má při splnění nekorelovanosti náhodných složek tvar: $\Sigma =\sigma ^{2}*I_{n}$ , při autokorelaci vykazuje nenulové kovariance (tedy nediagonální prvky jsou nenulové). Platí, že $\sigma ^{2}$ je nám neznámý rozptyl náhodných složek a $I_{n}$ je jednotková matice řádu n.

Příčiny vzniku autokorelace

chybná specifikace modelu - tzv. kvaziautokorelace
přílišná aproximace v modelu (např. místo $x^{2}$ použijeme x apod.
použití časově zpožděných proměnných v modelu
zahrnutí chyb měření do vektoru u
použití upravených dat - např. extrapolovaných, centrovaných, interpolovaných apod.

Důsledky autokorelace

ztráta vydatnosti odhadu i asymptotické vydatnosti odhadu regresních parametrů
$\sigma ^{2}$ i standardní chyby $s_{b_{j}}$ jsou vychýlené, R² je nadhodnoceno, zatímco t-testy jsou slabé a rezidua jsou podhodnocená

Autokorelace prvního řádu

Tzv. autoregresní struktura prvního řádu:

$u_{t}=\rho *u_{t-1}+\epsilon _{t}$

zároveň platí následující vztah:

$E(u_{t}^{T}u_{s})=\rho ^{t-s}*\sigma ^{2}$

kde $\rho$ je tzv. autokorelační koeficient prvního řádu. Platí pro něj $\left|\rho \right|\leq 1$ , protože jinak by měla rovnice explozivní charakter a byla by tak narušena homoskedasticita v matici $\Sigma$ . Nejsilnější korelace je vždy mezi dvěma sousedními vektory náhodných složek.

Pokud je $\rho >0$ , pak se jedná o pozitivní autokorelaci.
Pokud je $\rho <0$ , pak se jedná o negativní autokorelaci.
Pokud je $\rho =0$ , pak jsou složky vektorů $u_{s}$ a $u_{t}$ sériově nezávislé.

Testování výskytu autokorelace

Protože neznáme přesnou podobu vektoru náhodných složek u, pracujeme s vektory reziduí $e_{i}$ .

Durbinova-Watsonova statistika

Předpoklady použití testu

úrovňová konstanta v modelu
regresory nejsou stochastické proměnné

Testovací statistika

$d={\frac {\sum _{t=2}^{T}(u_{t}-u_{t-1})^{2}}{\sum _{t=1}^{T}u_{t}^{2}}}$

Pro výslednou charakteristiku nelze určit kritickou hodnotu, při které bychom odmítli hypotézu H₀ při testování proti d-statistice. Postup vyhodnocení je následující:

statistika d má střední hodnotu E(d) = 2 a nachází se v intervalu <0;4>
stanovíme tabulkové hodnoty d_D (dolní mez d) a d_H (horní mez d) podle stupňů volnosti modelu
porovnáme hodnotu d s následujícími intervaly a na základě pozice d vyhodnotíme autokorelaci:

Interval <0;d_D> značí pozitivní autokorelaci
V intervalu <d_D;d_H> nemůžeme rozhodnout, zda se jedná o korelaci, či nikoliv
Interval <d_H;2> poukazuje na statisticky nevýznamnou pozitivní autokorelaci

Interval <2;4-d_H> poukazuje na statisticky nevýznamnou negativní autokorelaci
V intervalu <4-d_H;4-d_D> nemůžeme rozhodnout, zda se jedná o korelaci, či nikoliv
Interval <4-d_D;4> poukazuje na statisticky významnou negativní autokorelaci

Durbinovo h

použijeme právě tehdy, pokud se v modelu nachází zpožděná vysvětlovaná proměnná

Statistika h má následující podobu:

h=(1-d/2){\sqrt {\frac {T}{1-Ts_{b_{j}}^{2}}}}

, kde j značí j-tou vysvětlující zpožděnou proměnnou za podmínky, že

s_{b_{j}}^{2}<1/T

.

Statistiku h testujeme přes normované normální rozdělení N(0;1), kdy pro

$h<\left|U_{1-\alpha }\right|$ předpokládáme sériovou nezávislost náhodných složek
$h\geq \left|U_{1-\alpha }\right|$ usuzujeme na autokorelaci

Postup v případě identifikování autokorelace náhodných složek

ověřit správnost modelu (jestli se nejedná o kvaziautokorelaci)
logaritmování nebo semilogaritmování dat
transformace dat v matici pozorování X pomocí matice T - tzv. Praisova-Winstenova transformace

$T={\frac {1}{\sqrt {1-\rho ^{2}}}}*{\begin{pmatrix}{\sqrt {1-\rho ^{2}}}&0&\dots &0&0\\-\rho &1&\dots &0&0\\0&-\rho &1&\dots &0\\\vdots &0&\ddots &\ddots &0\\0&0&\dots &-\rho &1\\\end{pmatrix}}$

což vyústí v následující podobu modelu, který již bude poskytovat při použití metody zobecněných nejmenších čtverců vydatné i asymptoticky vydatné odhady regresních parametrů:

y_{t}-\rho y_{t-1}=\alpha (1-\rho )+\beta (X_{t}-\rho X_{t-1})+e_{t}.\,

Odkazy

Reference

Cochrane a Orcutt. 1949. "Application of least squares regression to relationships containing autocorrelated error terms". Journal of the American Statistical Association 44, str. 32–61

Literatura

Hušek, R. Ekonometrická analýza, Praha, 2007, nakladatelství Oeconomica, ISBN 978-80-245-1300-3

Navigation

Navigace

Tématické portály