Analisi esaustiva delle serie temporali: Stazionarietà

È importante comprendere la stazionarietà delle serie temporali durante la fase esplorativa in quanto diversi modelli di previsione ne fanno affidamento. La stazionarietà di una serie temporale significa che le sue proprietà statistiche non cambiano nel tempo, con media, varianza e autocorrelazione costanti, indipendenti dal tempo.

Per verificare la stazionarietà, possiamo utilizzare i test di Augmented Dickey-Fuller (“ADF”) e di Kwiatkowski-Phillips-Schmidt-Shin (“KPSS”), implementati nella libreria statsmodels. È importante tenere presente le ipotesi dei due test, in quanto presentano ipotesi nulle opposte.

Il test di Augmented Dickey-Fuller (ADF) ha le seguenti ipotesi:
– H0: Una radice unitaria è presente nel campione della serie temporale (non stazionaria)
– Ha: Non vi è alcuna radice unitaria nel campione della serie temporale (stazionaria)

Il test di Kwiatkowski-Phillips-Schmidt-Shin (KPSS) ha le seguenti ipotesi:
– H0: I dati sono stazionari attorno a una costante (stazionaria)
– Ha: Una radice unitaria è presente nel campione della serie temporale (non stazionaria)

È importante valutare la stazionarietà su quale scala, poiché dipenderà dal modo in cui si modella il dato. Nell’esempio seguente, esamineremo i mesi di gennaio 2016 e gennaio 2022 per la stazione dell’aeroporto internazionale di Vancouver per valutare eventuali cambiamenti comportamentali.

Dopo aver eseguito i test ADF e KPSS, possiamo interpretare i risultati in base a quattro casi principali elencati nella documentazione di statsmodels. Inoltre, osserviamo che il caso 4 risulta predominante nei dati, il che ci porta alla prossima sezione sull’operazione di differenziazione di primo ordine per rendere i dati stazionari.