LITTLE BY LITTLE

[2] ARIMA - 시계열 데이터, 정상성, 검정 방법(ADF/KPSS) 본문

데이터 분석/시계열 데이터 분석

[2] ARIMA - 시계열 데이터, 정상성, 검정 방법(ADF/KPSS)

위나 2023. 11. 11. 01:11


0. 시계열 데이터

연속 시계열 데이터와 이산 시계열 데이터

 

: 연속 시계열 데이터는 모든 시점이 연결되어 있기 때문에 분석하기 부담스러워 이산 시계열 데이터를 많이 사용한다. 특정 시점에서 측정한 관측값들의 집합


1. 정상성을 나타내는 시계열 확인하기

 

1-1. 정상성을 나타내지 않는 시계열 

: 추세가 있고 수준이 변하는 경우 & 계절성이 보이는 경우 & 평균과 분산이 일정하지 않은 경우

(a),(c),(e),(f),(i)  - 추세가 있고 수준이 변하는 경우

(d).(h) - 분명하게 계절성이 보이는 경우

(i) - 분산이 증가하는 경우


1-2. 정상성을 나타내는 시계열

: 규칙적인 주기나 추세, 계절성이 없고 평균과 분산이 일정한 경우

(b),(g) 정상성을 나타내는 시계열

※ 헷갈릴 수 있는 경우
: (g)는 뚜렷한 주기가 나타나긴 하지만, 불규칙적인 주기이기 때문에 정상성을 나타냄
- 주기성 행동을 가지고 있는 시계열은 정상성을 나타내는 시계열 (당연히 추세나 계절성은 없어야 함)
- 주기가 고정된 길이를 갖고 있지 않기 때문
- 주기의 고점이나 저점이 어디일지 확실하게 알 수 없어 예측할 수 없는 패턴을 나타냄 → 정상성
- 일반적으로는, 정상성을 나타내는 시계열은 장기적으로 볼 때 예측할 수 있는 패턴을 나타내지 않을 것
- 어떤 주기적인 행동이 있을 수 있더라도 시간 그래프는 시계열이 일정한 분산을 갖고 대략적으로 평평하게 될 것을 나타낼 것

극단적인 비정상성(좌측)/정상성(우측)을 띠는 대표적인 그래프


비정상성 시계열이 정상성 시계열이 된 모습

추세가 있던 비정상성 시계열이 로그 변환과 차분을 통해 정상성을 나타내는 것처럼 보이는 모습
위처럼 로그변환+1차차분을 계산했지만, 여전히 정상성이 보이지 않는 것 같아서(3번 그래프) 차분을 두 번 계산하여 정상성을 띠는 모습


2. 정상성 검증 - ADF Test와 KPSS Test

1. ADF Test (Augmented Dickey-Fuller Test)

2. KPSS Test

예제 연습

1111_statioanry_test

PACF, ACF TEST 이어서

Comments