LITTLE BY LITTLE

[4] ARIMA - 시계열 모형 추가 설명 / 정상성 검정 정리 본문

데이터 분석/시계열 데이터 분석

[4] ARIMA - 시계열 모형 추가 설명 / 정상성 검정 정리

위나 2023. 11. 29. 17:56

※ Review

더보기

1.

시계열 분석 모델 [단변량], hyper parameter p,d,q

2.

정상성의 개념, 정상성 검증 방법 ADF, KPSS Test

*ADF, KPSS Test = 단위근 테스트= 차분이 필요한지 객관적으로 결정하는 일반적인 방법

3.

직관적인 정상성 검증 방법 - ACF, PACF Plot

*ACF, PACF Plot = (부분)자기상관함수 = AR과 MA의 사용 여부 & p,q값을 정하는 데 도움 


시계열 모델 정리

 

정상성을 갖는 시계열에 적합한 모형 - AR, MA, ARMA 모형

AR모형
: 이름처럼, 자기상관성을 시계열 모형으로 구성
- 과거 관측값들의 선형결합으로 해당 변수의 미래 값을 예측하는 모델
- 이전 자신의 관측값이 이후 자기 관측값에 영향을 준다는 아이디어에 기반
- 미래의 예측 값은 평균으로 회귀하며 (평균모형이므로 당연) 현재 시점에서 멀어질 수록 예측 오차가 증가한다.
- PACF로 차수 결정

-> 만약, PACF그래프가 위와 같다면, 하나의 값까지 상관계수가 나와있기 때문에, AR(1)모형을 쓰면 됨!

MA모형
: 회귀에서 예측 변수의 과거 값 대신, 회귀처럼 보이는 모델에서 과거 예측 오차를 이용
 - 현재 시계열 데이터는 과거 잔차의 가중평균으로 구성된다는 모형인데, 잔차항은 백색 잡음이고, 백색 잡음은 정상성이 높고 평균회귀 특성이 있으므로, 이들의 합으로 구성된 MA모형도 평균회귀 특성이 존재 
 - ACF 로 차수 결정

 

-> 만약, ACF그래프가 위와 같다면, 하나의 값까지 상관계수가 나와있기 때문에 MA(1)모형을 쓰면 됨

 

정상성을 갖지 않는 시계열 - ARIMA 모형

: AR,MA는 평균으로 회귀하도록 예측하기에 예측력이 좋지 않음, 반면에 ARIMA는 추세쪽으로 회귀하도록 예측해서 예측력이 높은 것

- 예측 원리: 차분으로 추세를 제거하고, ARMA 모형으로 예측한 후 다시 추세를 삽입해서 원래 추세를 복원하는 방식

 

※ ARMA는 계절적 추세를 포착하지 못한다는 결함이 있다.
※ ARIMA도 데이터가 계절성을 거의 나타내지 않는다고 가정하긴 하나, 변형(SARIMA)은 비정상 데이터로 작업하고 일부 계절성을 포착할 수 있는 모델
 
그 밖의 인기 있는 시계열 예측 패키지로는
Prophet(비선형 추세가 일일/주간/연간 및 휴일 추세와 같은 계절성 효과일 때 적합)
DeepAR(반복 신경망을 사용하여 시계열 예측을 가능하게 하는 패키지,Amazon개발) 이 있다. 


정상성 검정 정리
로그 변환 & 차분 & 계절 차분

비정상 시계열

분산이 점점 증가 + 추세 존재 + 계절성이 존재하는 시계열
로그 변환 진행 

분산이 일정해진 모습

추세 제거를 위해 차분 진행

추세가 제거된 모습

계절성 제거를 위해 계절 차분 진행

계절성까지 모두 제거된 모습

 
위의 과정이 잘 처리되었는지 통계적으로 확인하기 위해서 ADF, KPSS Test로 검정


 

Comments