일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- ImageDateGenerator
- ARIMA
- 캐글 신용카드 사기 검출
- pmdarima
- DENSE_RANK()
- 데이터 정합성
- 컨브넷
- 그로스 마케팅
- Growth hacking
- 마케팅 보다는 취준 강연 같다(?)
- WITH CUBE
- lightgbm
- 스태킹 앙상블
- WITH ROLLUP
- 데이터 증식
- 로그 변환
- 분석 패널
- 부트 스트래핑
- python
- 그로스 해킹
- 인프런
- 리프 중심 트리 분할
- splitlines
- sql
- tableau
- 데이터 핸들링
- XGBoost
- 그룹 연산
- 캐글 산탄데르 고객 만족 예측
- 3기가 마지막이라니..!
- Today
- Total
LITTLE BY LITTLE
[4] ARIMA - 시계열 모형 추가 설명 / 정상성 검정 정리 본문
※ Review
1.
시계열 분석 모델 [단변량], hyper parameter p,d,q
2.
정상성의 개념, 정상성 검증 방법 ADF, KPSS Test
*ADF, KPSS Test = 단위근 테스트= 차분이 필요한지 객관적으로 결정하는 일반적인 방법
3.
직관적인 정상성 검증 방법 - ACF, PACF Plot
*ACF, PACF Plot = (부분)자기상관함수 = AR과 MA의 사용 여부 & p,q값을 정하는 데 도움
시계열 모델 정리
정상성을 갖는 시계열에 적합한 모형 - AR, MA, ARMA 모형
AR모형
: 이름처럼, 자기상관성을 시계열 모형으로 구성
- 과거 관측값들의 선형결합으로 해당 변수의 미래 값을 예측하는 모델
- 이전 자신의 관측값이 이후 자기 관측값에 영향을 준다는 아이디어에 기반
- 미래의 예측 값은 평균으로 회귀하며 (평균모형이므로 당연) 현재 시점에서 멀어질 수록 예측 오차가 증가한다.
- PACF로 차수 결정
-> 만약, PACF그래프가 위와 같다면, 하나의 값까지 상관계수가 나와있기 때문에, AR(1)모형을 쓰면 됨!
MA모형
: 회귀에서 예측 변수의 과거 값 대신, 회귀처럼 보이는 모델에서 과거 예측 오차를 이용
- 현재 시계열 데이터는 과거 잔차의 가중평균으로 구성된다는 모형인데, 잔차항은 백색 잡음이고, 백색 잡음은 정상성이 높고 평균회귀 특성이 있으므로, 이들의 합으로 구성된 MA모형도 평균회귀 특성이 존재
- ACF 로 차수 결정
-> 만약, ACF그래프가 위와 같다면, 하나의 값까지 상관계수가 나와있기 때문에 MA(1)모형을 쓰면 됨
정상성을 갖지 않는 시계열 - ARIMA 모형
: AR,MA는 평균으로 회귀하도록 예측하기에 예측력이 좋지 않음, 반면에 ARIMA는 추세쪽으로 회귀하도록 예측해서 예측력이 높은 것
- 예측 원리: 차분으로 추세를 제거하고, ARMA 모형으로 예측한 후 다시 추세를 삽입해서 원래 추세를 복원하는 방식
※ ARMA는 계절적 추세를 포착하지 못한다는 결함이 있다.
※ ARIMA도 데이터가 계절성을 거의 나타내지 않는다고 가정하긴 하나, 변형(SARIMA)은 비정상 데이터로 작업하고 일부 계절성을 포착할 수 있는 모델
그 밖의 인기 있는 시계열 예측 패키지로는
Prophet(비선형 추세가 일일/주간/연간 및 휴일 추세와 같은 계절성 효과일 때 적합)
DeepAR(반복 신경망을 사용하여 시계열 예측을 가능하게 하는 패키지,Amazon개발) 이 있다.
정상성 검정 정리
로그 변환 & 차분 & 계절 차분
분산이 점점 증가 + 추세 존재 + 계절성이 존재하는 시계열
로그 변환 진행
추세 제거를 위해 차분 진행
계절성 제거를 위해 계절 차분 진행
→ 위의 과정이 잘 처리되었는지 통계적으로 확인하기 위해서 ADF, KPSS Test로 검정
'데이터 분석 > 시계열 데이터 분석' 카테고리의 다른 글
[5] ARIMA - auto_arima를 활용한 예제 실습 (0) | 2023.12.11 |
---|---|
[1] 시계열 군집 분석 - 계층적 군집화의 개념과 종류 (1) | 2023.11.24 |
[3] ARIMA - 직관적인 정상성 검정 방법 ACF/PACF Plot, 차분 (0) | 2023.11.13 |
[2] ARIMA - 시계열 데이터, 정상성, 검정 방법(ADF/KPSS) (0) | 2023.11.11 |
[1] ARIMA - 시계열 모델의 개념 (0) | 2023.11.08 |