관리 메뉴

Hyunwoo's DATA

SARIMA-계절성 자기회귀 통합 이동평균 본문

데이터분석/시계열 분석

SARIMA-계절성 자기회귀 통합 이동평균

꿈꾸는 데이터분석가 2023. 12. 18. 09:56

sarima는 (p,d,q)m 매개변수의 영향을 받는다

여기서 p,d,q항은 계절적 회귀,차분,이동평균 계수를 나타내고 m은 각 계절적 사이클에 잇는 데이터 포인트,즉 행의 계소룰 나타낸다. 월간 데이터와 연간 계절성 사이클이 있다면 m은 12가 될 것이다.

 

SARIMA의 구현물을 SARIMAX라고 불리는데 이름에 포함된 X는 외생적 회귀변수도 지원한다는 것을 의미한다.

 

 

불러온 시계열 데이터셋은 눈으로봐도 일반적인 계절성과 상승추이를 보인다.

 

ETS분해시 더 확실한 계절성을 확인할 수 있다.

 

auto_arima를 통해 최적의 모델을 찾는다.

 

train,test 데이터를 설정하고 최적의 모델을 fit해준다.

테스트 데이터셋 범위에 대한 예측값을 플롯팅해본다.

MSE값의 0.128로 값에 비해 굉장히 적기때문에 데이터와 목표가 상당히 일치하는 것을 알수 있다.

 

 

미래 값에 대한 예측