관리 메뉴

Hyunwoo's DATA

외생변수 본문

데이터분석/시계열 분석

외생변수

꿈꾸는 데이터분석가 2023. 12. 18. 13:17

외생변수란?

연구이 대상이 되는 현상과 관련된 실험변수와 결과변수 이외의 기타변수들로써, 결과변수에 영향을 미칠 수 있는 변수들

식당에 과거에 방문자 수를 가지고 미래의 예측하려할 떄 휴일 여부가 해당한다.

 

 

SARMAX에 외생 변수 적용

 

 

다음은 레스토랑 방문자 수에 대한 데이터이다 4개의 레스토랑과 총합 방문자수 그리고 주말 휴일 데이터를 반출한다.

 

다음 데이터를 플롯팅하면 위와 같이 약간의 계절성을 보인다.

ETS분해를 통해 계절성이 있음을 확인할 수 있다.

 

SARIMA와 같은 방식으로 최적의 모델을 찾고 모델을 fit할때 외생변수를 exog = []로 넣어준다.

 

 

 

데이터를 예측할때도 외생변수를 넣어준다.

플롯팅한 결과

 

결과적으로 외생변수를 넣기전 RMSE 에러는 41에서 30으로 줄어들었다.

 

모델을 리트레인하고 미래를 예측할때도 위와 같이 exog항을 모델과 예측에 넣어주면 더 정확한 값을 찾을 수 있게된다.