Hyunwoo's DATA
벡터 자기회귀 모델 본문
벡터 자기회귀 모델(VAR)
지금까지 다룬 모델들은 단 방향 관계만 있다는 것입니다.
SARIMAX 예시에서 예상변수 Y_t가 외생 예측변수의 영향은 받았지만, 반대의 경우는 적용되지 않았습니다.
하지만 변수가 쌍방향으로 영향을 주는 경우가 존재합니다.
VAR은 이러한 다변량 예측에 사용됩니다. VAR의 시계열 변수는 서로 영향을 주며 이를 고려해 각 변수의 미래값을 전체 시계열 변수의 과거값으로부터 예측하므로 양방향 모델입니다.
방적식은 위와 같습니다.
y1t는 변수 y1의 t번째 관측값을 뜻합니다.
e1,t 와 e2,t은 동시에 상관관계를 가질 수 있는 백색 잡음 과정입니다. 계수ℓ는 yi에 대한 변수 yi의 ℓ번째 시차의 영향을 잡아내고, 계수 ℓ는 변수 의 ℓ번째 시차의 영향을 잡아냅니다.
모델링한 시계열이 정상성을 나타내면 VAR로 직접 데이터를 맞춰서 예측합니다. 정상성이 나타나지않으면 차분을 구하고 VAR 모델을 맞춥니다. 두 경우 모두, 최소 제곱 원리(least square principle)를 이용하는 식으로 모델을 추정합니다.
p 값 구하기
AIC를 정보량 규준으로 사용합니다. AIC는 또한 지나친 복잡성에 대한 처벌 모델인데 다른 복잡성을 비교하는 데 좋은 평가 기준이 됩니다.
for 반복문을 통해 AIC값의 하락을 확인하고 가장 낮은 AIC를 찾아 P값을 구합니다.
다음 단계는 데이터프레임이 아닌 Numpy배열이여야합니다.
Numpy 배열은 p xk 차원으로 표시되어야하는데 p는 시차로 위 과정을 통해서 구했습니다.
k는 시계열 항을 의미하는데 해당 데이터 셋에서 k는 2입니다. 따라서 5 x 2의 넘파이 배열이 필요합니다.
이를 데이터프레임으로 다시 변형하는 과정을 가집니다.
이를 통해 예측값을 pandas 데이터프레임을 보기 좋게 확인할 수 있습니다.
참고
https://otexts.com/fppkr/VAR.html
'데이터분석 > 시계열 분석' 카테고리의 다른 글
prophet 예측 라이브러리 (0) | 2023.12.19 |
---|---|
외생변수 (0) | 2023.12.18 |
SARIMA-계절성 자기회귀 통합 이동평균 (0) | 2023.12.18 |
기술 통계학과 검정-디키 풀러 테스트,AIC,BIC (0) | 2023.12.12 |
자기 상관 - ACF,PACF,정상성이란? (0) | 2023.12.08 |