Hyunwoo's DATA
기술 통계학과 검정-디키 풀러 테스트,AIC,BIC 본문
디키-풀러 테스트
디키풀러 테스트는 시계열 데이터가 정상성을 가지는지 확인할 때 사용하는 가설 검정이다.
귀무가설 검정을 사용해 p값을 반환하여 시계열이 정상인지 비정상인지 수치로 보여준다.
p값이 0.05보다 작으면 귀무가설을 기각하고 해당 데이터셋은 정상이라고 추정한다.
P-value는 -4.8082이고 귀무가설을 기각하지 못했으므로 데이터는 정상적임을 알 수 있다.
AIC(Akaike Information Criterion), BIC(Bayes Information Criterion)
AIC = -2log(likelihood) + 2p
BIC = -2log(likelihood) + plog(n)
p: 변수의 갯수, n: 데이터 갯수
AIC
모델들의 집합을 평가합니다. p,d,q값의 가중치나 순서를 비교할때 사용할 수 있다.
각 모델의 품질을 다른 모델과 비교하여 추정이 가능하다.
AIC의 중요한 점은 과적합을 최대한 방지하기 위해 변수가 몇개 사용되는지에 따라 패널티를 부여한다는 점이다.
아주 간단하지만 성능이 비교적 좋은 모델과 그보다는 성능이 약간 더 좋지만 엄청나게 복잡한 모델이 있을 수 있다.
AIC는 사소한 성능 향상을 위해 엄청나게 복잡한 모델을 사용하기 보다 약간 떨어져도 더 간단한 모델을 사용하는 것이 낫다고 말하는 것이다.
AIC는 여러 모델을 비교할 때 자주 사용된다.
BIC
BIC는 AIC와 매우 유사하지만 단지 베이즈 접근법으로 모델을 비교하는데 사용된다.
BIC의 경우 변수가 많을 수록 AIC보다 더 페널티를 가하는 성격을 가진다.(BIC의 우변 plog(n)에서 보통 n이 8이상이므로 log(8)>2가 된다. 따라서 AIC 우변 보다 변수 증가에 더 민감하다) 따라서 변수 갯수가 작은 것이 우선 순위라면 AIC보다 BIC를 참고하는게 좋다.
'데이터분석 > 시계열 분석' 카테고리의 다른 글
외생변수 (0) | 2023.12.18 |
---|---|
SARIMA-계절성 자기회귀 통합 이동평균 (0) | 2023.12.18 |
자기 상관 - ACF,PACF,정상성이란? (0) | 2023.12.08 |
회귀 모델 성능 평가 지표(MAE,MSE,RMSE) (1) | 2023.12.08 |
statsmodels를 이용한 시계열 자료 분석[2] 홀트-윈터스 계절성 기법 (0) | 2023.12.07 |