관리 메뉴

Hyunwoo's DATA

기술 통계학과 검정-디키 풀러 테스트,AIC,BIC 본문

데이터분석/시계열 분석

기술 통계학과 검정-디키 풀러 테스트,AIC,BIC

꿈꾸는 데이터분석가 2023. 12. 12. 11:44

디키-풀러 테스트

디키풀러 테스트는 시계열 데이터가 정상성을 가지는지 확인할 때 사용하는 가설 검정이다.

귀무가설 검정을 사용해 p값을 반환하여 시계열이 정상인지 비정상인지 수치로 보여준다.

p값이 0.05보다 작으면 귀무가설을 기각하고 해당 데이터셋은 정상이라고 추정한다.

 

P-value는 -4.8082이고 귀무가설을 기각하지 못했으므로 데이터는 정상적임을 알 수 있다.

 

 

AIC(Akaike Information Criterion), BIC(Bayes Information Criterion)

 

AIC = -2log(likelihood) + 2p

BIC = -2log(likelihood) + plog(n)

p: 변수의 갯수, n: 데이터 갯수

 

AIC

모델들의 집합을 평가합니다. p,d,q값의 가중치나 순서를 비교할때 사용할 수 있다.

각 모델의 품질을 다른 모델과 비교하여 추정이 가능하다.

AIC의 중요한 점은 과적합을 최대한 방지하기 위해 변수가 몇개 사용되는지에 따라 패널티를 부여한다는 점이다.

아주 간단하지만 성능이 비교적 좋은 모델과 그보다는 성능이 약간 더 좋지만 엄청나게 복잡한 모델이 있을 수 있다.

AIC는 사소한 성능 향상을 위해 엄청나게 복잡한 모델을 사용하기 보다 약간 떨어져도 더 간단한 모델을 사용하는 것이 낫다고 말하는 것이다.

AIC는 여러 모델을 비교할 때 자주 사용된다.

 

BIC

BIC는 AIC와 매우 유사하지만 단지 베이즈 접근법으로 모델을 비교하는데 사용된다.

BIC의 경우 변수가 많을 수록 AIC보다 더 페널티를 가하는 성격을 가진다.(BIC의 우변 plog(n)에서 보통 n이 8이상이므로 log(8)>2가 된다. 따라서 AIC 우변 보다 변수 증가에 더 민감하다) 따라서 변수 갯수가 작은 것이 우선 순위라면 AIC보다 BIC를 참고하는게 좋다.