목록데이터분석/시계열 분석 (9)
Hyunwoo's DATA

MAE(Mean absolute Error) 평균 절대 오차 모든 오차의 절대값에 대한 평균값이기 때문에 간단하고 이해하고 쉽지만 몇몇 지점에서만 실제 값과 꽤 차이 나는 경우 활용하기 어려울 수 있다. 장점 간단하고 이해가 쉽다 정답 및 예측 값과 같은 단위 단점 실제 정답 보다 낮게 예측해는지 높게 했는지 파악하기 힘듬 스케일 의존적임. 모델마다 에러 크기가 동일해도 에러율을 동일하지 않음 MSE(Mean Squared Error 정답과 예측값의 차이를 제곱하기 때문에 이상치에 민감하다 제곱하기 때문에 1미만의 에러는 작아지고 그 이상의 에러는 커짐 제곱된 값을 해석하기 어려움 RMSE(Root MEan Squared Error)평균 제곱 오차 MSE값에 루트를 처리한 것 MSE의 단점이 해결된다. ..

이전 글의 EWMA는 계절성이나 전반적인 추세 등을 제대로 고려하지는 못하는 문제점이 있다. 지수 평활을 할 때 하나의 매개변수 만을 사용하기 때문이다. 홀트 윈터스 계절성 기법 경제학자였던 홀트는 1957년 이중 지수 평활법은 고안해냈고 이어서 1960년 윈터스가 계절성을 포착할 수 있도록 이 기법을 확장되었습니다. 따라서 홀트 윈터스 계절성 기법이라 부르게 되었습니다. 이 기법은 예측식 과 세개의 평활식으로 구성되어있습니다. 하나는 수평 성분 𝑙𝑡 에 대한 것, 하나는 추세 성분 𝑏𝑡 에 대한 것, 하나는 계절 성분 st에 대한 것으로 이루어져 있고 이 세 식은 각각에 대응하는 알파,베타, 감마 베타를 갖습니다. 덧셈 모형과 곱셉 모형이 존재합니다 덧셈 모형 곱셈모형 .덧셈은 전체 데이터가 일정폭으로..

시계열 데이터의 특징 추세(Trend) - 데이터가 장기적으로 증가하거나 하락하는 흐름, 선형,지수형 추세가 있다. 계절성 - 1년, 혹은 일정 기간 안에 반복적으로 나타나는 패턴 주기성 - 정해지지 않은 빈도,기간으로 일어나는 상승이나 하락 파이썬 statsmodels를 이용한 시계열 자료 분석 추세변동 추출 hpfilter 호드릭-프레스콧 필터는 거시경제 시계열 데이터에서 장기적인 추세 (Trend Component)와 단기적인 순환(Cyclical Component)을 기술적으로 분리하는 기법이다. 구체적으로 HP 필터는 시계열(𝑦𝑡 ) 데이터를, 추세(𝜏𝑡 )와 추세 주변의 변동(𝑐𝑡 ) 및 오차항(𝑒𝑡 )으로 분리하여 추세 정보를 뽑아낸다. 𝑦𝑡 = 𝜏𝑡 + 𝑐𝑡 + + 𝑒 𝑡 라 가정하고 어떤..