- 시계열 예측이란?
- 시계열 자료(시간의 흐름에 따라 기록된 자료)를 분석하는 것
- 일정 시점에 조사된 데이터는 횡단(cross-sectional) 자료라고 한다.
- 소비자물가지수 등
- 시계열 예측의 목적
- 미래의 값을 예측하는 것
- 향후 일주일간 주가예측
- 시계열 데이터의 특성을 파악하는 것
- 경향(trend), 주기(cycle), 계절성(seasonality), 불규칙성(irregular) 등
- 정상성(Stationary)
- 정상성이란?
- 시계열의 수준과 분산에 체계적인 변화가 없고, 엄밀하게 주기적 변동이 없다는 것.
- 미래는 확률적으로 과거와 동일하다는 것을 의미
- 시계열 분석을 위해서는 정상성을 만족해야 한다.
- 정상시계열의 조건
- 평균값은 시간 t에 관계없이 일정하다.
- 분산겂은 시간 t에 관계없이 일정하다.
- 공분산은 시간 t에 의존하지 않고 오직 시차에만 의존한다.
- 위 세가지 조건 중 하나라도 만족하지 못하는 경우를 비정상시계열이라고 한다. 대부분의 시계열 자료는 비정상시계열 자료이다.
- 비정상시계열을 정상시계열로 전환시키는 방법
- 시계열 자료의 평균이 일정하지 않은 경우, 원시계열에 차분을 하면 정상시계열이 된다.
- 차분 : 현재 시점에서 바로 전 시점의 자료값을 빼는 것
- 계절성을 갖는 비정상시계열은 계절차분을 사용한다.
- 분산이 일정하지 않은 경우에는 원시계열에 변한을 하면 정상시계열이 된다.
- 변환 : 자연로그를 취하는 것
- 시계열 모형
- 자기회귀 모형(AR, AutoRegressive)
- 현시점의 시계열자료에 몇 번째 전 자료까지 영향을 주는지 알아내는 것
- AR(1) 모형은 현시점의 시계열 자료에 과거 1시점 이전의 자료만 영향을 주는 것
- 이동평균 모형(MA, Moving Average)
- 최근 데이터의 평균(혹은 중앙치)를 예측치로 사용하는 방법
- 각 과거치에는 동일한 가중치가 주어짐
- 이동평균 모형은 현시점의 자료를 유한개의 백색잡음의 선형결합으로 표현되었기 때문에 항상 정상성을 만족한다.
- 자기회귀누적이동 모형(ARIMA, AutoRegressive Integrated Moving Average)
- 대부분의 시계열 자료가 자기회귀누적이동평균 모형
- 차분이나 변환을 통해 AR, MA, ARMA 모형으로 정상화 가능
- ARIMA(p, d, q) 모형
- 차수 p는 AR모형과 관련, 과거시점의 관측자료의 선형결합으로 표현되는 것이 AR
- 차수 q는 MA모형과 관련, 과거시점의 백색잡음 선형결합으로 표현하는 것이 MA
- 차수 d는 ARIMA에서 ARMA로 정상화할때 몇번 차분했는지 의미. d=0이면 ARMA(p, q)모형. AR과 MA를 합친것이 ARMA
- 자기회귀이동평균 모형(ARMA, AutoRegressive Moving Average) 식별
- 로그변환과 차분을 통해 정상성과 더불어 계절변동성을 제거한 후
- 편자기상관함수(PACF, Partial Autocorrelation Function), 자기상관함수(ACF, Auto Correlation Function)를 도식화하고
- 이를 통해 자기회귀이동평균 차수를 선정.
AR
|
MA
|
ARMA
|
|
자기상관함수
ACF
|
지수적 감소
|
q+1차항부터 절단 모양
|
q+1차항부터 지수적 감소
|
편자기상관함수
PACF
|
p+1차항부터 절단 모양
|
지수적 감소
|
p+1차항부터 지수적 감소
|
- 분해시계열
- 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법
- 추세요인(Trend factor) : 자료가 어떤 특정한 형태를 취하는 것
- 계절요인(Seasonal factor) : 계절에 따라 고정된 주기에 따라 자료가 변하는 경우
- 순환요인(Cyclical factor) : 알려지지 않은 주기를 가지고 자료가 변하는 경우
- 불규칙요인(Irregular factor) : 위 세가지 요인으로 설명할 수 없는 오차
댓글 없음:
댓글 쓰기