2018년 7월 22일 일요일

ADsP : 과목III. 데이터 분석 - 시계열 예측


  1. 시계열 예측이란?
    1. 시계열 자료(시간의 흐름에 따라 기록된 자료) 분석하는
    • 일정 시점에 조사된 데이터는 횡단(cross-sectional) 자료라고 한다.
    • 소비자물가지수

    1. 시계열 예측의 목적
    • 미래의 값을 예측하는
      • 향후 일주일간 주가예측
    • 시계열 데이터의 특성을 파악하는
      • 경향(trend), 주기(cycle), 계절성(seasonality), 불규칙성(irregular)


  1. 정상성(Stationary)
    1. 정상성이란?
    • 시계열의 수준과 분산에 체계적인 변화가 없고, 엄밀하게 주기적 변동이 없다는 .
    • 미래는 확률적으로 과거와 동일하다는 것을 의미
    • 시계열 분석을 위해서는 정상성을 만족해야 한다.

    1. 정상시계열의 조건
    • 평균값은 시간 t 관계없이 일정하다.
    • 분산겂은 시간 t 관계없이 일정하다.
    • 공분산은 시간 t 의존하지 않고 오직 시차에만 의존한다.
    • 세가지 조건 하나라도 만족하지 못하는 경우를 비정상시계열이라고 한다. 대부분의 시계열 자료는 비정상시계열 자료이다.


  1. 비정상시계열을 정상시계열로 전환시키는 방법
    1. 시계열 자료의 평균이 일정하지 않은 경우, 원시계열에 차분을 하면 정상시계열이 된다.
    • 차분 : 현재 시점에서 바로 시점의 자료값을 빼는

    1. 계절성을 갖는 비정상시계열은 계절차분을 사용한다.
    2. 분산이 일정하지 않은 경우에는 원시계열에 변한을 하면 정상시계열이 된다.
    • 변환 : 자연로그를 취하는


  1. 시계열 모형
    1. 자기회귀 모형(AR, AutoRegressive)
    • 현시점의 시계열자료에 번째 자료까지 영향을 주는지 알아내는
    • AR(1) 모형은 현시점의 시계열 자료에 과거 1시점 이전의 자료만 영향을 주는

    1. 이동평균 모형(MA, Moving Average)
    • 최근 데이터의 평균(혹은 중앙치) 예측치로 사용하는 방법
    • 과거치에는 동일한 가중치가 주어짐
    • 이동평균 모형은 현시점의 자료를 유한개의 백색잡음의 선형결합으로 표현되었기 때문에 항상 정상성을 만족한다.

    1. 자기회귀누적이동 모형(ARIMA, AutoRegressive Integrated Moving Average)
    • 대부분의 시계열 자료가 자기회귀누적이동평균 모형
    • 차분이나 변환을 통해 AR, MA, ARMA 모형으로 정상화 가능
    • ARIMA(p, d, q) 모형
      • 차수 p AR모형과 관련, 과거시점의 관측자료의 선형결합으로 표현되는 것이 AR
      • 차수 q MA모형과 관련, 과거시점의 백색잡음 선형결합으로 표현하는 것이 MA
      • 차수 d ARIMA에서 ARMA 정상화할때 몇번 차분했는지 의미. d=0이면 ARMA(p, q)모형. AR MA 합친것이 ARMA

    1. 자기회귀이동평균 모형(ARMA, AutoRegressive Moving Average) 식별
    • 로그변환과 차분을 통해 정상성과 더불어 계절변동성을 제거한
    • 편자기상관함수(PACF, Partial Autocorrelation Function), 자기상관함수(ACF, Auto Correlation Function) 도식화하고
    • 이를 통해 자기회귀이동평균 차수를 선정.

AR
MA
ARMA
자기상관함수
ACF
지수적 감소
q+1차항부터 절단 모양
q+1차항부터 지수적 감소
편자기상관함수
PACF
p+1차항부터 절단 모양
지수적 감소
p+1차항부터 지수적 감소


  1. 분해시계열
  • 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법
  • 추세요인(Trend factor) : 자료가 어떤 특정한 형태를 취하는
  • 계절요인(Seasonal factor) : 계절에 따라 고정된 주기에 따라 자료가 변하는 경우
  • 순환요인(Cyclical factor) : 알려지지 않은 주기를 가지고 자료가 변하는 경우
  • 불규칙요인(Irregular factor) : 세가지 요인으로 설명할 없는 오차

댓글 없음:

댓글 쓰기

18회 ADsP 합격 후기

ADP도 아니고, 겨우 ADsP인데 무척 힘들게 공부했는데ㅜㅜ 결과적으로는 좋은 결과가 나와서 행복하네요! 꽤나 아슬아슬하게 합격해서 창피하긴합니다만ㅋ 합격하면 된거지 뭐 라고 생각하려구요! 언제가 될지는 모르겠습니다만, ADP도 ...