2018년 7월 28일 토요일

ADsP : 과목III. 데이터 분석 - 데이터마이닝 개요


  1. 데이터 마이닝이란?
    1. 거대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾는 과정

  1. 데이터 마이닝의 6가지 기능
    1. 분류(Classification)
    • 새롭게 나타난 현상을 검토하여 기존의 분류, 정의된 집합에 배정하는
    • 분류기법은 의사결정나무(decision tree), memory-based reasoning 등이 있다.

    1. 추정(Estimation)
    • 연속된 변수의 값을 추측하는데 사용
    • 주어진 입력데이터를 사용하여 알려지지 않는 결과의 값을 추측
    • 추정 기법으로는 신경망 모형이 있다.

    1. 예측(Prediction)
    • 미래의 양상을 예상하거나 미래의 값을 추측한다는 것을 제외하면 분류나 추정과 동일한 의미를 가짐
    • 입력 데이터의 성격에 따라 장바구니 분석, 의사결정나무, 신경망 등이 예측 기법으로 사용

    1. 연관분석(Association Analysis)
    • '같이 팔리는 물건'같이 아이템의 연관성을 파악하는 분석
    • 장바구니 분석

    1. 군집(Clustering)
    • 미리 정의된 기준이나 예시에 의해서가 아닌, 데이터 자체의 유사성에 의해 그룹화
    • 데이터 마이닝이나 모델링의 준비 단계로 주로 사용

    1. 기술(Description)
    • 데이터가 가진 의미를 단순하게 정리하여 의미를 파악하는


  1. 데이터 마이닝의 5단계
    1. 목적 정의
    • 데이터 마이닝 도입 목적을 명확히하는 단계
    • 목적 설정이 모호하면 모델 개발이 불필요하므로, 1단계부터 전문가가 하는 것이 바람직

    1. 데이터 준비
    • 데이터 마이닝 수행에 필요한 데이터를 수집하는 단계
    • 데이터 정제를 통해 데이터의 품질을 보장하고, 필요하다면 보강 작업을 거쳐 데이터의 양을 충분히 확보

    1. 데이터 가공
    • 데이터 마이닝 기법 적용이 가능하도록 데이터를 가공하는 과정

    1. 데이터 마이닝 기법 적용
    • 단계에서 준비한 데이터를 데이터 마이닝 소프트웨어를 활용하여 목적하는 정보를 추출

    1. 검증
    • 테스트 마케팅이나 과거 데이터를 활용

댓글 없음:

댓글 쓰기

18회 ADsP 합격 후기

ADP도 아니고, 겨우 ADsP인데 무척 힘들게 공부했는데ㅜㅜ 결과적으로는 좋은 결과가 나와서 행복하네요! 꽤나 아슬아슬하게 합격해서 창피하긴합니다만ㅋ 합격하면 된거지 뭐 라고 생각하려구요! 언제가 될지는 모르겠습니다만, ADP도 ...