- 데이터 마이닝이란?
- 거대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾는 과정
- 데이터 마이닝의 6가지 기능
- 분류(Classification)
- 새롭게 나타난 현상을 검토하여 기존의 분류, 정의된 집합에 배정하는 것
- 분류기법은 의사결정나무(decision tree), memory-based reasoning 등이 있다.
- 추정(Estimation)
- 연속된 변수의 값을 추측하는데 사용
- 주어진 입력데이터를 사용하여 알려지지 않는 결과의 값을 추측
- 추정 기법으로는 신경망 모형이 있다.
- 예측(Prediction)
- 미래의 양상을 예상하거나 미래의 값을 추측한다는 것을 제외하면 분류나 추정과 동일한 의미를 가짐
- 입력 데이터의 성격에 따라 장바구니 분석, 의사결정나무, 신경망 등이 예측 기법으로 사용
- 연관분석(Association Analysis)
- '같이 팔리는 물건'같이 아이템의 연관성을 파악하는 분석
- 장바구니 분석
- 군집(Clustering)
- 미리 정의된 기준이나 예시에 의해서가 아닌, 데이터 자체의 유사성에 의해 그룹화
- 데이터 마이닝이나 모델링의 준비 단계로 주로 사용
- 기술(Description)
- 데이터가 가진 의미를 단순하게 정리하여 의미를 파악하는 것
- 데이터 마이닝의 5단계
- 목적 정의
- 데이터 마이닝 도입 목적을 명확히하는 단계
- 목적 설정이 모호하면 모델 개발이 불필요하므로, 1단계부터 전문가가 하는 것이 바람직
- 데이터 준비
- 데이터 마이닝 수행에 필요한 데이터를 수집하는 단계
- 데이터 정제를 통해 데이터의 품질을 보장하고, 필요하다면 보강 작업을 거쳐 데이터의 양을 충분히 확보
- 데이터 가공
- 데이터 마이닝 기법 적용이 가능하도록 데이터를 가공하는 과정
- 데이터 마이닝 기법 적용
- 앞 단계에서 준비한 데이터를 데이터 마이닝 소프트웨어를 활용하여 목적하는 정보를 추출
- 검증
- 테스트 마케팅이나 과거 데이터를 활용
댓글 없음:
댓글 쓰기