본문 바로가기
반응형

빅데이터 데이터 마이닝2

[빅데이터 10] 정형 데이터 마이닝 1. 분류(Classification) 분석 분류 (Classification) 데이터가 어느 그룹에 속하는지 예측하는 데에 사용하는 데이터 기법 군집화(clustering)와 유사하나, 분류는 각 계급이 어떻게 정의되는지 미리 알아야 함 (군집화와 가장 큰 차이) 분류 방법론 k 최근접 이웃 K-nearest Neighborhood : 인접한 k개의 이웃을 통하여 데이터가 소속되는 그룹을 결정 의사결정나무Decision Tree : 어떤 항목에 대한 관측값과 목표값을 연결시키기 위한 트리 구조를 결정 베이지안 정리Bayesian Theorem : 불확실성 하에서 분류 문제를 조건부 확률의 방법으로 해결하는 방법 인공 신경망Artificial Neural Networks : 생물학의 신경망에서 영감을 얻.. 2021. 10. 5.
[빅데이터 9] 데이터 마이닝 데이터 마이닝 데이터 마이닝 Data Mining - 대규모로 저장된 데이터 안에서 체계적이고 자동적인 통계적 규칙이나 패턴을 찾아내는 작업 - KDD (Knowledge-Discovery in Databases) - 빅데이터 시대의 의미 : 대규모 데이터로부터 의미를 찾아내는 데 있어 그 중요도가 급증 데이터 마이닝의 적용 분야 (이 외에도 많음) 분류classification : 일정한 집단에 대한 특정 정의를 통하여 분류 및 구분의 형태를 추론하는 분야 연관성association : 동시에 발생한 사건 간의 관계를 정의하는 분야 연속성sequencing : 특정 기간에 걸쳐 발생하는 관계를 규명, 연관성 분석과 달리 기간 특성을 고려 예측forecasting : 빅데이터 집합 내의 패턴을 기반으로 .. 2021. 9. 28.
728x90
반응형