본문 바로가기
빅데이터

[빅데이터 8] 데이터 통계 분석 (회귀분석, 시계열 데이터)

by 밍굴뒹굴 2021. 9. 28.
반응형

 

2. 회귀분석

회귀분석 (regression analysis)

 - 회귀분석은 관찰된 연속형 변수들 간의 모형을 구한 뒤 적합도를 측정하는 분석 방법

 

 

회귀분석의 가정*

  • 오차항은 모든 독립변수에 대하여 동일 분산을 가짐
  • 오차항의 평균(기댓값)은 0이다.
  • 수집된 데이터의 확률 분포는 정규분포를 이룬다.
  • 독립변수 간에는 상관관계가 없어야 한다.
  • 시간에 따라 수집된 데이터는 잡음 영향이 없다.

 

회귀 분석의 예시

 

 


 

3. 시계열 데이터의 분석

 

시계열 데이터 (Time Series) : 일정 간격으로 배치된 데이터의 수열

 

시계열 해석(Time Series Analysis)이란? 시계열을 해석하고 이해하는 방법

시계열 예측(Time Series Prediction)이란? 시계열 데이터를 기반으로 수학적 모델을 구축하고, 미래에 발생하는 시계열의 형태를 예측하는 작업

 

 

시계열 데이터 분석

  • Autoregressive (AR) 모델

          자기상관성(autocorrelation) 정보에 기반

          어떠한 변인에 대하여 이전의 값이 이후의 값에 미치는 영향을 모델링

          예) 이전의 값이 감소하면 이후의 값 또한 감소

e(t)는 오류

  • Moving Average (MA) 모델

          어떤 변수의 평균값이 지속적으로 증가하거나 감소하는 경향에 대한 모델링

          예) 봄에서 여름이 되면 전기 수요가 대체로 증가

  • ARMA 모델

          기존의 AR 모델과 MA 모델을 통합하여 다양한 통합 모델이 도출될 수 있음

  • Integrated (I) 모델 -> 가장 강인하고 다양한 상황에서 사용 가능

          AR 모델, MA 모델 외에 통합 모델을 고려

          과거의 데이터 뿐만 아니라 추세(momentum)까지 반영한 모델

반응형

댓글