본문 바로가기
반응형

데이터 통계 분석2

[빅데이터 8] 데이터 통계 분석 (회귀분석, 시계열 데이터) 2. 회귀분석 회귀분석 (regression analysis) - 회귀분석은 관찰된 연속형 변수들 간의 모형을 구한 뒤 적합도를 측정하는 분석 방법 회귀분석의 가정* 오차항은 모든 독립변수에 대하여 동일 분산을 가짐 오차항의 평균(기댓값)은 0이다. 수집된 데이터의 확률 분포는 정규분포를 이룬다. 독립변수 간에는 상관관계가 없어야 한다. 시간에 따라 수집된 데이터는 잡음 영향이 없다. 3. 시계열 데이터의 분석 시계열 데이터 (Time Series) : 일정 간격으로 배치된 데이터의 수열 시계열 해석(Time Series Analysis)이란? 시계열을 해석하고 이해하는 방법 시계열 예측(Time Series Prediction)이란? 시계열 데이터를 기반으로 수학적 모델을 구축하고, 미래에 발생하는 시.. 2021. 9. 28.
[빅데이터 7] 데이터 통계 분석 (분산분석 / 상관분석) 1.분산분석과 상관분석 분산분석 (ANOVA = ANalysis Of VAriance) : 통계학에서 두 개 이상의 다수의 집단을 비교할 때 F분포를 이용하여 가설검정을 하는 방법 : 역사 - 통계학자 로날드 피셔 (R.A. Fisher)에 의해 1920년대 ~ 1930년대에 걸쳐 작성 F분포 : 분산의 비교를 통하여 얻어지는 분포 비율 : F = (군간변동) / (군내변동) : 특성 집단 간의 동질성을 가정하고 분석 군내변동이 크면 → 집단 간 평균차이 확인 어려움 분산 차이가 큰 경우 → 유발 원인 제거 필요 F분포의 가정 : 정규성, 분산의 동질성, 관찰의 동질성 가정 1. 정규성 가정 모집단에서 변인 Y는 정규분포를 따른다. 모집단에서 변인 Y의 평균은 다를 수 있다. 2. 분산의 동질성 가정 Y.. 2021. 9. 28.
728x90
반응형