본문 바로가기
반응형

빅데이터 분석4

R 프로그램 설치 & R Studio 설치 R 프로그램 설치 https://cran.r-project.org/ 이 링크를 들어가서 또는 cran이라고 검색 여기서 윈도우 or 맥 선택 여기서 R은 처음이라고 선택해주면 다운 시작! 그 뒤로 한국어로 설정하고 기타 바탕화면에 설치 등 무난한 설치 과정을 거쳐 이렇게 R설치 완료 R Studio 설치 https://www.rstudio.com/ R studio 검색 or 위 링크 타고 들어가서 이렇게 있는데 우리는 FREE인 왼쪽 오픈 소스 다운 주의할 점!! D에 설치해보니까 R Studio가 경로를 못 잡는다!! 강제로 잡아서 해봤는데 오류만 남,,, 따라서 그냥 설치경로는 건들지 말고 얌전히 C에 설치하자. 그럼 요렇게 실행 완료~~ 2021. 11. 3.
[빅데이터 7] 데이터 통계 분석 (분산분석 / 상관분석) 1.분산분석과 상관분석 분산분석 (ANOVA = ANalysis Of VAriance) : 통계학에서 두 개 이상의 다수의 집단을 비교할 때 F분포를 이용하여 가설검정을 하는 방법 : 역사 - 통계학자 로날드 피셔 (R.A. Fisher)에 의해 1920년대 ~ 1930년대에 걸쳐 작성 F분포 : 분산의 비교를 통하여 얻어지는 분포 비율 : F = (군간변동) / (군내변동) : 특성 집단 간의 동질성을 가정하고 분석 군내변동이 크면 → 집단 간 평균차이 확인 어려움 분산 차이가 큰 경우 → 유발 원인 제거 필요 F분포의 가정 : 정규성, 분산의 동질성, 관찰의 동질성 가정 1. 정규성 가정 모집단에서 변인 Y는 정규분포를 따른다. 모집단에서 변인 Y의 평균은 다를 수 있다. 2. 분산의 동질성 가정 Y.. 2021. 9. 28.
[빅데이터 6] 데이터 통계 분석 (확률/통계, 확률 분포, 모집단의 추정) 1. 확률과 통계이론 통계 (Statistics) : 표본을 통하여 모집단을 추정하기 위한 학문 빅데이터와 관계 표본(=데이터)을 수집하고 분석하는 고전 과정 빅데이터의 기반 학문 모집단Population : 정보를 얻고자 하는 목표 대상의 전체 집단 표본Sample : 모집단의 일부이며, 관찰하여 획득한 데이터 모집단과 표본의 관계 모집단은 전수조사를 통하여 파악 가능 ⇨ 비효율 표본을 통하여 모집단의 정보를 추정 데이터의 유형 수치 데이터Numerical Data : 측정하여 숫자의 형태로 획득한 데이터 예) 키, 몸무게, 온습도, 물품의 가격 범주 데이터Categorical Data : 데이터의 범주(category)를 사전에 정의하고, 데이터의 특성을 범주에 따라 분류한 데이터 예) 남녀 성별, .. 2021. 9. 28.
[빅데이터 5] 빅데이터 분석 도구 R 문법 2. 연산자 산술 연산자 (Arithmetic Operators) : 덧셈, 뺼셈, 곱셈, 나눗셈 등의 사칙연산과 지수 연산 등을 수행 관계 연산자 (Relational Operators) : 관계 연산자는 의사결정문에서 주로 쓰이는 연산자 논리 연산자 (Logical Operators) : R의 객체 내부의 각 성분별 비교 연산을 수행하고, 그에 따른 결과를 반환하는 연산자 대입(할당) 연산자 (Assignment Operators) : 변수와 변수, 혹은 상수와 변수 사이에 값을 대입 또는 할당을 위한 연산자 기타 연산자 (Miscellaneous Operators) : R에서 벡터를 생성하거나 성분의 존재 여부를 검증할 때 활용하는 연산자 1. 의사결정 구조 의사결정 구조의 용도 if문 : 조건이 .. 2021. 9. 27.
728x90
반응형