Overview

전부 수정, 대규모연산 week1 - Big Data Applications, ADsP p.75~

Big Data

: 디지털 환경에서 발생하는 대량의 모든 데이터

: 기존 DBMS로는 수집, 저장, 관리, 분석하기 어려운 데이터가 포함된다.

: 이를 활용하여 새로운 가치를 창출하거나 사회적 문제를 해결할 수 있다.

4V

3V + 1V

규모 (Volume) : 데이터의 방대한 양 (페타바이트, 제타바이트)

다양성 (Variety) : 데이터의 다양한 유형 (정형 데이터, 비정형 데이터, 반정형 데이터)

속도 (Velocity) : 데이터가 실시간으로 생성됨

가치 (Value) : 데이터로부터 추출되는 인사이트 또는 핵심 가치

빅데이터 분석 4단계 과정

묘사분석 : 어떤 일이 일어났는가?

진단분석 : 왜 일어났는가?

예측분석 : 무슨 일이 일어날 것인가?

처방분석 : 무엇을 할 것인가?