전부 수정
김두룡 교수님 교양에서 배운 내용 정리함
데이터 사이언스란?
: 데이터를 분석하고 해석하여 의미있는 정보와 통찰력을 찾아 문제를 해결하는 학문
: 데이터에서 패턴(가치)를 찾는 것
: 답을 얻을 수 있는 상관관계를 알아내는 것(핵심 가치 도출)
: 정형, 비정형, 반정형 데이터 등 모든 데이터를 대상으로 한다.
: 효과적으로 구현하고 전달(시각화)하는 과정까지
수학/통계학, 컴퓨터 과학, 도메인 지식 결합
데이터사이언스 프로젝트 4단계
데이터 수집 - 데이터 저장 및 처리 - 데이터 분석 - 전달(보고서, 시각화 등)
데이터 사이언티스트
: 데이터를 수집, 정리, 분석하고 그 결과를 시각화하며 의사결정에 활용할 수 있는 모델을 개발하거나 모델 성능을 개선하는 직업