Overview
Sampling은 통계학 또는 데이터 분석에서 매우 중요한 절차이며, 표본을 선택하는 방법과 모집단의 크기에 따라 추출 과정의 독립성 여부가 달라진다.
Sampling
Sampling이란 population(모집단) 전체를 조사하지 않고, 그 중 일부를 뽑아 이를 분석하고 모집단의 특성을 추론하는 방법이다.
- Population(모집단): 조사 또는 연구의 대상이 되는 전체 관측치의 집합
- 모집단의 크기 $N$: Finite(유한) or Infinite(무한)
- Sample(표본): 모집단에서 일부를 추출하여 얻은 관측치의 집합
- 표본의 크기 $n$: 기본적으로 $n < N$
목적
- 효율성: 모집단 전체를 조사하는 데 드는 시간과 비용을 절감
- 실용성: 전체 데이터 수집이 불가능하거나 비현실적일 때 대안을 제공
- 추론 가능성: 표본에서 얻은 결과를 바탕으로 모집단의 특성을 통계적으로 추정
Probability Sampling
Probability Sampling(확률표본추출)은 모집단의 각 요소가 동등하거나 알려진 확률로 선택되는 방법이다.
- Simple Random Sampling(단순랜덤추출법): 모집단의 개체가 동일한 확률로 무작위로 선택
- Systematic Sampling(계통추출법): 일정한 간격을 기준으로 표본을 선택
- Stratified Sampling(층화추출법): 모집단을 층으로 나눈 뒤 각 층에서 비율에 맞게 표본을 선택
- Cluster Sampling(집락추출법): 모집단을 여러 군집으로 나누고, 그 군집을 무작위로 선택
Non-probability Sampling
Non-probability Sampling(비확률표본추출)은 연구자의 판단, 편의, 접근성 등에 따라 표본을 선택하는 방법으로, 빠르지만 대표성이 떨어질 수 있다.
- Convenience Sampling(편의 추출법): 접근하기 쉬운 집단에서 표본을 선택
- Judgment Sampling(판단 추출법): 연구자 개인의 전문성을 근거로 직접 표본을 선택