모집단을 층으로 나눠고 각 층별로 단순 무작위 추출법을 적용하여 표집 확률표본추출 방법이다.

https://whatilearned.tistory.com/57?category=922487


층으로 나눈다?

모집단이라 하더라도 다 똑같은 애들로 구성되어 있진 않다.

하다못해 중고등학교에서도 학교마다 그리고 반마다 다 다르다는 걸 알 수 있다.

층으로 나눈다는 것은 이러한 모집단을 서로 상이한 소집단으로 나눈다는 것이다. 그리고 이런 소집단에서 각각 무작위로 추출하는 것이다.

그리고 일정 기준에 따라 분류하고 분류별로 표본을 추출한다는 점에서 할당 표본추출방법과 유사하다.

아무튼 층화란 쉽게 말해 끼리끼리 묶는 것이다.


왜?

기본 논리는

모집단이 동질적이라면, 이질적인 경우보다 표본오차가 더 적은 표본을 추출할 수 있다는 것이다.

모집단의 다양성을 다 반영하려면 그만큼 표본의 크기를 키워야 한다. 누가 나올 지 모르기 때문이다.

그러나 끼리끼리 묶어놓고 이 속에서 추출한다면 적게 뽑아도 집단의 특성을 충분하게 반영할 수 있다.

따라서 이를 통해 추정값의 오차를 감소시킬 수 있다. 그리고 이는 곧 표본의 대표성 향상으로 이어진다.


따라서 장점은

표본의 수를 줄이더라도 대표성을 확보할 수 있다.

표본의 무작위성을 확보하면서 불필요한 분산을 줄일 수 있다는 점이다.

표본의 크기가 같을 때 표집오차가 가장 적은 표집방법이다.


단점은 

모집단의 각 층을 정확히 알고 있어야 한다.

끼리끼리 묶어야 하는데 걔들이 어떤 특성을 갖고 있는지 알고 있어야 묶지 않겠는가?

또한 위 작업을 거쳐야 하기에 비용과 시간이 많이 들 수 있다.


층마다 표본을 배분하는 방법은

  • 균등배분법

"모집단 전체/층의 수"로 표본을 층마다 동일하게 배분한다.

  • 비례배분법

층의 크기에 비례하여 배분한다. 모집단A에서 소집단 a가 차지하는 비율이 50%이면 표본에도 50%할당하는 것이다.

  • 최적배분법

층별 표본추출 비용을 반영해 추정치의 분산이 최소화되게 배분한다.

  • 네이만 배분법

층마다 표본 추출비용이 동일할 경우.

동질적인 집단에는 비교적 적게, 이질적인 집단에는 보다 많은 표본을 추출하여 최소 규모로 정확성을 유지되게 한다. 

  • 데밍 배분법:

층마다 조사비용이 상이할 경우, 분산 최소화되게 배분한다.

등이 있다.


이렇게 각 층에서 뽑은 표본의 크기에 따라

  • 비례 층화 표본추출

각 층에 속하는 모집단의 크기에 비례해 각 층에 속하는 표본의 크기를 결정한다.

  • 비비례 층화 표본추출

그러나 비례 층화 표본추출을 실시할 경우 전체 모집단에서 차지하는 비율이 작은 소집단을 조사하는데 한계가 있을 수 있다. 예를 들어 크기가 매우 작을 경우, 그 집단의 정보를 유의미하게 반영하지 않을 수 있다.

이 경우 각 층에 속하는 모집단 크기에 비례하지 않으면서 전체적으론 비례 표본추출과 동일한 크기의 표본을 추출한다.

  • 가중확률 표본추출

필요에 따라 표집률을 달리하는 것이다. 

로 구분된다.


  • 정리
  • 층으로 나누고, 각 층에서 무작위 추출
  • 기본 논리: 집단이 동질적이라면 표본의 크기를 줄일 수 있다
  • 표본 배분법: 균등, 비례, 최적, 네이만, 데밍
  • 표본의 크기에 따른 구분: 비례 층화, 비비례 층화, 가중확률

+ Recent posts