모비율의 추정은 어떻게?(하)

이제 몇 가지 예제를 가지고 모비율에 대한 추정을 해보자.

(예제 1) 400명의 단순 무작위 표본으로부터 100개의 ‘예’라고 응답이 나왔다.

(1) ‘예’라고 답한 모집단의 비율에 대한 점추정값을 구하시오.

(2) 비율의 표준오차 추정값 를 구하시오.

(3) 모집단 비율에 대한 95% 신뢰구간을 구하시오.

 

(해제)

(1)모집단 비율()에 대한 불편의적 추정치는 표본비율()이다. 표본비율의 값이 곧 점추정값이 될 것이다. 표본비율은 공식  을 적용하여 구할 수 있다. 확률변수 X는 ‘예’의 갯수이다. 따라서,

(2) 중심극한정리를 적용하려면, 충분한 표본의 크기가 되는지를 검토해야 한다.  가 각각 100, 300으로 15 이상이므로 중심극한정리를 적용할 수 있다. 그러면 공식 을 사용하여 비율의 표준오차를 추정할 수 있다.

(3) 표본비율의 표준오차를 알면 다음 공식으로 95% 신뢰구간을 구할 수 있다.

따라서, 모비율의 95% 신뢰구간은 20.75%부터 29.25%까지이다.

 

(예제 2) 800가지 원소들의 단순 무작위 표본으로부터 표본비율 을 얻었다.

(1) 90% 신뢰수준에서 모집단 비율의 신뢰구간을 구하시오.

(2) 95% 신뢰수준에서 모집단 비율의 신뢰구간을 구하시오.

 

(해제)

(1)

마저 계산하면,

따라서 모집단 비율의 90% 신뢰구간은 67.34%부터 72.66%까지이다.

(2) 위 계산 과정에서 Z-값을 1.6449에서 1.96으로 바꾸면 된다.

마저 계산하면,

따라서 모집단 비율의 95% 신뢰구간은 66.82%에서 73.18%까지이다. 신뢰수준이 90%일 때보다 신뢰구간이 늘어났음을 알 수 있다.

 

(예제 3) 컨슈머 리포트 국립 연구센터에서 향후 주요 경제 문제 현황을 알아보기 위해 성인 2,000명을 대상으로 전화 설문 조사를 실시하였다. 보고서에 따르면, 응답자 중 1,760명은 사회보장제도의 안정성이 주요 경제 관심사라고 답하였다.

(1) 사회보장제도의 안정성이 주요 경제 관심사인 성인의 모집단 비율에 대한 점추정값을 구하시오.

(2) 90% 신뢰수준에서 오차범위를 구하시오.

(3) 사회보장제도의 안정성이 주요 경제 관심사인 성인의 모집단 비율에 대한 90% 신뢰구간을 구하시오.

(4) 이 모집단의 비율에 대한 95% 신뢰구간을 구하시오.

 

(해제)

(1) 확률변수 X는 사회보장제도의 안정성이 주요 경제 관심사라는 대답의 갯수이다. 따라서, 모집단 비율의 점추정인 표본비율의 값은 아래와 같이 구할 수 있다.

(2)

(3) 90% 신뢰구간은,

마저 계산하면,

따라서, 사회보장제도의 안정성이 주요 경제 관심사인 성인의 모집단 비율에 대한 90% 신뢰구간은 86.8%에서 89.2%까지이다.

(4) 신뢰수준을 95%로 올리면, Z-값만 변한다.

오차범위가 이므로, 95% 신뢰구간은,

마저 계산하면,

이를 말로 하면, 사회보장제도의 안정성이 주요 경제 관심사인 성인의 모집단 비율에 대한 95% 신뢰구간은 86.57%에서 89.43%까지이다. (이상의 예제들은 앤더슨, 2017의 제8장에서 가져왔음)

 

(예제 4) 일본담배산업이 19,064명을 대상으로 흡연조사를 했다. 결과는 성인의 4,137명이 담배를 피우고 있는 것으로 나타났다. 이 때 전국 성인의 흡연율 에 대해 신뢰도 95%의 신뢰구간을 구해 보자(와쿠이, 2015: 96에서 인용)

 

(해제) 먼저 표본으로부터 성공확률(흡연율)을 구한다.

표본이 아주 크므로(n=19,064), 아래 공식을 적용할 수 있다.

이를 를 중심으로 부등호로 표시하면,

이 식을 정리하면, 95% 신뢰수준에서 신뢰구간은 이 된다. 말로 풀면, “95% 신뢰수준에서 모집단 흡연율은 21.11%에서 22.29% 사이로 추정된다”가 될 것이다.

 

(예제 5) 전국적으로 애완동물을 키우는 비율을 조사하기 위해 크기 500의 표본을 추출해 표본비율을 조사했더니 0.62였다. 이를 토대로 전국적으로 애완동물을 키우는 비율 를 95% 신뢰 수준으로 추정해 보자. (와쿠이, 2015: 97에서 인용)

 

(해제)

이를 계산하면,

즉, 95% 신뢰수준에서 전국적으로 애완동물을 키우는 비율은 57.75%에서 66.25% 사이일 것으로 추정된다.

 

(예제 6) 어느 선거구에서 갑후보의 지지율을 조사하기 위하여 100명의 유권자를 조사한 결과 갑후보의 지지율이 65%이었다. 갑후보의 지지율에 대한 95%의 신뢰구간은?(사회조사분석사 1회)

 

(해제)

즉, 갑후보의 지지율은 95%의 신뢰수준에서 55.65%에서 74.35% 사이일 것으로 추정된다.

 

(예제 7) 어떤 도시의 시민 10만명에서 400명을 임의로 추출하여 쓰레기 분리 수거에 관한 여론을 조사하였더니 쓰레기 분리수거에 찬성한 사람이 240명이었다. 이때 시민 전체에 대한 찬성자의 비율을 95%로 추정하라. (김은정, 2017: 101에서 인용)

 

(해제)

이를 풀면,

즉, 95% 신뢰수준에서 전체 시민들 중 쓰레기 분리수거 찬성자의 비율은 55.2%에서 64.8%일 것으로 추정된다.

 

일곱 개의 예제를 풀어보았다. 모집단 비율의 추정을 설명하는 과정은 복잡했지만 실제로 계산하는 과정은 간단함을 알 수 있었으리라 생각된다. 비율은 현실에서 많이 사용되는 추정 통계치이기 때문에 좀 상세히 설명했다. (2019-09-28)

 

(참고문헌)

김은정 저. 2017. <사회조사분석사 사회통계>. 학진북스.

앤더슨, 스위니, 윌리엄스 저(류귀열 등 역). 2017. <앤더슨의 통계학>. 한올출판사.

와쿠이 요시유키, 와쿠이 사다미 저(김선숙 역). 2015. <그림으로 설명하는 개념 쏙쏙 통계학>. 성안당.

 

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다

This site uses Akismet to reduce spam. Learn how your comment data is processed.