예제와 연습문제: 가설검정의 원리(중)

예제 1. 자동차 판매점의 관리자는 판매촉진을 위한 새로운 성과급을 고려하고 있다. 최근 월평균 판매량은 14대이다. 관리자는 새로운 성과급이 판매량 증가에 도움이 되는지를 알고 싶다. 성과급 도입에 따른 자료는 새로운 성과급 체제에서 한달 간 개인별 판매량을 표본으로 수집한다.

a) 이 상황에 가장 적합한 영가설과 대립가설을 세우시오.

먼저 대립가설은 “새로운 성과급 제도가 판매량 증가에 도움이 될 것이다”가 된다. 그렇다면, 최저 월평균 판매량()이 14대 이상이 될 것이다. 이 명제를 숫자로 표현하면,

이와 반대되는 영가설은 “새로운 성과급 제도가 효과가 없을 것이다”가 된다. 그렇다면 최저 월평균 판매량은 이전과 같거나 그 이하일 것이니,

b) 영가설을 기각할 수 없을 때, 결론에 대해 설명하시오.

만약 영가설을 기각할 수 없다면, 새로운 성과급 제도가 판매량 증가에 도움이 될 것이라는 주장(즉, 대립가설)이 경험적 데이터에 의해 지지되지 않는다는 결론에 도달된다.

c) 영가설을 기각한다면 어떻게 결론 지을 수 있는 지 설명하시오.

반면에 영가설이 기각된다면, 새로운 성과급 제도가 판매량 증가에 도움이 될 것이라는 주장(즉, 대립가설)이 경험적 데이터에 의해 지지된다는 결론에 도달된다.

null hypothesis alternative hypothesis에 대한 이미지 검색결과

예제 2. 공장장은 현재의 생산방식의 운영에 시간과 비용이 많이 소요되므로 새로운 생산방식을 도입하여 원가를 줄여야 한다고 주장한다. 현재의 생산방식에서는 시간당 평균 $220의 비용이 발생한다. 이 조사에서 일정 기간을 표본으로 선택하여 새로운 생산방식으로 비용을 측정할 것이다.

a.조사에 가장 적합한 영가설과 대립가설을 세우시오.

먼저 대립가설은 “새로운 생산방식이 원가절감에 도움이 될 것이다”가 된다. 그렇다면, 시간당 평균 생산비용이 현재의 시간당 평균 $220보다 작게 될 것이다. 생산성 향상 효과가 0보다 클 것이기 때문이다. 이 명제를 숫자로 표현하면,

이와 반대되는 영가설은 “새로운 생산방식이 원가절감에 도움이 되지 않을 것이다”가 된다. 생산성 효과가 0이 되거나 마이너스가 될 것이기 때문이다. 그렇다면,

a. 영가설을 기각할 수 없을 때, 결론에 대해 설명하시오.

영가설을 기각할 수 없다면, 새로운 생산방식이 원가절감에 도움이 될 것이다라는 대립가설은 실증적으로 지지되지 않는다고 결론 지을 수 있다.

b.영가설을 기각한다면 어떻게 결론 지을 수 있는 지 설명하시오.

반대로 영가설을 기각한다면, 새로운 생산방식이 원가절감에 도움이 될 것이다라는 대립가설이 실증적으로 지지된다고 결론 지을 수 있다.

null hypothesis alternative hypothesis cost reduction에 대한 이미지 검색결과

연습문제 1. 힐탑 커피(Hiltop Coffee)의 큰 캔에는 3파운드의 커피가 함유되어 있다고 표시되어 있다. FTC (Federal Trade Commission)는 정기적으로 통계조사를 실시하여 제조업체들의 주장이 사실인지를 확인한다. 만약 제품 표시가 잘못되었다고 판단되면 함량 미달과 상표 표시 위반으로 힐탑에게 벌금을 부과할 수 있다. FTC는 힐탑커피 캔의 함량 표시를 모집단의 평균 함량이 3파운드라는 주장으로 해석한다. 만약 힐탑 커피 캔에 관한 표본 조사에서 모집단의 평균 함량이 3파운드 이상이라고 추정되면 검사에서 통과가 되고 그렇지 않으면 검사에서 통과되지 못한다. FTC가 어떤 절차를 거쳐서 그러한 판단을 내리게 되는 걸까?

(해제)

1) 유의수준을 선택한다.

FTC는 엄격한 검사를 위해 신뢰수준 99%를 선택했다. 그렇다면 유의수준은 0.01이다.

2) 대립가설과 영가설을 세운다.

먼저 대립가설은 “모집단의 평균 함량이 3파운드 미만일 것이다”가 된다. 이 명제를 숫자로 표현하면,

이와 반대되는 영가설은 “모집단의 평균 함량이 3파운드 이상일 것이다”가 된다. 그렇다면,

3) 표본자료를 수집하고 검정 통계치를 계산한다.

FTC는 36개의 캔 커피를 표본으로 추출하여 표본평균 2.92 파운드를 얻었다. FTC는 모집단의 표준편차가 0.18이라는 사실을 알고 있고 모집단의 함량은 정규분포를 따른다고 가정한다.

모집단의 표준편차()를 알고 있음으로 z-분포를 적용하여 z-값을 구한다. z-값은 표본평균()의 z-분포(표집분포)에서 표본평균()이 모평균()으로부터 표준오차의 몇배만큼 떨어져 있는지를 구한다. 이를 공식을 적용하여 계산하면 아래와 같다.

영가설으로부터 도출한 모평균()은 3이고, 표본평균()은 2.92, 모표준편차()는0.18, 표본의 크기()는 36이다.각 값을 식(1)에 대입하여 z-값을 계산한다.

표본통계치 z는 -2.67이다.

4) p-값을 구한다.

p-값은 z가 -2.67 이하일 확률이다. 표준정규분포에서 z=-2.67의 왼쪽에 해당되는 부분은 0.0038이다(Probability Distributions라는 스마트폰 app을 사용하면 손쉽게 구할 수 있음).

5) p-값과 유의수준을 비교하여 결론을 내린다.

p-값 0.0038은 유의 수준 0.01보다 훨씬 작다. 따라서 영가설을 기각할 수 있다. 영가설이 기각되었음으로, 대립가설(모집단의 커피 평균함량이 3파운드 미만이다)이 경험적으로 지지된다고 결론을 내릴 수 있다. 즉, 힐탑 커피 캔은 함량이 부족하다고 결론 지을 수 있다.

연습문제 2. 다음의 가설검정을 생각해보자.

25개 표본의 표본평균 , 표본표준편차

a. 검정통계치 값을 계산하시오.

b. p-값을 계산하시오.

c. 일 때, 결론은 무엇인가?

 

(해제)

a. 모집단의 표준편차를 모르며 표본의 표준편차가 주어져 있고, 표본의 크기가 25이므로 t-분포를 적용하여 검정통계치 값을 계산한다.

b. 자유도 = 24, t = 2.3148일 때, p값은 0.01475

c. p-값 0.01475가 보다 작으므로, 영가설을 기각한다. 영가설이 참일 가능성이 매우 작은 것이다. 다르게 표현하면, 영가설이 참일 때 표본평균 14를 얻을 가능성이 매우 작다. 따라서 모평균이 12 미만일 것이라는 영가설을 기각하고 모평균이 12 이상일 것이라는 대립가설을 채택한다. 

 

연습문제 3.  다음의 가설검정을 생각해보자.

36개의 표본을 사용한 표본 결과가 다음과 같다. p-값을 계산하고, α=0.01 때의 결론은 무엇인가?

a.

b.

c.

 

(해제)

a. 표본의 크기가 36이므로 자유도는35. 모집단의 표준편차를 모르므로 t-분포를 적용하여 표본통계치(t) 값을 구한다.

자유도 = 35, t = -1.1538일 때, p-값은 0.12820. p-값이 0.01보다 크므로 영가설이 참일 확률이 기준보다 큼을 알 수 있다. 따라서 영가설을 기각할 수 없고 대립가설은 경험적으로 지지되지 않는다.

b와 c는 동일한 방식으로 풀면 되기 때문에 해제를 생략한다.

지금까지 푼 세 개의 연습 문제는 모두 소위 단측 검정에 해당된다. 다음 포스팅에서는 단측 검정과 양측 검정을 비교 설명하고 양측 검정의 사례와 연습문제를 풀어보기로 하자. (2019-10-10)

“예제와 연습문제: 가설검정의 원리(중)”에 대한 3개의 댓글

  1. 질문이 있습니다.
    http://piramvill2.org/?p=2915
    연습문제 1번의 3번 해제에서 “영가설으로부터 도출한 모평균(\mu_{0})은 3이고”라 하시고 문제를 해결해나가셨는데, 이 부분이 잘 이해가 안갑니다.

    설정하신 영가설 H_0는 ‘\mu <3' 인데, 그러면 영가설에서 도출한 모평균(\mu_{0})는 3미만인 어떤 값이여야 하는 것 아닌가요?
    저는 그래서 z의 분자 \bar{X}-\mu_0를 \bar{X}-\mu+\mu-\mu_0로 바꿔서 계산해야한다고 생각했고 이 때 답 또한 다르게 나온다고 생각했습니다.
    또한 표본평균이 2.92가 나왔는데 이게 "모집단의 평균 함량이 3파운드 미만일 것이다"라는 영가설을 기각하는 데 지지가 된다는 사실 또한 같은 맥락으로 이해가 가지 않습니다.

    이해해보려고 많은 시간을 투자하였다 생각하는데, 아무리 생각해봐도 문제가 이해가 가지 않아 여쭤봅니다.

    1. 질문 감사합니다. 덕분에 내 오류를 바로 잡을 수 있었네요. 영가설과 대립가설을 거꾸로 정의해서 바로 잡았습니다. 그렇더라도 영가설로부터 추정한 모평균은 여전히 3입니다. 영가설이 참이라고 해도 모두 문제에 있어 모평균이 0인 것은 아닙니다. 기준이 되는 값이 모평균이 되는데 여기서는 3파운드가 기준점입니다. 대립가설은 FTC가 지닌 의심, 즉, ‘힐탑커피캔은 함량 미달일 것이다’ 입니다. 그러면 영가설은 힐탑캔커피캔이 3파운드 이상일 것이다’가 되겠지요. p-값이 아주 작으니 영가설이 기각되고, 대립가설을 채택하게 됩니다. 즉, 힐탑커피캔의 함량은 기준치 미달이라고 결론을 내릴 수 있습니다.

      내 잘못으로 혼선을 줘서 미안합니다. 이 댓글이 이해에 도움이 되길 바랍니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 항목은 *(으)로 표시합니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.