확률분포(7): 감마분포

베타분포처럼 감마분포(Gamma distribution, distribution)도 앞서 설명한 분포들과 깊이 관련되어 있다. 감마분포는 포아송 분포와 관련되어 있으며 지수분포를 확장하여 일반화한 확률분포라고 생각하면 된다. 때문에 감마분포를 공부하기 전에 포아송 분포와 지수분포를 복습해두면 좋을 것이다.

포아송분포는 단위 시간 당 어떤 사건이 발생하는 횟수에 대한 확률분포이고. 지수분포는 어떤 사건이 한 번 발생하는 데 걸리는 시간(혹은 시간 간격)에 대한 확률분포이며, 감마분포는 어떤 사건이 여러번( 번) 발생하는데 걸리는 시간에 대한 확률분포이다.

포아송분포: 확률변수 X = 단위 시간 당 사건 발생 횟수

지수분포: 확률변수 X = 어떤 사건이 한 번 발생하는 데 걸리는 시간

감마분포: 확률변수 X = 어떤 사건이 여러 번( 번) 발생하는 데 걸리는 시간

확률변수 X가 감마분포를 가지면 다음과 같이 표시된다.

퍼라미터 는 상호독립적인 확률변수 X의 갯수이다. 각 확률변수 X는 를 퍼라미터로 갖는 지수분포를 한다.

퍼라미터 는 첫번 째 사건이 발생할 때까지 소요된 시간이다.

는 단위 시간 당 어떤 사건의 평균적인 발생 횟수이다. 포아송분포와 지수분포의 경우와 같다. 감마분포는 포아송분포와 지수분포와 동일하게 를 가지고 나타낼 수도 있고, 를 가지고 나타낼 수도 있다. 를 가지고 나타내는 감마분포를 역감마분포(inverse gamma distribution)라고 부르기도 한다. 를 가지고 표현하는 경우가 많으니 여기서는 감마분포의 퍼라미터를  대신 라고 부르는 용례를 따르겠다.

따라서 이 글에서 감마분포는 다음과 같이 정의된다.

감마분포의 P.D.F.에 앞서 베타분포를 설명하면서 나왔던 감마함수( function)가 또 나왔다(). 베타분포를 설명할 때 감마 함수는 계승(factorial)을 실수 및 복소수로까지 확장한 것이며, 일 때, n이 양의 정수이면,  이라는 언급만 했다. 여기서는 감마함수의 성격에 대해 조금 더 자세히 언급하겠다.

감마함수가 계승(함수)의 확장이라는 말이 무슨 의미인지 궁금한 독자가 있을 것이다. 그것은 계승함수가 양의 정수에 대한 계승을 나타내는 데 그것을 실수에까지 확장한다는 의미이다. f(X)를 계승함수라고 하자.

몇 개의 X에 대한 계승함수 값을 그래프로 나타내면 아래와 같다.

그런데 위 점들을 잇는 선으로 잇는 함수가 바로 감마 함수이다. g(X)를 감마함수라면, 다음과 같이 표시할 수 있다.

X가 양의 실수이다. 몇 개의 X에 대한 감마함수 값을 그래프로 나타내면 아래와 같다.

의 감마함수는 다음과 같이 정의된다.

그리고 감마함수는 아래와 같은 성질을 갖는다.

다시 감마분포의 PDF (1)로 돌아가면, 모수 는 형상모수(shape parameter), 는 척도모수(scale parameter)라고 불린다. 와 구분하여 를 비율모수(rate parameter)라고 부르기도 한다.

4 illustrates the PDF of a Gamma distribution for multiple values of... | Download Scientific Diagram

위 그림은 형상모수와 척도모수가 감마분포의 모양을 어떻게 결정짓는 지에 대해 힌트를 준다. 먼저 척도모수 값이 1로 고정된 상태에서 형상모수의 값을 1, 2, 3으로 바꾸면, 까만 선, 빨간 선, 연초록 선으로 바뀜을 볼 수 있다. 까만선은 인 지수분포와 동일한 모습이다.

그 다음 형상모수 값을 3으로 두고, 척도모수를 2, 3으로 바꾸면, 그래프의 모양은 그대로 있고 그래프도의 척도가 변함을 알 수 있다(직접 시뮬레이션을 해보고 싶은 독자는 Probability Distributions 라는 앱을 가지고 시도해보기 바람). 그래서 퍼라미터의 이름이 척도모수라고 생각하면 될 것이다.

확률변수 X가 여러 개인 감마분포의 관점에서 보면, 지수분포는 첫번 째 사건(: )이 발생할 때까지 걸리는 시간에 대한 감마분포이다. 즉, 지수분포는 인 감마분포이다. 

위 식(1)에 을 대입하면 아래와 같다.

이는 정확히 확률분포 X의 지수분포에 대한 정의이다.

이제 예제를 가지고 감마분포를 살펴보자.

예제 1) 어떤 사람이 낚시를 하는데 평균 30분에 물고기 한 마리를 낚는다고 하자. 4마리 물고기를 잡는 시간이  2시간에서 4시간 사이가 걸릴 확률은?

해제) 30분에 물고기 한 마리를 낚으면, 1시간 당 평균 2 마리를 낚는다. 여기서 단위 시간은 1시간으로 해야 한다. 즉, . 그리고 물고기를 4마리 낚는데 필요한 시간이니 . 따라서 확률분포가 일 때 를 계산하면 된다.

확률변수 X: 물고기 4마리 잡을 때까지 걸리는 시간

감마분포의 누적분포 공식을 적용하면 아래와 같이 확률을 구할 수 있다. 직접 계산할 필요없이 응용프로그램을 이용하면 된다.

마이크로소프트 엑셀의 경우 가 아니라 를 가지고 감마분포를 표시하기 때문에 공식(1)을 사용하는 것이 아니라 아래 공식을 사용하여 확률 값을 준다. 즉, 역감마분포 값이다.

때문에 를 사용하는 감마분포 값을 구하기 위해서는 아래 공식을 이용해 값을 구해서 입력해 주어야 한다.

이 문제의 경우 가 2이니 는 0.5이다. 따라서 를 GAMMA.DIST에 입력하고 누적분포를 적용해야 를 제대로 계산할 수 있다.

Probability Distributions app은 공식 (1)을 사용하고 있으니 를 그대로 값으로 입력해 주면 된다. 그렇게 하면 엑셀과 동일한 결과를 구할 수 있다.

다소 혼란스럽기는 하지만, 감마분포 값을 구할 때는 응용 프로그램이 어떤 공식을 사용하고 있는지를 꼭 확인하고 적절한 퍼라미터 값을 입력해 주어야 한다.

예제 2) 승용차 패널 공정에 패널 제작용 철판을 배달한다고 하자. 우리는 20개의 철판을 배달하는데 걸리는 시간에 관심이 있다. 철판 배달은 포아송 분포를 따르고 1분당 평균 1.6개의 철판이 배달된다. 이 때 20개의 패널이 15분 이내에 배달될 확률은?

해제)

P(X < 15) = ?

감마분포의 누적분포 공식을 적용하면 되는데 적분 계산이 복잡하니 app을 사용하자. Probability Distributions app을 사용하면, 답은 0.81974이다.

(2020-09-27)

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.