베이즈주의 대 빈도주의: 다툴 상대인가?

베이즈주의자들은 빈도주의 통계학의 가치를 폄하하고, 빈도주의자들은 베이즈 통계학의 가치를 부정한다. 베이즈주의와 빈도주의의 그러한 대립은 과연 타당한가?

베이즈 통계를 익히기 위해 적지 않은 시간과 노력을 쏟아붓고 나서 돌아보니 순전히 실용적 관점에서 볼 때 그 갈등은 현실 문제에 통계 지식을 적용하려는 사람들을 혼란스럽게 할 뿐이다.

베이즈 통계가 빈도주의 통계의 한계 혹은 약점을 보완해 줄 수 있다는 점은 분명하다. 그러나 현실에서 그점이 다소 과대포장되고 있지 않나 생각된다.

빈도주의 통계 중 현실에서 가장 널리 적용되는 부분은 아마도 회귀분석일 것이다. 그리고 회귀분석에는 대체로 규모가 큰 표본이 사용된다. 아마도 대표적인 것은 1천명 남짓의 설문조사 자료이리라.

그런데 우리가 비교적 품질이 좋고 규모도 큰 표본 데이터를 갖고 있다–사회조사나 여론조사에서는 대체로 그렇다–면, 빈도주의적 회귀분석 모형만으로 충분하다. 설령 베이즈적 회귀분석 모형을 적용한다고 해도, 그렇게 큰 표본 데이터가 이용가능하다면 베이즈적 회귀분석을 통해서 얻게 되는 결과는 빈도주의적 회귀분석 결과와 의미있는 차이가 없다.

예를 하나 가지고 살펴보자. 통계청 사이트에서 2016년 안산시 사회조사 자료를 다운로드 받아서 그 중 1280명의 데이터를 확보했다. 그 데이터를 가지고 “현재도 나이에 따라 학교 교육 수준이 다를까” 라는 의문에 대해 답한다고 하자. 그 데이터셋에 ‘만나이’를 독립변수로, ‘교육정도’를 종속변수로 놓고 단순회귀분석을 실시하였다. 빈도주의 회귀분석은 MS 엑셀의 데이터 분석이라는 애드인을 사용해서 다음과 같은 결과를 얻었다.

위 그림에서 맨 아래 행을 보면, 만나이의 회귀계수가 -0.04396이고, p값이 0.05보다 훨씬 작다. 회귀계수가 통계적으로 유의미하다. 회귀계수의 95% 신뢰구간은 (-0.04866, -0.03927)이다. 하위 90.0%, 상위 90.0%라고 되어 있는 부분은 90% 신뢰구간으로 그 값이 (-0.04790, -0.04003)이다.

베이즈적 회귀분석은 STATA를 사용해서 실행하였다. 아래는 분석결과이다.

위 그림의 맨 아래 쪽 표에서 고딕으로 표시한 부분을 보자. 만나이의 회귀계수의 평균이 -0.04392이고, 90% 등꼬리 신용구간 (-0.04790, -0.04011)이다. 회귀계수가 -0.04790과 -0.04011 사이에 있을 확률이 90%이다.

위의 빈도주의 회귀분석과 베이즈 회귀분석의 결과를 비교하면, 빈도주의 회귀계수 값이 베이즈 회귀계수 평균 값과 거의 동일하고, 빈도주의 90% 신뢰구간의 값이 베이즈 90% 등꼬리 신용구간의 값과 거의 동일하다.

이것은 우연의 일치가 아니다. 그것은 무엇보다도 데이터의 크기가 크면, 사전확률(분포)이 사후확률에 미치는 영향은 미미한 반면 데이터의 영향이 막대하기 때문이다. 사전확률분포의 영향이 미미해지면, 베이즈 추론의 결과는 사실상 빈도주의 통계의 최우도 추정(Maximum Likelihood Estimation)의 결과와 같아진다.

그렇다고 베이즈 통계가 하는 역할을 과소평가하는 것은 아니다. 반복적이 아닌 현상에 대한 예측은 빈도주의 통계가 가장 취약한 부분인 반면 베이즈 통계가 가장 잘하는 부분이다. 또한 데이터의 크기가 작은 경우 빈도주의 통계가 해줄 수 있는 것이 많지 않지만 베이즈 통계는 열일을 한다.

확률분포를 배우고, 베이즈적 사고에 익숙해지며, 또한 베이즈 추론을 수행하는 기술적 원리를 이해하기 위해 추가적인 땀을 흘려야 하지만, 베이즈 통계 지식은 사회과학도의 인식 지평을 넓혀주고 분석과 예측 능력을 높여주는데 크게 도움이 된다고 생각된다.

빈도주의와 베이즈주의 사이에 경쟁하는 측면이 있다는 사실을 부정할 수는 없지만 그것이 둘 사이에 존재하는 보완적 측면의 가치를 덮지는 못할 것이다. (2020-11-30)

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 항목은 *(으)로 표시합니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.