복수초

SAMSUNG CSC
복수초

아직 영하의 추위가 계속 되고 있는데 복수초(草)가 피었다. 작년 겨울에 마을 이웃 김 목수 부인이 몇 무더기를 선물로 주었다.

한 해 동안 지켜 보니 복수초는 해가 환히 빛나는 대낮에 꽃잎을 폈다가 어두워지면 오무라졌다. 흐린 날에는 한낮에도 꽃이 활짝 벌어지지 않았다. 그리고 6월쯤 되어 날이 더워지면서 녹아서 사라져 버렸다. 그들의 존재를 한참 잊고 있었는데 2월이 되니 다시 저렇게 피어났다. 이 야생화는 햇빛은 좋아하면서도 더위는 싫어하는 까다로운 성격인 모양이다.

새해 들어 정원에 처음 피어난 꽃이라 그런 지 아주 반갑고 정겹다. (윤영민, 2016/03/01)

(Bayes 학습)(1) ‘확률’을 새롭게 인식하며

고등학교 수학 교과서에 따르면 어떤 “사건이 일어날 확실성을 수량적으로 나타낸 것”이 확률(probability)이다. 근원 사건이 같은 정도로 일어난다고 가정할 때, 어떤 사건의 확률 P(A)은 사건 A가 일어나는 경우의 수()를 일어날 수 있는 모든 경우의 수(N)로 나눈 값이다. 이것을 수학적 확률이라고 한다.  (참고로 근원 사건이란 더 이상 분해되지 않는 사건을 말한다.)

P(A) = {N_A \over N} .

두 개의 주사위를 동시에 던질 때, 눈의 합이 5로 되는 확률을 예로 들 수 있을 것이다. 전자의 경우를 보면, 표본공간(sample space) N은 6*6 = 36이고, 눈의 합이 5가 되는 사건(event)은 (1,4), (2,3), (3,2), (4,1)의 4 가지이므로 구하는 (수학적) 확률은 4/36 = 1/9이다.

그러나, 현실은 동전이나 주사위 던지기가 아니다. 근원 사건이 같은 정도로 일어난다는 가정이 성립되지 않을 수도 있고(예: 혈액형 유형별 발생 확률), 표본공간 N의 크기가 알 수 없거나 무제한 일 수도 있을 것이다. 그런 경우 수학적 확률을 구하기 어렵거나 심지어 불가능할 것이다. 그럴 때 우리는 통계적 확률로 수학적 확률을 대신한다.

시행의 횟수 n이 커짐에 따라 사건 A가 일어나는 상대빈도(relative frequency) 이 일정한 값 p와 거의 같다고 간주할 수 있을 때, 그 p를 통계적 확률이라고 말한다.

\lim_{n \to \infty}{n_a \over n}=p

상대빈도와 확률 사이에 이러한 관계를 성립시켜주는 것은 대수의 법칙(the law of large numbers)이다. 대수의 법칙에 따르면 통계적 확률과 수학적 확률이 일치한다. 따라서 수학적 확률을 알 수 없을 때 통계적 확률을 대신하고, 상대빈도로 통계적 확률을 근사할 수 있다.

예컨대 100원짜리 동전을 던져서 앞면이 나올 통계적 확률을 구하기 위해서는 실제로 동전을 한 1천번 정도 던져보아야 한다. 만약 정말로 1천번을 던져서 앞면의 수가 501번이 나왔다면 통계적 확률이 1/2이라고 말할 수 있다.

여기까지가 중고등학교에서 배운 확률의 정의이다. 이 확률의 정의를 가지면 현실의 문제를 다루는 데 충분할까?

사실 현실에서 상식적으로 확률을 그런 의미로 사용하는 경우는 드물다. “우리 아이가 A 대학에 붙을 확률이 얼마나 될까요?” “북한이 남한에 대해 미사일 공격을 가해 올 확률이 얼마나 될 거라고 생각하세요?” “내일 오전에 비가 내릴 확률이 얼마나 될까요?” “소풍 가는 날 맑은 날씨일 확률이 얼마나 될까요?” “더민주당이 총선 이후 다시 제1야당이 될 확률이 얼마나 될까요?” “안철수 의원이 새정치국민연합을 탈당할 확률이 얼마나 될까요?” “백혈병 환자의 5년 이상 생존율이 얼마나 되나요?” “말기 폐암 환자가 1년 이상 생존할 확률이 얼마나 되나요?” “저 백혈병 환자가 1년 이상 생존할 확률이 얼마나 될까요?” “에이즈 검사 결과가 양성으로 나온 저 남자가 실제로 에이즈에 감염되었을 확률은 얼마나 되나요?” “그녀가 사업에 성공할 확률이 얼마나 될까요?” 이 사례들은 모두 정당한 확률적 의문이다.

즉, 이 사례들에서 보듯이 현실에서 사람들은 확률을, 반복적이지 않은 사건의 객관적인 발생 가능성을 가리키는데 사용하기도 하고, 또 어떤 사건의 발생 가능성에 대한 주관적인 믿음의 정도(degree of belief)나 지식의 상태(state of knowledge)를 가리키는데 사용하기도 한다.

수학적 확률이나 상대빈도(relative frequency)는 반복적으로 많은 횟수가 발생하는 사건의 객관적인 발생 가능성을 숫자로 나타내는 데 유용함이 분명하다. 그러나 희소한 사건의 발생 가능성, 혹은 반복적이지 않은 사건의 발생 가능성은 어떻게 숫자로 표현할까? 혹은 어떤 사건의 발생 가능성에 대한 전문가의 확신을 추정이나 예측에 반영할 수 있는 길은 없을까?

베이즈 추론(Bayesian inference)은 그러한 상상에 유용한 접근 방법이 될 수 있다. 관찰값이 주어졌을 때, 그것으로부터 관찰이 불가능한 모수(parameters)의 값을 추정하거나, 또는 관찰값이 주어졌을 때, 그것으로부터 미래에 혹은 다른 사례에서 동일한 현상이 나타날 가능성을 예측하는데 대단히 유용할 수 있다.

베이즈 추론은 “관찰값이 주어졌을 때”, 다시 말해 어떤 특정한 조건이 주어졌을 때, 모수를 추정하거나 미지의 수를 예측하기 때문에 근본적으로 조건부 확률(conditional probability)이다. 조건부 확률을 복습하면서 베이즈 정리를 도출해 보자.

사건 A가 일어났을 때의 사건 B의 조건부 확률 P(B|A)는

 , P(A) ≠ 0

으로 표시된다. 여기서 양변에 P(A)를 곱하면,

가 된다. 이것은 바로 확률의 곱셈정리이다.

그런데 집합의 교환법칙에 따르면,  이므로,

가 된다. 여기서 양변을 P(A)로 나누면,

   , P(A) ≠ 0

베이즈 정리(Bayes Theorem)가 도출되었다. 말로 풀어보면, 사건 A가 일어났을 때 사건 B가 일어날 조건부 확률 P(B|A)은 사건 B가 일어날 확률 P(B)에, 사건 B가 일어났을 때 사건 A가 일어날 조건부 확률 P(A|B)를 곱한 값을 사건 A가 일어날 확률 P(A)로 나눈 값과 같다. 베이즈 추론은 이 베이즈 정리에서 출발한다. 이 정리가 그렇게 중요할 줄은 고등학교 때는 물론이고, 대학 수학 시간이나 대학원 통계학 시간에도 상상하지 못했다. 다음에는 베이즈 정리를 좀 깊이 이해해 보자. (윤영민, 2016/02/29)

끝낼 수 없는 도전

SAMSUNG CSC
데이터사이언스 워크숍

필암문화원에서 어제(토요일) 오후 4시부터 오늘 오후 2시까지 마라톤 워크숍을 가졌다. 대구에서 온 전채남 박사와 김희대 박사, 서울에서 온 나의 대학원 학생들(유자현, 정성호, 구경모), 그리고 막내와 내가 참여했다. 나는 베이즈 통계 부분을 리드하고 막내는 파이썬 프로그래밍 파트를 리드했다.

두 명씩 서로 도와가면서 학습하는 페어 프로그래밍(pair programming) 방식으로 진행했다. 참가자들이 준비를 잘 해온 덕분에 상당히 많은 내용을 소화할 수 있었다.

워크숍의 목표는 지난 겨울방학 동안에 공부한 베이지안 통계(Bayesian statistics)와 파이썬(Python)(프로그래밍 언어)을 총복습하는 것이었다. 빈도주의(frequentism)라고 불리는 기존의 확률과 통계 분석에만 익숙한 사람들이 베이즈주의(Bayesianism)에 입문하기가 쉽지 않다. 확률에 대한 개념이 다르고, 분석 과정도 다르며, 수학과 컴퓨터 지식도 더 많이 요구된다. 또한 SAS와 같은 통계패키지를 사용하면 굳이 프로그래밍 언어를 배우는 수고를 하지 않아도 베이지안 통계분석을 실행할 수 있지만. 프로그래밍을 하면서 배우는 것이 베이지안 통계를 더욱 철저히 배울 수 있고, 나아가 인공지능(artificial intelligence)과 기계학습(machine learning)을 공부하는데도 도움이 되리라 생각되어 어려운 길을 택했다.

베이즈 통계를 사용하려면 몇 가지 핵심적 개념과 원리, 분석과정, 분석도구를 제대로 이해해야 한다. 간략히 제시하면 다음과 같다.

  • 베이즈 통계에서는 확률(probability)이란 특정 상황의 불확실성을 평가하는 데 있어 개인이 갖는 믿음의 정도(degree of belief)(혹은 확신의 정도(degree of confidence))를 말한다.
  • 베이즈 통계에서는 모든 표본값(sampling statistics)과 모수(parameters)가 확률변수(random variable)이다(일 수 있다).
  • 따라서 베이즈 통계의 알파와 오메가는 확률분포(probability distribution)이다.
  • 베이즈 통계의 출발은 조건부 확률(conditional probability)이다.
  • 베이즈 통계의 핵심은 베이즈 정리(Bayes Theorem)이다.
  • 베이즈 통계를 이해하고 실행하려면 수학에서 순열과 조합, 미적분, 집합, 그리고 특히 행렬대수(matrix algebra)를 알아야 한다.
  • 베이즈 추론에는 수학적 해 대신에 통계적 근사치를 사용한다.
  • 베이즈 추론에는 컴퓨터 시뮬레이션이 적용된다.
  • 컴퓨터 시뮬레이션을 하는 데는 MCMC(Markov Chain Monte Carlo) 방법이 사용된다. MCMC를 이해하려면 특히 마르코프 연쇄랜덤 워크(random walk) 이론을 잘 파악해야 한다.
  • MCMC 방법을 사용하여 사전 분포(prior distribution)로부터 수만 개 혹은 수십만 개의 수를 생성하여 모수를 근사(approximate)한다.
  • 베이즈 추론 과정은 크게 네 부분으로 구성된다. (1) 사전정보(prior)(사전 분포) 추정(편의상 우도함수와 같은 계열의 함수를 채택하는 방법을 쓴다 <– 공액함수(conjugate prior)라고 불린다),  (2) 데이터의 우도 함수(likelihood function) 추정. (3) 우도함수를 가지고 사전분포를 갱신(update)하여 사후 함수를 구한다. (4) 절차의 적절성을 평가한다. 특히 시뮬레이션의 수렴(convergence)에 대해 평가해야 한다.
  • 평가 결과가 만족스럽지 않을 경우 확률모형을 수정하거나 절차를 개선하여 다시 추론 과정을 밟는다.

두 달 후에 가질 2차 워크숍에서는 MCMC와 평가를 보다 깊이 있게 이해하고, 파이썬을 사용해서 모수 추정 뿐 아니라 예측이나 가설 검증도 해 보아야 겠다.

정년도 몇 년 남지 않았는데, 과연 이렇게 낯선 공부를 해야할까 하는 생각이 들기도 한다. 하지만 이 시대에 인공지능을 이해하지 못하면서 사회적 불평등, 일, 직업, 그리고 인간의 행복에 대해 사회학적으로 발언하고 개입할 수 있겠는가. 사회학자이기를 그만 두지 않은 한 도전을 멈출 수 없을 것이다. (윤영민, 2016/02/29)

장미가 아름다운 이유

SAMSUNG CSC2014년 6월 26일

장미동산이 겨울잠에서 깨어난다. 지금부터 12월까지 장미와 많은 시간을 보내게 될 것이다. 전정을 하고, 좋은 묘목을 구하고, 묘목을 심고, 지지대를 만들어주고, 거름을 주고, 물을 주고, 약을 주고….그리고 꽃과 대화를 나눈다.

장미를 건강하고 아름답게 키우려면 잠시도 방심할 수 없다. 어쩌면 장미가 아름다운 이유는 주인의 엄청난 애정과 보살핌 때문일 것이다.

SAMSUNG CSC2015년 5월 21일

따뜻한 남도에서는 5월부터 11월까지 정원에 장미꽃이 핀다. 물론 5월의 장미가 가장 건강하고 아름답기는 하지만 눈과 서리 속이라고 장미가 예쁘지 않은 것은 아니다.

장미의 강적은 습기와 진딧물이다. 장미 잎은 항상 건조한 상태를 유지해야 한다. 그래서 비가 자주 내리는 장마철을 온전히 나기가 쉽지 않다. 또한 벌레들이 장미를 무척 좋아한다. 특히 진딧물이 그렇다. 진딧물을 철저히 잡아주지 않으면 꽃봉우리조차 성하지 못하게 된다.

과연 그렇게 많은 공을 들여가면서 키워야할만큼 장미가 매력적인 꽃인가? 내게는 그렇다. 릴케에게도 그랬을 것이다. 꽃을 사랑하는 누구에게라도 그렇지 않을까. (윤영민, 2016/02/21)

“부유하다”와 “잘살다”가 구분되었으면

wellbeing1

우리 말에서 “잘살다” = “부유하게 살다”이다. “그집은 아주 잘살아!”라는 말은 “그집은 아주 부자다”, “그집은 아주 부유하다”라는 의미이다.

우리 사회가 진정으로 살기좋은 나라가 되기 위해서는 그러한 언어 사용에 변화가 일어나야 한다. “잘살다”가 “부유하다”와 분화되지 않으면 새로운 시대 지향에 대한 사회적 합의를 도출하는데 혼란이 끊이지 않을 것이다.

“잘하다”가 “훌륭하다” 혹은 “멋지다”는 의미인 것처럼 “잘살다”를 “행복하게 살다”, “현명하게 살다”와 같은 의미에 국한시켜서 사용할 것을 제안한다. 영어에서는 “부유하다”를 표현할 때 richness, affluence, wealth라는 단어를 사용하고, “행복하게 산다”, “현명하게 산다”를 표현할 때는 well-being이라는 단어를 사용한다.

물론 서구사회에서도 well-being이라는 단어가 비교적 신조어일 것이다. 스펠링이 아직 wellbeing이라고 굳어지지 못하고 well-being과 혼용되는 것을 보면 그렇게 짐작된다. 그것은 서구 국가들에서도 경제적으로 풍요로워지면서 진정으로 잘 사는 것이 무엇인지에 대한 성찰과 함께 새롭게 등장한 어휘일 것이다.

지난 반 세기 이상 경제가 급속히 성장하면서 우리나라는 J.K. Galbraith가 말한 “풍요로운 사회”에 진입했다. 부유한 나라가 된 것이다! 구매력 기준으로 우리 나라의 1인당 국민소득은 약 3만5천달러로 일본, 프랑스, 이탈리아, 뉴질랜드 등 소위 선진국가들과 어깨를 나란히 하고 있다. 물론 대다수의 국민들은 그 사실을 별로 느끼지도 흔쾌히 인정하지도 못하겠지만 말이다.

인식 전환의 핵심은 삶의 지향이 “부자되기”가 아니라 “행복해지기”가 되어야 한다는 것이다. 나는 “행복“을 영어의 well-being에 해당되는 단어로, 그리고 “잘살다”행복을 추구하며 지혜롭게 산다”는 의미의 동사로 사용하기를 제안하다.
wellbeing-wheel

풍요로움 혹은 재산(돈)은 행복을 위한 경제적 조건에 불과하며, 어느 정도 이상으로 소득이 증가하면 소득은 행복을 증가시키는데 별로 기여하지 못한다(Easterlin paradox). 행복(well-being)은 경제적 조건 외에 사회적 관계, 신체적 여건, 심리적 상태, 환경적 여건, 직업 등 여러가지 요인들에 의해 좌우된다(그림 참조).

지난 반세기 동안 가난에서 벗어나 부자가 되기 위해 밤낮으로 노력하면서 우리는 부자가 되면 당연히 행복해질 줄 알았다. 그런데 그것은 진실이 아니었다! 오늘날 우리 사회의 여러가지 지표가 그것을 증명한다. OECD 국가들 중 자살률 1위, 자살증가율 1위, 노인 빈곤율 1위 등등. 우리 사회는 부유하지만 가장 불행한 나라가 된 것이다.

이제 우리 사회는 어떻게 사는 것이 잘 사는 것인지, 어떻게 해야 행복해 질 수 있는지에 대한 근본적인 물음을 제기해야 한다. 그리고 행복에 이르는 지름길을 찾아가야 한다. 그 전환을 더 이상 미뤄서는 안 될 것이다. (윤영민, 2016/2/20)

여의도 효과

IFC몰 지상 입구

서울은 맥박을 고동치게 한다. 특히 여의도에 가면 도전 의식이 꿈틀거리며 살아난다. 국회의사당, 방송국, 금융가….

2시간 30분이면 내 육체가 전통의 필암마을에서 여의도의 초현대식 IFC빌딩에 들어간다. 돌아올 때도 마찬가지이다. 나는 21세기 환경에서 2시간 30분만에 16세기 환경으로 돌아온다.

그 때마다 나는 문화인류학에서 말하는 데페이스망(Depaysement)을 경험한다. 전혀 다른 환경에 놓임으로써 자신이 속한 세계를 새롭게 바라보게 되는 것이다. 남태평양의 외딴 섬에 가서 원시부족과 함께 지내던 인류학자가 런던에 돌아오면서 경험하던 것과 유사한 정신현상을 나는 여의도를 방문하고 돌아올 때마다 경험하고 있다. 그것을 여의도 효과라고 불러도 좋을 듯하다.

그렇다고 다시 서울로 돌아가서 살고싶은 생각은 추호도 없다. 도시와 인공환경보다 농촌과 자연환경이 내게는 훨씬 더 편안하고 훨씬 더 생산적이다. 가끔 내가 21세기에 살고 있다는 사실을 잊지 않을 정도로만 서울을 다녀오면 충분하다. (윤영민, 2016/2/19)

수학의 두 얼굴

SAMSUNG CSC
1986년 발행된 고등학교 수학교과서 중 하나

대학원 유학 시절 5년차인 1990년 어느 날인가 학위논문 지도교수였던 Michael Hout(현재 New York University 사회학과 석좌교수)이 갑자기 나를 불렀다. 나는 당시 학과에서 대학원 조교를 하고 있었는데, 새로 입학한 한 대학원생에게 수학을 가르쳐주라는 것이었다.

무엇을 가르쳐야 하나 막막하던 나는 한국에 있던 아내에게 고등학교 수학교과서를 구입해서 보내달라고 부탁했다. 그 교과서를 가지고 집합, 미적분, 행렬, 확률을 가르치는 것이 좋겠다는 생각이 들어서였다.

그 일은 내게 정말 어려운 도전이었다! 그 학생은 중학교 3학년 이후에 수학을 배운 적이 없었다. 게다가 나는 영어로 수학을 배운 적이 없었기 때문에 수학 용어의 영어 표현을 찾아가면서 가르쳐야 했다.

어찌어찌해서 악몽같은 개인 지도가 두 달만에 끝났다. 아마도 그 (여)학생의 머리가 워낙 좋았기 때문에 내 엉터리 강의를 알아들었으리라. 그 여학생은 Harvard University Law School에서 법학박사 학위를 받은 후 사회학을 공부하기 위해 University of California, Berkeley 대학원에 다시 입학했다.

아마도 지금 그 일을 한다면 훨씬 수월할 것이다. 공부를 업으로 한참을 보낸 후에야 나는 수학이 두 얼굴을 가지고 있다는 사실을 깨달았다! 나는 학교에서 수학의 한 가지 얼굴만을 배웠다. 바로 셈법으로서의 수학, 계산 원리와 과정으로서의 수학이다.

그런데 수학에는 또 다른 얼굴이 있었다. 수학 교과서에도, 수학 ‘정석’에도 없는 얼굴이다. 그것은 다름 아닌 논리 전개를 위한 도구로서의 수학이다. 나는 학교에서 그 수학을 배우지 못했다.

나는 그 때문에 나보다 학교(고등학교와 대학)에서 수학을 덜 배운 지도교수가 정작 연구에서 나보다 수학을 훨씬 잘 사용하는 것을 보면서 무한한 열등감을 느낄 수밖에 없었다. 돌이켜보면 사실 그가 사용한 수학이 대단한 수준은 아니었다. 문제는 자신의 주장을 수학적으로 표현할 수 있느냐는 것이었다. 그는 할 수 있었고, 나는 할 수 없었다!

새벽에 일어나 수학적 표현과 씨름하면서 논리 전개를 위한 수학을 뒤늦게 공부하고 있다. 이제라도 균형잡힌 수학 능력을 갖추었으면 좋겠다. 다행스럽게도 예상했던 것보다 수학 공부가 재미 있다! (윤영민, 2016/02/17)

어린 왕자와 장미 가시

SAMSUNG CSC
대문을 타고 오르는 넝쿨 장미의 가시

닷새째 되던 날 어린 왕자가 주인공에게 물었다.

“가시는 어떤 쓸모가 있어?”

고장난 비행기를 수리하는데 여념이 없던 주인공은 건성으로 대답했다.

“가시는 아무런 쓸모가 없어. 가시는 꽃이 부리는 단순한 심술일 뿐이야!”

“아저씨는 정말 그렇게 생각해? 꽃들이…..”

“아니! 난 아무 생각도 없어! 그냥 아무렇게나 대답한 거야. 난 지금 중요한 일을 해야 한다고!”

주인공의 태도에 어린 왕자는 크게 실망한 모습이었다.

“중요한 일이라고?”….

“아저씨는 어른들처럼 말하는구나!”

생택쥐페리의 <어린 왕자>(김미성 옮김, 인디고, 2016)에 나오는 한 대목이다. 화가 난 어린 왕자는 주인공에게 수백만년 동안이나 계속되고 있는 양들과 꽃들 사이의 “전쟁”이라는 맥락에서 가시의 역할을 이해해야 한다고 알려준다.

“나는 연장을 내려놓았다. 망치도, 볼트도, 목마름도, 죽음도 중요한 게 아니라는 생각이 들었다. 어느 별, 어떤 행성, 내 행성, 바로 지구에 위로해 주어야 할 어린 왕자가 있었다(56쪽).”

“미안하다. 아빠는 지금 정말 중요한 일을 하느라 너와 대화를 하지 못하겠구나.” “여보, 중요한 일 때문에 다음 주에 당신과 여행가기로 한 약속을 연기해야겠어. 미안해요.” 늘 그렇게 구차스럽게 변명하면서 우리는 진정으로 소중한 순간, 소중한 인연을 놓치고 살고 있는 것은 아닐까.

지구별 여행을 후회없이 마치기 위해 꼭 해야만 할 정말 “중요한 일”은 무엇일까(윤영민, 2016/02/16).

베이즈(Bayes)의 귀환

SAMSUNG CSC
Ronald J. Wonnacott & Thomas H. Wonnacott. 1985. Introductory Statistics, 4th ed.

1986년 가을 미국 University of South Carolina(Columbia)에서 사회학 석사 과정을 시작했다. 첫 학기에 전공 필수 과목 중 하나로 ‘사회통계학 입문’을 수강했다.  그 과목을 강의했던 밀러 맥퍼슨(J. Miller McPherson) 교수는 학기 초반에 조건부 확률을 가르치면서 베이즈 공리(Bayes Theorem)를 잠깐 소개했다. 나는 그가 수업 시간에 이렇게 말했던 것으로 기억한다.

“아마도 여러분이 미래에 베이즈 분석을 사용할 가능성은 거의 없을 겁니다. 그래서 여기서 잠시 그 원리를 설명하고 교재의 마지막 부분, 제19장과 제20장에 있는 베이즈 추론과 베이즈 의사결정이론은 수업에서 다루지 않겠습니다.”

맥퍼슨 교수와 그의 부인인 Lynn Smith-Lovin 교수는 상당히 우수한 사회학자였다. 그는 나중에 코넬대학교와 아리조나 대학교 교수를 거쳐서 듀크대학교 사회학과에서 부인과 함께 오랫동안 교수로 재직했다. 요즈음 인기가 좋은 분야인 사회연결망(social network) 분석 전문가인 그는 특히 계량적 방법에 뛰어났다. 그런 그가 30년 전 베이즈 접근과 분석이 지닌 시대적 잠재성을 깨닫지 못했고, 덕분에 베이즈 공리와 분석은 나의 시야에서 영원히 사라졌다.

그런데 나는 환갑 나이에 베이즈를 다시 공부하고 있다. 지금이라도 베이즈를 공부하지 않는다면 나는 새로운 시대의 수많은 학문적 연구를 이해하지 못하는 반쪽짜리 사회과학도로 남을 것이다.

다행히 금년 한 해 연구년을 보내는 덕분에 차분하게 베이즈를 공부하고 있다. 더구나 베이즈 분석을 컴퓨터로 실행하기 위해 파이썬(Python)이라는 컴퓨터 언어를 함께 배우고 있다. 어느 하나를 새로 시작해도 익히기 쉽지 않겠지만 다행히 전산과학을 전공하는 막내가 파이썬 학습을 거들어 주니 그럭저럭 공부할 만하다.

베이즈 분석은 내가 젊은 시절 배우고 평생 동안 사용한 통계학 접근과 참으로 다르다. 무엇보다 사고의 전환이 요구되는데 그 점에 적응이 어려웠다. 이제 베이즈적 사고가 점점 자연스럽게 느껴지고 파이썬의 구조에 대한 이해도 어느 정도 가능하다. 어느덧 한 고비를 넘은 것 같다. 좀 더 박차를 가하자(2016/02/14).

사회과학과 공학의 융합이 성공하려면….

Raffaello,_concilio_degli_dei_02
위키피디아에서 가져옴[Assembly of twenty gods, predominantly the Twelve Olympians, as they receive Psyche (Loggia di Psiche, 1518–19, by Raphael and his school, at the Villa Farnesina)]
요즈음 학술적이든 실무적이든 융합 연구가 대세이다. 융합! 멋진 말이다. 그러나 융합적 연구는 아차 하면 ‘신들의 대리 전쟁’이 되고 만다.

빅데이터를 연구하는 데이터과학(data science)이 좋은 예가 될 것이다. 데이터과학 연구에는, 영역 전문가(domain expert), 연구자(researcher), 컴퓨터과학자(computer scientist), 그리고 시스템 운영자(system administrator)라는 네 가지 역할이 필요하다. 앞 두 가지 역할이 통상 사회과학이나 통계학 전공자가 수행한다면, 뒤 두 가지 역할은 대체로 컴퓨터과학 전공자가  수행한다. 즉, 사회과학과 컴퓨터과학의 융합이 이루어 진다.

사회과학과 컴퓨터과학(혹은 공학) 사이의 융합에서 가장 근본적인 어려움 혹은 혼란은 무엇일까? 그것은 융합 과정에서 서로 다른 학문 분과들에 고유한 가치와 질서가 심각하게 상호 충돌한다는 사실이다.

사회과학은 광고, 저널리즘, 경영 같은 응용분야마저도 사회적 규칙성의 발견이 지상 목표이고, 가설-검증이 표준적인 접근방법이다. 반면에 컴퓨터과학(공학)에서는 과업수행(혹은 그것의 시간 단축)을 가능하도록 만들어주는 알고리즘(혹은 프로그램)의 개발이 표준적인 접근방법이다.

그래서 사회과학에서는 치밀하고 엄격한 과학적 방법으로 진리에 접근하였는가, 혹은 그런 연구를 수행할 수 있는 연구자인가가 과제 심사의 평가 기준이 되고, 컴퓨터과학에서는 상대적으로 얼마나 우수한 알고리즘 혹은 프로그램을 개발하였는가 혹은 그럴만한 능력을 가졌는가가 과제 심사의 평가 기준이 된다.

두 학문 분야의 평가기준이 참으로 다르다. 그런데 이 차이는 현실에서 심각한 갈등을 낳곤 한다. 만약 평가 심사자가 사회과학자인 경우 과제를 지원하거나 수행한 컴퓨터과학자들은 무척 난감해질 것이고, 반대로 평가 심사자가 컴퓨터과학자인 경우 과제를 지원하거나 수행한 사회과학자들이 곤경에 처할 가능성이 매우 높다.

이학문간의 협업을 통해서 사회연구를 수행하는 것은 아테나(Αθηνά)를 섬기는 사람들과 헤르메스(Ερμής)를 섬기는 사람들이 함께 제사를 지내는 것이나 크게 다르지 않다. 제사장이 다른 신을 섬기는 사람을 만나면 사람들은 심각한 어려움에 봉착할 것이다. 자신들의 숭배하는 가치와 질서를 부정당하게 될 것이기 때문이다.

1백여 년전 독일의 사회학자 막스 베버(Max Weber)는 어떤 대학에서 행한 강연에서 학문 사이의 그러한 갈등을 신들의 전쟁에 비유했다.

“어떻게 프랑스 문화의 가치를 독일문화의 가치와 비교해서 <학문적으로(과학적으로)> 그 우열을 결정할 수 있을 지 나는 모릅니다. 여기에서도 역시 서로 다른 신들이 싸우고 있으며, 그리고 이 싸움은 영원히 계속될 것입니다….옛날의 많은 신들은, 이제 그 주술적 힘은 잃어버리고 그래서 비인격적인 힘의 형태로, 그들의 무덤에서 기어 나와서 우리 삶을 지배하고자 하며 또다시 서로간의 영원한 투쟁을 시작하고 있습니다(Weber, 1918/1997: 235-236쪽).”

어쩌면 베버(1997: 235)의 지적처럼, “우리가 할 수 있는 것이라고는 단지, 어느 하나의 학문에서는 무엇이 신적인 것으로, 또 다른 학문에서는 또 다른 무엇이 신적인 것으로 간주되는지”를 이해하고 인정하는 것일 뿐이리라.

융합은 서로 다른 신을 추종하는 전문가들 사이의 화합과 협력이다. 그런데 연구자들 상호간의 몰이해로 인해 융합은 쉽게 신들의 대리전으로 귀결되고 만다. 융합적 혁신과 지성은 무엇보다 신들의 화해와 공존을 실현해야 가능하다.

그 갈등을 예방하는 방법은 첫째, 상대 학문에 내재한 가치와 규범을 이해하고 인정하며, 둘째, 연구 과제의 성격에 따라 그에 타당한 평가 기준을 적용하는 것이 아닐까 한다.