세월호 그리고 공감….

empathy

아들아, 아빠가 생각할 때 인간이 지닌 가장 고귀한 능력은 공감(empathy)이다. 그것은 남을 측은하게 여기는 동정과는 다르다. 물론 동정도 칭찬받을만한 마음이고 태도이지만 공감이란 그 보다 훨씬 훌륭한 모습이다.

공감이란 얼마 전에 너도 읽었던 <앵무새 죽이기>에서 하퍼 리(Harper Lee)가 썼다시피 “상대의 몸 속으로 들어가 그 사람이 되어서 걸어 다니는 거다.” 그것은 단순히 남의 어려운 상태를 안타까워하고 도움을 주는 것과는 다르다.  그것은 상대의 입장에 서 보려는 노력이다.

내가 보기에 공감보다 어렵고 훌륭한 태도는 없을 것 같다. 하지만 세상을 떠난 저명한 미국의 영화 평론가 로저 이버트(Roger Ebert)는 “나는 문명의 가장 근본적인 특성이 공감이라고 믿는다”라고 말했다. 아빠도 그 지적에 전적으로 동감이다.

예수님이나 부처님은 달리 반신반인이 아닌 것 같다. 두 분의 공감은 지구상의 모든 사람에 뻗쳤다. 온 세상에 있는 타인의 고통을 그대로 함께 앓았다고 해도 과언이 아니다. 공감이 기껏해야 자신의 가족을 벗어나지 못하는 범인으로서는 상상하기 불가능한 놀라운 공감 능력이지. 우리가 예수님이나 부처님처럼 될 수는 없겠지만 그렇다고 우리의 공감이 가족에게만 국한되도록 놔둘 수는 없을 것이다.

오늘은 세월호가 침몰한 지 2주년이 되는 날이다. 지난 해 말 아빠는 누군가에게 세월호 희생자 가족과 생존자들을 일주일에 한번은 만나겠다고 약속했는데 아직 실천을 못하고 있다. 그냥 그들의 얘기를 들어주고 작은 격려라도 되주고 싶었을 뿐이었다.

세월호

언어는 힘을 지니고 있다. 세상을 바꾸는데 말이 중요하다. 그러나 어떤 순간에는 말보다 행동이 필요하단다.

지금처럼 세월호 비극을 내팽개친다면 우리 나라를 문명 사회라고 말할 수 없을 것이다.  그 비극을 잊지 않아야 하지만, 그 아픔을 푸는 것은 더욱 중요하다. 그럴려면 행동이 필요하다. 작은 움직임이라도 말이다. (2016/04/16)

(Bayes 학습)(11) 베이즈 추론의 역사

사십 대 여성이 정기 건강 검진의 일환으로 유방 엑스레이를 찍었다. 일주일 뒤 그녀는 유방암 검사 결과가 양성으로 나왔다는 통보를 받았다. 유방암에 관한 가족력도 없고 또 징후도 없는 그녀가 진짜로 유방암에 걸렸을 확률은 얼마일까?

나는 실제로 몇몇 의사, 간호사, 약사에게 물어 보았다. 80%, 60%, 30%, 10% 라고 대답했다. 모두 틀렸다. 그 확률은, 미국의 경우이기는 하지만, 3%에 불과하다!  그 확률은 아래의 베이즈 정리로 간단히 계산할 수 있다.

여기서 A는 유방 엑스레이 양성 반응이고, B는 유방암을 가지고 있음이다. 좌변의 P(B|A)는 유방 엑스레이 양성 반응이 나온 사람이 실제로 유방암을 가지고 있을 확률이다. 우변의 P(B)는 유방암을 가지고 있을 확률, P(A|B)는 유방암 환자가 유방 엑스레이 양성 반응이 나올 확률, 그리고 P(A)는 유방 엑스레이 양성 반응이 나올 확률이다.

미국에서 사십 대 여성 1만명 가운데 대략 40명이 유방암을 가지고 있다(유방암 발병 확률은 40/10,000이다). 그리고 유방암 환자가 유방 엑스레이 검사에서 양성 반응이 나올 확률은 80%이다. 그러면 그 40명 가운데 32명이 양성 판정을 받는다(그 확률은 32/40이다). 또한 유방 엑스레이 검사에서 양성 반응이 나올 확률은 10%이다(그 확률은 1,000/10,000이다).

이 수치를 위 공식에 대입해서 계산하면 다음과 같다.

3%이다. 간단하지만 매우 강력한 공식이다.

베이즈 정리라고 불리는 이 공식은 250여년 동안 역사적 퇴장과 등장을 반복하면서 살아남았다.  게다가 그 공식에 기반한 추론은 21세기에 다양한 분야에서 불확실성을 다루는 가장 강력한 도구가 되었다.

SAMSUNG CSC

이 책은 1740년대 영국의 토머스 베이즈 목사가 별로 자신없이 세상에 내놓았던 수학적 정리가 오늘날 온갖 학문과 현업 분야에서 불확실성을 다루는 강력한 도구로 떠오르기까지의 부침을 기록한 역사이다.

거기에는 숱한 영웅과 천재가 등장한다. 피에르 시몽 라플라스, 아서 베일리, 레너드 지미 새비지, 에드워드 몰리나, 앨버트 워츠 휘트니, 해럴드 제프리스, 데 피네티, 앨런 튜링, 잭 굿, 안드레이 콜모고로프, 존 튜키, 오스굿 쿠프먼, 제롬 콘필드, 앨버트 매단스키, 데니스 린들리, 로버트 오셔 슐라이퍼, 하워드 라이파, 프레더릭 모스텔러, 존 피냐 크레이븐, 에이드리언 래프터리, 저먼 형제, 에드리언 스미스, 앨런 겔팬드, 키스 헤이스팅스 등. 게다가 베이즈 추론을 없애버리려는 악당들(?)도 등장한다. 통계학을 공부한 사람이라면 누구나 그 이름을 기억할 로널드 피셔, 예지 네이만 등이 베이지언들의 공적으로 등장한다. 이 책에서 독자는 그 인물들을 딱딱한 수학자나 과학자가 아니라 생생한 인간으로 만나게 된다. 이 책의 첫번 째 뛰어난 점이다.

베이즈 접근은, 추론 과정에 연구자의 주관적 판단이 들어간다는 이유로 학계, 특히 통계학계에서는 철저하게 배제되었다. 베이즈 정리를 언급하면 대학에서 자리를 얻을 수 없을 정도였다.

반면에 실제 문제를 풀어야 하는 현업에서는 비교적 다양한 분야에서 수용되었다. 그러나 베이즈 접근이 본격적으로 대중화되기 위해서는 정적분 계산이라는 산을 넘어야 했다. 베이즈 정리의 분모에 적분이 들어가는데, 변수가 많아지면 그 계산은 종이와 연필, 계산자, 혹은 계산기를 사용해서는 거의 불가능했다.

다행히 1980년대 이후 한편으로 몇 명의 탁월한 학자들에 의해 그에 대한 해법이 발견되고, 다른 한편으로 컴퓨팅 환경이 급격히 향상하면서 비로소 대중화의 길이 열렸다. 1989년 발표된 마르코프 연쇄 몬테카를로(Markov Chain Monte Carlo, MCMC) 방법이 어려운 적분을 대체하게 되었다. 베이즈 추론이 계산의 악몽에서 벗어난 것이었다.

저자인 샤론 버치 맥그레인(Sharon Bertsch McGrayne)은 그러한 발전에 누가 어떻게 기여했는가를 어렵지 않게 기술하고 있다. 책에는 베이즈 추론을 위한 핵심적인 개념들과 절차들의 발견이 모두 망라되어 있다.

베이즈 추론과 관련된 수많은 사건들이 상세하게 기술된 점도 이 책이 흥미 진진하게 읽히는 이유이다. 드레퓌스 사건, 이차대전시 독일군 암호의 해독, 보험업계의 발전, 폐암 원인의 규명, 냉전시 소련 핵잠수함의 추적, 연방주의자 논고의 분석 등 신기한 스토리가 끝이 없는 듯이 이어진다. 이 책의 두번 째 매력이다.

6백쪽이 넘는 책이라 하루이틀 사이에 읽기는 힘들지만, 책을 한번 손에 잡으면 쉽게 놓을 수 없도록 이야기들이 박진감 넘치게 전개된다. 베이즈 추론에 관심을 가진 사람들, 베이즈 추론 자체에는 관심이 없더라도 학자의 삶에 대해 관심이 있는 사람들, 학문과 현업, 학문과 전쟁, 학문과 행정, 그리고 순수 학문과 응용 학문의 관계에 관심있는 사람들이라면 누구나 이 책으로부터 커다란 흥미와 교훈을 발견하게 될 것이다.

한 마디로 멋진 책이다. (2016/04/15/윤영민)

학문 분야의 판별: 사회학을 중심으로

최근 학문에서 융합이 대세인 듯하다. 그러나 실제로 융합적인 연구가 얼마나 활발하게 일어날 지 의문이다.

학문의 오랜 역사는 특정 분야를 중심으로 하는 융합이 결코 성공적일 수 없음을 보여준다. 고대 이래 철학, 수학, 신학, 사회학, 물리학, 생물학….통합적 체계를 꿈꾸었던 어떤 시도도 성공하지 못했다. 특정 분야의 이론이나 연구방법이 학문에 있어 보편적인 적합성을 갖는다는 것이 애당초 불가능하고, 또한 무엇을 위한 융합인지, 누구를 위한 융합인지가 분명치 않은 데다, 현실적으로 분과 학문 사이의 제도적 칸막이가 워낙 강고하기 때문이다.

설령 실용적인 이유로 인해 학문간의 넘나듦이 활발하게 일어난다고 해도 융합보다는 협업의 형태가 아닐까 예상된다. 그런데 협업은 참여자들이 자신의 정체(identity)와 역할을 분명히 인식하고 있을 때 더욱 잘 진행된다. 협업을 방해하는 불필요한 경쟁이나 오해를 예방할 수 있기 때문이다.

다른 영역과 마찬가지로 학문간의 경계도 유동적이다. 그렇다고 특정 시점에서 분과 학문의 판별이 불가능한 것은 아니다.

an-introduction-to-sociology-20-728

사회학개론 교과서에 나오는 이 구분은 매우 사회학답다. 그러나 이러한 추상적인 구분은 누구에게도 도움이 되지 않는다. 좀 더 현실적인 구분을 생각해보자. 사회학을 중심으로 생각해 보면 학문의 구분에는 세 가지 기준이 적용될 수 있을 것이다.

첫째,  연구 주제에 의한 판별이다. 가장 흔히 채용되는 기준이다. 예컨대 연구 대상이 천체 현상이면 천문학, 생물이면 생물학, 질병이면 의학, 신이나 믿음이면 신학(종교학), 정치 현상이면 정치학, 국가행정이면 행정학, 경제 현상이면 경제학이 된다. 여기에 두 가지만 첨언해 보자.

학문에서 인과적 명제는 종속변수와 독립변수(들)로 구성된다. 설명하려고 하는 현상(즉, 결과가 되는 현상)은 종속변수(dependent variable)이고, 설명에 사용되는 현상(원인이 되는 현상)은 독립변수(independent variable)이다.

학문의 판별에서는 독립변수보다 종속변수가 중요하다. 예컨대 석, 박사 논문을 심사할 때 심사자들은 종속변수가 무엇인가에 대해서는 엄격하고, 독립변수에 대해서는 상대적으로 관대하다.

사회학에서는 불평등, 갈등, 고령화, 저출산, 가족, 성, 세대 차이, 커뮤니티, 사회연결망, 사회심리, 사회조직, 사회발전, 사회문화가 타당한 연구 주제로 인정받는데 어려움이 없다. 그러나 광고, 마케팅, 인공지능, 컴퓨터 소프트웨어, 컴퓨터 네트워크, 소셜미디어, 국제정치, 종의 진화 같은 연구 주제는 “그게 왜 사회학이지?”하는 정체성 논란에 부딪치곤 한다.

그러나 기초 학문의 경우는 연구 주제 선정에 관해 비교적 관대하다. 사회학, 철학, 수학, 물리학이 그렇다. 연구자가 논리적으로 방어만 잘 하면 무엇이든 타당한 연구 주제로 인정받는다.

학문간의 경계에 속한 주제이거나 복합적인 성격을 가진 주제도 있다. 예컨대 사회발전, 이노베이션, 확산 같은 주제가 그러하다. 그런 경우에 그 주제가 특정 분야의 정당한 연구 주제로 인정받는 것은 연구자의 능력과 노력에 달려 있다. 참고로 이차대전 이후 사회발전은 사회학, 경제학, 정치학, 심지어 인류학에서도 정당한 연구 주제로 인정받았다.

실천을 강조하는 학자나 학파의 경우도 분별이 어렵거나 무의미하다. 칼 마르크스를 어느 분야의 학자로 분류할까를 생각해 보면 금방 알 수 있을 것이다. 그는 경제학자이며, 사회학자, 철학자, 그리고 역사학자였다. 마르크스는 사회학 창시자 중의 일인으로 간주되고 있다.

important-people-in-sociology-11-728

둘째, 연구 방법에 의한 판별이다. 각 학문 분야는 내부적으로 발전시켜온 방법론이 있다. 과학이라고 이름 붙여진 실증적인 학문에서는 연구 주제 못지 않게 연구 방법이 학문적 인정을 받는 데 중요하다.

경험적 자료를 수집하는 데는 수많은 방법이 있다. 실험(또는 유사 실험), 설문조사, 문헌조사, 비교역사, 참여관찰, 심층인터뷰, 사례분석, 이차분석, 임상, 시뮬레이션 등등. 각 학문 분야마다 타당하다고 인정받는 방법들이 있으며, 그 방법을 사용하면 설령 연구 주제가 낯선 경우에도 특정 분야의 연구로 인정받을 수 있다.

사회학은 매우 다양한 방법을 타당하다고 인정한다. 그 이유 중의 하나는 사회학이 여러 가지 얼굴을 가지고 있다는 것이다.

사회비평으로서의 사회학, 사회과학으로서의 사회학, 사회운동으로서의 사회학이 있다. 역사적으로 볼 때 그 세 얼굴은 모두 사회학의 정당한 모습이다. 연구방법에 있어 그 세 가지의 사회학이 동일할 수 없다. 사회비평에서는 커뮤니케이션 측면이 강조되고, 사회과학에서는 과학적 엄밀성이 강조되며, 사회운동에서는 실천성이 강조된다.

사회학으로 인정받기 위해서는 채택된 연구방법이 주어진 여건에서 최선의 선택이었는가, 그리고 충분히 논리적인가가 중요하다. 그 어느 경우에도 논리적이 아니면 학문적 연구가 될 수 없다.

셋째, 준거틀(frame of reference)에 의한 판별이다. 연구자가 어느 학문 분과에 소속되어 있는가를 가지고 특정 연구의 분야를 판별하는 경우가 많다.

어떤 연구물이 어느 분야의 이론, 어느 분야의 문헌, 어느 분야의 연구자를 주로 인용하고 있는가, 그리고 어느 분야의 저널에 발표되었는가가 그것이 어느 분야에 속한가를 판별하는 기준이 되곤 한다.

연구자들은 자신의 연구를 가지고 어느 학문 분야에 말을 걸 것인가를 심사숙고해야 한다. 이 때 준거틀의 선정이 대단히 중요하다. 잘못하단 돈키호테로 간주될 수 있다.

특히 사회학처럼 경계가 불분명한 기초 학문에서 학문 분야의 판별에 있어 준거틀이 무엇보다 중요한 것 같다. 사회학이 무엇인가에 대해 가장 실용적인 답은 사회학자가 하는 연구라는 주장이 있을 정도이다.

학문은 진리와 진실을 추구한다. 그러나 허공에서 그러한 것은 아니다. 무엇이 진리이고, 무엇이 진실인가는 학자 커뮤니티가 판단한다. 학자 커뮤니티는 오류를 범할 수 있다. 그러나 진리와 진실에 관한 객관적인 판단 기준의 존재가 의심받는 시대에 학자 커뮤니티의 합의는 그래도 진리와 진실을 발견하는 차선이 되지 않겠는가.

연구자(그리고 심지어 대학생도)가 자신이 어느 학자 커뮤니티에 속해 있는가를 아는 것은 생각보다 중요하다. 그것은 정체성의 문제이면서 생존의 문제이다.

라플라스, 수학이 자유를 주다

laplace-transform-2-638

피에르 시몽 라플라스(Pierre-Simon Laplace). 나의 새로운 역할 모형(role model)이다. 역할 모형을 갖기에는 너무 늦은 나이인가. 그는 1749년 3월 23일에 태어나 1827년 3월 5일 서거했다. 78세.

프랑스 혁명, 나폴레옹 전쟁 등 혁명과 반혁명, 그리고 전쟁이 번갈아 일어나던, 인류 역사상 가장 극심한 격변과 혼란의 시대에 그는 오래 살았다. 그런데 가장 부러운 부분은 그가 그렇게 오래 살았다는 점이 아니라(장수가 부럽지 않다는 말은 아니다), 그가 말년에도 학문적 성과를 계속 내고 있었다는 사실이다. 우리에게 익숙한 아래와 같은 베이즈 정리의 일반 공식을 발표한 것도 60세가 넘어서였다.

이 방정식을 말로 설명하면, 사건 가 발생했을 때 그것의 원인이 일 확률 는, 원인 가 주어졌을 때 사건 가 발생할 확률 에, 이것이 일어날 확률에 대한 최초의 추정치인 를 곱한 수를 가능한 모든 원인에서 사건 가 발생할 확률(사건 의 전체 확률)로 나눈 값과 같다.

뿐만이 아니다. 확률이론의 꽃이라고 할 수 있는 중심극한정리(Central Limit Theorem)을 발표한 것도 61세 때이다.

그리스 신화에서는 마이다스(Midas)가 손을 대는 것마다 모두 황금으로 바뀐다. 마찬가지로 라플라스가 손을 대는 것마다 모두 수학으로 바뀌었다. 수학 자체는 물론이고, 천체 역학, 물리학, 생물학, 지구과학, 통계학, 군사학, 인구학, 법학, 사회과학 그리고 신의 존재까지 그의 손을 거치면 모두 수학적 탐구 대상으로 바뀌었다.

오늘날의 관점에서 그의 전공이 무엇이었나고 묻는 것은 부적절하다. 그의 영혼은 결코 어느 한 학문 분야에 갇힐 수 없었다. 그의 호기심은 지칠 줄 몰랐고, 그는 수학이라는 도구를 가지면 세상의 어떤 문제에 대해서도 해답을 찾을 수 있으리라 확신했던 것 같다.

계량 사회과학의 발전에 가장 크게 기여한 사회학자로 간주되는 던컨(Odis Dudley Duncan)은 회고록에서, 자신이 평생 방법론을 공부했던 이유가 자유를 얻기 위해서였다고 밝혔다.

라플라스는 바로 그러한 자유인이 아니었을까. 전공이 무어냐는 물음이 모욕이 되는 학문적 유목민 말이다. 오늘날이라고 그런 유목민이 존재할 수 없을까.

인간 vs 인공지능, 진실은 어디에?

cyborg1-sjtek-umeshcom-10-728

10여년 전 <나는 왜 사이보그가 되었는가>라는 역서가 출간되었다. 영국의 리딩대학교(University of Reading)의 저명한 인공지능 연구자인 케빈 워릭 교수의 저서였다. 5백쪽이 넘는 책을 단숨에 읽었다. 그리고 다음 학기에 내 수업의 교재 중 하나로 채택했다.

그는 팔에 실리콘 칩으로 된 트랜스폰더를 이식했다. 그리고는 영국에서 인터넷을 통해서 미국에 있는 부인에게 신호를 전달하는데 성공했다. 덕분에 그에게는 최초의 인간-사이보그(cyborg)라는 별칭이 붙었다.

그 책을 읽힌 다음 나는 수업시간에 학생들에 물었다.

“자신이 90% 이상 사이보그라고 생각하는 사람 손 드세요?”

“자신이 70% 이상 사이보그라고 생각하는 사람은?”

“자신이 50% 이상 사이보그라고 생각하는 사람은?”

“자신이 30% 이상 사이보그라고 생각하는 사람은?”

“자신이 결코 사이보그라고 생각하지 않은 사람은?”

절대 다수의 학생들이 자신은 30% 이상 사이보그라고 대답했다. 워릭 교수는 결코 인간 최초의 사이보그가 아니었다. 사이보그가 되는데 몸에 굳이 칩을 이식할 필요가 없었다. 칩은 다만 상징일뿐.

통신 네트워크는 이미 매클루언적 의미에서 우리의 신체적(그리고 정신적) 연장(extension of body)이다. 인터넷과 스마트폰이 발명된 이후 우리는 아침에 눈 뜨면서부터 밤에 잠자리에 들 때까지 끊임없이 ‘접속’ 되어 있다. 그리고 우리의 두뇌 기능은 상당 부분 네트워크에 아웃소싱되어 인터넷과 스마트폰 없이는 우리는 제대로 생각할 수조차 없다. 그래도 단지 몸에 기계를 이식하지 않았다는 이유만으로 우리가 사이보그가 아니라고 자위할 것인가.

이세돌과 알파고의 대결에 관한 수많은 논의들 속에서 나는 다시 한번 인간과 기계 사이에 대한 범주착오(category mistake)를 본다. 알파고는 바둑에서 승리만을 미션으로 수행하는 인공지능이다. 인공지능이 아무리 뛰어난 계산, 판단, 추론 그리고 행동을 한다고 해도 그것은 프로그램된 존재(programmed being)이다.

그런데 우리는 프로그램된 존재가 아닌가? 유치원 때부터, 아니 심지어 어떤 아이들은 그보다 더 일찍부터 생존경쟁에서 이기도록 프로그램되고 있지 않는가? 지금 우리가 아이들에게 심어주려고 하는 알고리즘들은 오직 승리라는 목적만을 위해 사용되도록 개발된 것들이 아닌가? 우리가 가정과 학교에서 생존의 전사를 길러내고 있고 있음을 누가 부정할 것인가.

인공지능의 응용에서 가장 앞서 가는 업체 중 하나인 보스턴 다이내믹스(Boston Dynamics)가 생산하는 로봇이 어디에 일차적으로 사용될 것인가? 아마도 그것은 전투일 것이다.

Lance Cpl. Brandon Dieckmann, (front), native of Las Vegas and Pfc. Huberth Duarte, from Riverside, Calif., and infantrymen with India Company, 3rd Battalion, 3rd Marine Regiment, prepare to walk with the Legged Squad Support System through a grassy area at Kahuku Training Area on Oahu, Hawaii, July 12, 2014, during the Rim of the Pacific 2014 exercise. The LS3 is experimental technology being tested by the Marine Corps Warfighting Lab during the Advanced Warfighting Experiment. It is programmed to follow an operator through terrain, carrying heavy loads like water and food to Marines training. There are multiple technologies being tested during RIMPAC, the largest maritime exercise in the Pacific region. This year's RIMPAC features 22 countries and around 25,000 people. (U.S. Marine Corps photo by Cpl. Matthew Callahan/RELEASED)
The LS3 is experimental technology being tested by the Marine Corps Warfighting Lab during the Advanced Warfighting Experiment. It is programmed to follow an operator through terrain, carrying heavy loads like water and food to Marines training. There are multiple technologies being tested during RIMPAC, the largest maritime exercise in the Pacific region. This year’s RIMPAC features 22 countries and around 25,000 people. (U.S. Marine Corps photo by Cpl. Matthew Callahan/RELEASED)

장 보드리야르(Jean Baudrillard)의 인식 방법을 빌리자면, 알파고와, TV와 인터넷을 통해서 전세계에 중계된 이세고와 알파고의 바둑 대결은, 이미 우리 자신이 프로그램된 존재이고 우리 사회가 그런 전사들이 지배하는 황폐화된 전장임을 은폐하는 쇼가 아닐까? 기술비평가들은, 그리고 그 비평가들의 언설을 통해서 우리는 짐짓 진지하게 인간성(humanity)을 다시 생각한다. 그런데 그것은 하나의 의례(ritual)로 끝날 뿐이다. 언제 그랬냐는듯이 우리는 다시 생존의 ‘전장’으로 내몰리고 기꺼이 전투 모드로 돌아온다. 하나의 슬픈 코메디다.

미래 사회에서 우리를 지배하는 존재는 인간도 인공지능도 아닐 것이다. 그것은 거대한 시스템(system)이리라. 오직 최고의 이윤과 효율성만을 덕성으로 인정하는 비정한 시스템 말이다. 창의성도, 사랑도, 공감도, 인격도, 자연도, 인문학도, 심지어 비극마저도 돈이 될 때만 그 가치를 인정받는 시스템. 이미 그 시스템은 프로토타입(prototype) 수준을 넘어 우리 사회의 실제(reality)가 되어 있다.

진실로 우리가 인간이기를 바란다면 그 시스템에 싸움을 걸어야 할 것이다. 그런데 우리는 진실로 인간이기를 바라기나 하는 걸까? (2016/3/31, 윤영민)

bladerunnerroybatty
영화 Blade Runner의 한 장면. 인조인간 레플리컨트(replicant)와 레플리컨트를 사냥하는 인간 블레이드 러너 중 누가 더 인간적인가를 생각하게 하는 장면이다. (블레이드 러너 조차 인조인간이 아닌가하는 해석도 있다.)

이 시대를 이해하는 키워드

현대 사회는 마치 신기루 같습니다. 얼마나 빠르게, 얼마나 다양하게 자신의 모습을 바꾸는지 어떤 천재의 눈에도  쉽게 잡히지 않을 정도입니다. 그렇다고 손을 놓고 있을 수는 없겠지요. 어차피 우리는 살아야 하고 기왕에 살아야 한다면 잘 살아야 하니까요.

급변하는 세상에서는 자기가 태어난 땅에 살면서도 마치 이민자가 되어 낯선 세계에 살고 있는 것이나 마찬가지입니다. 우리 자신이 살고 있는 사회가 하루가 다르게 변하기 때문이지요.

그런데 성공적인 이민자들이 이민가서 가장 먼저 하는 일은 투자를 하는 것이 아니라 그 사회를 잘 이해하는 것입니다. 그래야 적응도 잘 하고 사업도 잘 운영할 수 있을테니까요.  마찬가지로 우리도 현재의 사회를 이해하려는 노력이 필요합니다.

지난 가을 교육부가 개통한 온라인 대학교육 서비스인 K-MOOC에 제가 <정보사회학 입문>을 개설한 이유는 이웃들이 새로운 세상를 이해하는데 조금이라도 도움이 되기 위해서였습니다.

그 강의에서 저는 현대 사회를 이해하는데 실마리가 되는 일곱 가지 키워드를 선정하고 그 키워드에 관련된 고전을 중심으로 현대 사회를 분석했습니다. 프라이버시, 맥도날드화, 위험사회, 유희, 네트워크, 연극공연, 그리고 선물경제가 제가 고른 키워드입니다.

SAMSUNG CSC

저는 공부하다가 난관에 부딪치면 고전에서 지혜와 영감을 구하곤 합니다. 이 강의에서 그런한 저의 노력을 이웃들과 공유하고자 하였습니다. 다만 저는 고전 문학에서 영감을 구하는 경우도 적지 않습니다만 과목의 성격상 강의에는 사회과학 고전만 포함시켰습니다.

4월 1일에 한양대학교 K-MOOC  서비스가 다시 시작됩니다. 이번에는 7주 동안 학기가 진행됩니다. 수강생들, 담당 교수, 그리고 운영진의 소통을 위해서 페이스북에 그룹(‘K-MOOC 정보사회학 입문’)을 만들었습니다.

지난 학기에는 9백명 정도가 <정보사회학 입문>을 수강했습니다만, 이번 학기에는 그보다 적은 수가 수강하지 않을까 예상합니다. 덕분에 수강생들과 함께 대화할 기회가 좀 더 많을 것 같습니다.

많은 관심을 부탁드립니다. 윤영민 배상.

디지털 시대의 사회조사 전문가

skopos_tmimatos

신입생들을 면담했더니 몇몇이 ‘사회조사분석사’라는 자격증에 관심을 보였다. 우리 학과 졸업생 중 사회조사분석사 자격증을 딴 학생들이 심심치 않게 눈에 띄는 걸 보면 그 자격증에 대한 학생들의 관심이 어제오늘이 아니었던 것 같다.

그런데 사실 나는 그 자격증의 실효성은 물론이고 시대적 적합성에 대해 무척 회의적이다. 사회조사방법과 사회통계학에 대한 지식을 테스트하는데 그 내용이 많이 낡았다. 기존에 개설된 관련 과목들을 제대로 수강했으면 누구나 합격할 수 있는 내용과 수준이다. 문제는 그것이 현장에서 사회조사자(social researcher)가 수행해야 하는 역할과의 불일치가 너무 심하다는 사실이다. (통계청 사이트의 사회조사분석사 검정자격기준을 참고하기 바람)

사회조사분석사가 1급과 2급으로 나누어 있듯이 사회조사자에도 다양한 수준이 있을 것이다. 하지만 오늘날과 같은 디지털 시대에 사회조사자가 갖춰야할 전문적 지식과 능력은 다음과 같지 않을까?

사회조사자는 (1) 무엇보다 주어진 과제를 연구문제(research question)로 번역할 수 있어야 할 것이다. 사회조사는 규칙적인 사회 현상(social regularities)에 관련된 의문이나 쟁점에 대한 해답을 얻는데 필요한 실증적 근거를 만들거나 찾는 작업이다. 규칙적인 사회현상에는 사회문제(social problems), 사회적 쟁점(social issues), 사회적 의문들(social questions), 혹은 사회학적 의문이나 쟁점(sociological questions or issues)이 포함될 수 있다. 사회현상에 대해, 왜 그럴까, 어떤 상태인가, 앞으로 어떻게 될까, 누구의 주장이 옳은가, 어떤 해법들이 있을까, 어떤 해법이 상대적으로 더 바람직한가 등에 대한 답을 제시하는데 있어 실증적 근거를 확보하는 것이 사회조사라고 할 수 있다.

최근 예측분석학(predictive analytics)에서 다루는 것 같은 개인의 행동에 대한 예측이 사회조사의 연구에 포함되어야 하는가는 논란이 될 수 있다. 전통적으로는 분명 아니다. 그러나 빅데이터 환경의 등장과 더불어 사회조사자가 ‘예측분석’ 능력을 갖추는 것은 거부할 수 없는 트렌드가 될 것으로 예상된다.

사회조사자는 (2) 주어진 의문과 여건 아래에서 무엇이 가장 효과적이고 효율적인 연구방법인지를 판단할 수 있어야 한다. 설문조사, 실험, 심층면접, 참여관찰, FGI, 델파이, 예측(forecasting), 이차분석(secondary analysis), 시나리오 플래닝(scenario planning) 등과 같은 전통적인 연구방법은 물론이고, 구글링(Googling), 모델링(modelling), 컴퓨터 모의실험(computer simulation), 집단지성, 데이터과학(data science), 사회연결망 분석(social network analysis) 등과 같은 새로운 연구방법이 고려되어야 한다.

사회조사자는 (3) 자신이 그러한 방법을 혼자서 수행하거나 타인이나 기관(혹은 기업)과 협업을 통해서 수행할 수 있는 능력이 있어야 한다. 모든 연구방법을 구사할 수 있는 사람은 없을 것이다. 중요한 점은 어떤 방식으로든 최선의 답을 얻어낼 수 있어야 한다는 것이다. 사실 오늘날 그것은 대부분의 경우 협업을 통해서 가능하다. 특히 해당분야 전문가, 통계학자, 수학자, 혹은 컴퓨터 프로그래머와의 협업이 필요하다.

흔히 제도는 변화를 따라오지 못한다. 제도의 장점이면서 동시에 단점은 쉽게 변하지 않는다는 사실이다. 안정적인 시대에는 제도가 힘을 발휘하지만 급변하는 시대에 제도는 시대착오적이 되곤 한다.

현재 사회조사분석사라는 제도가 후자에 해당되지 않나 싶다. 사회조사분석사가 디지털 시대에 있어 사회조사 능력을 보증하는 자격증이 되지 못하고 있다.

 

미래 예측의 세계

A businessman is consulting a crystal ball to foretell the future.

한 동안 나는 대학과 기업체에서 시나리오 기법을 강의했다. 시나리오 기법은 강력한 미래예측 방법 중 하나이다. 대학의 학부에서는 <미래학입문>이라는 타이틀로 시나리오 플래닝을 강의하다가 중단한 지가 4~5년 되었고, 일반인을 대상으로 한 온라인 강의 <미래고객 발굴을 위한 시나리오 플래닝>은 아직 서비스되고 있다.

미래학 수업을 중단한 이유는 세 가지이다.  첫째는 내 관심이 다른 분야로 이동했다. 소셜미디어, 집단지성, 데이터 사이언스와 같은 새로운 분야를 공부하는데도 시간이 넉넉하지 않았다. 둘째는 미래학 강의가 너무 부담스러웠다. 다루어야 할 내용은 많은데 학생들은 한 학기 동안에 시나리오 방법 하나 소화시키기도 힘겨워 했다. 셋째는 미래학의 이름으로 자신의 지적 불성실함을 감추려는 자들이 너무 많다. 그 분야에는 제사보다는 젯밥에 관심이 많은 자들이 넘친다.

그럼에도 불구하고 미래를 읽는 일은 참으로 흥미있다. ‘미래학’은 좀 엉터리일지 몰라도 말이다. 그런데 미래 전망은 과거에도 점성술이나 사주처럼 특별한 능력이 요구되었듯이 지금도 범상치 않은 능력을 요구한다. 그것이 함정이다. 일반인들에게도 그런 능력을 나누어 줄 수는 없을까.

사실 미래예측에 있어 중요한 것은 기술이나 기법이 아니다. 핵심은 문제의식이다. 문제의식은 네 가지 점에 대한 첨예한 인식으로 구성된다. 1) 예측하고자 하는 문제(questioning)에 대한 분명한 규정, 2) 예측하려는 문제의 불확실성(uncertainties)의 정도와 성격에 대한 정확한 인식, 3) 예측에 가용한 자원(available resources)에 대한 파악, 그리고 4) 얼마나 신속하게, 그리고 얼마나 정확하게 예측해야 하는가 하는 요구 조건(demanding conditions)의 인식이 필요하다. 이 네 가지에 대한 대답에 따라 미래전망의 효과적인 접근방법이 달라진다.

예컨대 시나리오(scenario) 방법은, 거시적 전망에 사용되는데, 전체적으로 불확실성이 상당히 크고,  연구자(혹은 연구의 클라이언트)가 관여하여 결과에 영향을 미칠 수 있는 가능성이 거의 없을 때 사용된다. 이 방법은 최적의(optimal) 해법 대신에 강고한(robust) 해법을 찾는다. 즉, 미래가 어느쪽으로 전개되더라도 잘 살아남을 수 있는 방법을 찾는다.

그런데 미래 읽기에 시나리오 방법만 있는 것이 아니다. 사실 미래 예측이나 전망에 가장 널리 사용되는 것은 이론(theory)이다. 각 영역(domain)에는 학자와 전문가들이 오랜 세월에 걸쳐서 개발해 놓은 이론들이 적지 않다. 이론은 보편적이거나 일반적인 인과관계(causal relations)를 담고 있기 때문에 미래 읽기의 강력한 도구가 된다. 이론의 가장 큰 장점은 미래 예측에 비용이 적게 들고 신속한 판단이 가능하다는 것이다.

수학도 이론에 못지 않게 유용할 수 있다. 자주 비현실적인 전제(assumptions)가 문제가 되기는 하지만 수학적 전개는 결정적(deterministic) 예측을 가능하게 해준다. 마르코프 연쇄(Markov chains)나 베이즈 추론(Bayesian inference)은 수학적 전망의 예가 될 수 있을 것이다. 수학적 해답이 불가능할 경우 통계적 근사(statistical approximation)가 유용한 대안이 된다.

아마도 미래 전망에 가장 애용되는 방법 중 하나가 바로 통계학일 것이다. 여론조사를 통한 선거 예측, 전문가 델파이 기법 등의 예를 들 수 있다. 최근 네이트 실버(Nate Silver)는 베이즈 추론을 이용해서 운동 경기와 선거 예측에 놀라운 혁신을 가져오기도 했다(참고로 FiveThirtyEight을 볼 것).

경제 예측(economic forecasting)에는 시계열 분석(time-series analysis)이 자주 사용된다. 그것은 기본적으로 현재까지의 추세(trend)를 연장시켜서 전망하는 외삽법(extrapolation)이다. 이 방법은 불확실성이 비교적 작을 때 유용하다.

컴퓨터와 인터넷이 발달한 후에는, 조건부 모의실험(what-if simulation)(사례: 기후변화 정책 결정을 위한 시뮬레이션)이나 집단지성(사례: Hollywood Stock Exchange)이 널리 사용되고 있으며, 빅데이터가 이용가능하게 되면서 예측 분석(predictive analytics)(사례: 수술 환자의 위험 예측)이 크게 확산되고 있다. 예측분석은 미시적 전망(개인에 관한 전망)에 촛점이 맞춰져 있다.

불확실성이 너무 커지면 백약이 무효하다. 그저 열심히 기도하는 게 상책이다. 그리고 자신이나 자신의 클라이언트가 개입해서 미래의 전개에 영향을 줄 수 있다면 객관적인 미래를 물을 것이 아니라 자신이나 자신의 클라이언트가 원하는 미래를 규명하는 것이 가장 중요할 것이다.

위에 언급된 방법들 중 쉽게 터득될 수 있는 것은 없다. 상당히 깊은 지식과 실전 경험이 필요하다. 그러나 그렇다고 무지가 양해되지는 않는다.

창조주를 제외하고 불확실성을 완벽하게 다룰 수 있는 자는 없다. 그래도 다행인 것은, 우리가 항상 세상에 애정을 갖고, 부지런히 자신이 지닌 지식과 도구를 갈고 닦으며, 그리고 무엇보다 욕심을 버리면 세상과 사람의 미래가 비교적 잘 읽힌다는 사실이다.

 

‘율도국’에 나타난 ‘어린 왕자’

SAMSUNG CSC 어제 저녁 집 근처의 장성 군립도서관에서 열린 고전 소설 독서 동아리 모임에 갔다. 지난 달 10여명이 모여서 시작했는데, 어제 열린 첫 모임에 주최측인 군립도서관 직원 두 명과 나, 그렇게 3 명이 참석했다. 참석자는 적었지만 우리는 <홍길동전>과 <어린 왕자>를 가지고 두 시간이 넘도록 즐거운 대화를 나누었다. 참석자가 적어서 다행히 실컷 얘기를 나누었던 것 같다.

3백 여년 전 조선 최고의 진보적 지식인이었던 허균은 <홍길동전>에 자신의 유토피아 기획을 제시했다. 처절한 임진왜란과 정유재란을 거친 16세기말 조선은 전쟁과 궁핍의 공포에서 벗어나지 못하고 있었을 것이다. 게다가 적서 차별, 부정부패 등 정치와 사회현실도 백성들의 눈에는 절망적 상태였으리라. <홍길동전>에는 그러한 시대에 대한 허균의 인식이 깊이 베어 있다.

작품 속 홍길동은, 조선 최고의 성군이었던 세종대왕의 치세에, 재상의 집안에서, 영웅적 자질을 완벽하게 갖춘 서자로 세상에 태어났다! 아, 얼마나 비극적인 상황 설정인가. 엄격한 노예제, 신분제의 사회인 조선 초기에 서자로 태어났다! 그것도 영웅호걸의 자질을 두루 갖추고 재상의 집안에서…. 허균은 초인적 영웅이 나타나 자신의 유토피아를 실현시켜주길 소망했으리라.

그가 의적의 모습으로 오던 왕의 모습으로 오던 그것은 중요하지 않다고 생각했을 것이다. 의적떼 활빈당 수령 홍길동은 조선을 구제하지 못하고 결국 조선을 떠나 율도국의 왕이 되지 않는가. 허균은, 세종대왕이라는 최고의 성군과 홍길동이라는 초인적 영웅의 만남을 사회 개혁과 혁신을 낳지 못한 채 끝나게 만든다.

적서차별로 대변되는 모순된 사회구조는, 시대를 앞서간 혁명가 허균에게도 도전하기에 너무 벅찬 상대였을 것이다. 그래서 허균은 홍길동과 활빈당이 조선의 율법이 미치지 않은 율도국에서 유토피아를 건설하게 만든다. 그것도 홍길동이 왕이 되어서 말이다.

허균은 율도국이라는 유토피아를 이렇게 그린다. “새 왕이 왕위에 오른 후에 시절이 태평하여 풍년이 들고, 나라와 백성이 편안하여 사방에 일이 없고, 임금이 베푼 덕이 온 나라에 퍼져 길거리에 물건이 떨어져 있어도 주워가는 이가 없었다(101쪽).” 허균은 홍길동이 영웅의 꿈을 이루었다고 칭송하면서 이야기를 마친다. “아름답구나! 길동이 행한 일들이여! 자신이 원한 것을 흔쾌하게 이룬 장부로다. 비록 천한 어미 몸에서 태어났으나 가슴에 쌓인 원한을 풀어 버리고, 효성과 우애를 다 갖춰 한 몸의 운수를 당당히 이루었으니, 만고에 희한한 일이기에 후세 사람에게 알리는 바이다(105쪽).” 전쟁이 없고, 백성의 육신이 편안하고 부유하게 사는 사회가 율도국에 실현시킨 허균의 유토피아이다.

그런데 과연 율도국 사람들은 행복했을까? 왕이 된 홍길동과 그 집안은 틀림없이 행복했을 것이다. 그러나 그 ‘유토피아’에서 백성들도 과연 두루두루 행복했을까?

생텍쥐페리의 <어린 왕자>는 바로 ‘율도국’에 대한 문제 제기이다. <홍길동전>이 끝나는 지점에서 <어린 왕자>의 이야기가 시작된다. ‘율도국’을 찾아온 ‘어린 왕자’는 유토피아의 어른들이 얼마나 세상을 잘못 살고 있는 지를 보여준다.

우리 사회는 허균이 율도국에 그렸던 유토피아를 이루었다. 적어도 경제적 측면에서 말이다. 오늘날 우리 국민의 대다수는 조선 시대의 귀족은 물론이고 왕보다 더 잘 먹고 더 잘 입고 더 좋은 집에 산다. 길거리에 물건이 떨어져 있어서 주워가는 사람이 없기도 하다. 물건 나름이기는 하지만. 그런데 그 유토피아의 주민은 세상에서 가장 불행한 국민이다. 자살률 1위, 자살 증가율 1위, 노인빈곤율 1위 등등 어느 지표로 보아도 우리 국민은 세상에서 가장 불행하다.

<어린 왕자>는 유토피아에서도 사람들이 불행할 수 있음을 깨우쳐 준다. 권위와 지배, 부유함과 편리함, 그리고 일에 집착한 사람들(‘어른들’)은 무엇이 삶에 진정으로 소중한 것이며, 무엇을 위해 살아야 하고, 어떻게 살아야 하는가를 판단할 수 있는 감각을 잃어버렸다. 성장의 댓가인지도 모른다.

<어린 왕자>는 독자를 발가벗기는 거울이다. 우리의 민낯, 몸뚱이, 그리고 마음 속까지 남김없이 보여주는 무서운 거울이다. 초인적 영웅들은 유토피아의 기반을 만드는 데 기여했다. 그러나 영웅의 역할은 딱 거기까지이다. 진정 행복한 유토피아를 실현하는 데 영웅들이 해결해 줄 수 있는 일이 거의 없다. 아니 초인적 영웅을 기다리는 한, 영웅 의존성을 버리지 못하는 한 우리는 결코 행복한 유토피아를 실현할 수 없을 것이다.  유토피아는 모두가 서로 도우며 살아가는 사회이기 때문이다.

소통 언어로서의 수학

SAMSUNG CSC

<수학의 정석>의 초판이 발행된 지 딱 50년이 되었다고 한다. 그 동안 그 책은 4천5백만부가 팔려서 우리나라에서 성경 다음으로 인기 있는 책이라는 명성을 얻었다. 심지어 어떤 비평가는 모 중앙 일간지의 ‘내 인생의 책’이라는 컬럼에 그 책을 올리기도 했다.

나는 스무살 때 어느 작은 학원의 단과반에서 <수학 1정석>을 가르친 인연도 있다. 그러나 나는 <수학의 정석>에 그렇게 후한 점수를 줄 수 없다. ‘정석’이라는 걸맞지 않은 이름으로 우리나라 수학 교육의 방향을 오도하는데 일조했다고 생각하기 때문이다.

<정석>은 우리나라의 문화에 수학이 계산을 하는 도구라는 인식을 뿌리박게 하는데 기여했다(심지어 수학을 암기 과목으로 만들었다는 의심도 있다). 그것은 수많은 개인들에게는 물론이고 국가적으로도 불행한 일이었다.

수학은 다른 더 중요한 얼굴을 가지고 있기 때문이다. 소통의 도구 혹은 하나의 언어로서의 수학이다. 수학은 신(god)의 언어라는 갈릴레오의 믿음까지는 아니더라도 동서양을 막론하고 뛰어난 인류의 스승들은 수학이 우주의 질서를 이해하는데 훌륭한 도구라는 사실을 의심하지 않았다.

<정석>으로 대변되는 우리나라의 수학 교육은 학생들로 하여금 그 점을 깨닫게 하는 데 완전히 실패했다. 사람들의 일상에서, 그리고 일상적 대화에서 수학이 얼마나 사용되지 않는가가 그 사실을 웅변적으로 증명한다. 수학은 영어, 한문, 일본어는 물론이고 프랑스어나 독일어만큼도 사용되지 않는다.

내가 재직하는 학과와 단과대학 졸업생 중 상당수가 광고업계로 진출한다. 광고업계에서는 “어떤 사용자가 내 클라이언트의 광고를 클릭할 가능성이 얼마나 될까?”는 매우 중요한 질문이 된다. 예를 들어 내가 수업시간에 어떤 학생으로부터, “교수님, 어떤 인터넷 사용자가 특정 광고를 클릭할 가능성을 어떻게 예측할 수 있을까요?”라고 질문을 받았다. 과연 내가 수학을 사용하지 않고 그 질문에 명쾌하게 답할 수 있을까?

이렇게 답할 수 있을 것이다.

“광고를 클릭할 확률의 로짓(logit)을 예측하는 로지스틱 회귀모형을 구성하고, 훈련데이터세트로 그 모형의 모수(parameters)를 구하면 가능하다.”

그러면 학생들이 고개를 끄덕거릴까? 결코 아니다. 학부는 물론이고 대학원 수업에서도 그런 대답은 학생들을 혼란에 빠트릴 것이다.

우리가 궁금한 것은 어떤 사용자가 우리의 광고를 클릭할 것인가 말것인가이기 때문에 그것은 범주적 변수(categorical variable)이고, 그 변수는 1(클릭함)과 0(클릭하지 않음)이라는 값(범주)를 가질 것이다. 그러면 수학적으로 이렇게 표현될 수 있다.

광고를 클릭할 확률()은 라는, 독립변수들()의 좀 복잡한 선형함수로 나타낼 수 있다.  여기서 는 지수함수를 가리킨다. 승산(odds)이라는 개념을 이용하면 이 식을 좀 더 간략히 나타낼 수 있다.

좌변은 광고를 클릭할 확률광고를 클릭하지 않을 확률로 나눈 승산(odds)이다. 광고를 클릭할 승산은 독립변수들의 영향을 선형으로 더한 지수함수이다. 여기서 양변에 log를 취하면 아래와 같다.

좌변을 로짓(logit)(혹은 승산의 자연로그, natural logarithm of the odds, 간단히 log-odds라고 부른다)이라고 부른다. 종속변수로 로짓으로 바꾸니 우리에게 익숙한 회귀 방정식(regression)이다. 만약 우리에게 이 광고에 관해 축적된 데이터가 있다면 와 를 어렵지 않게 추정할 수 있을 것이다. (참고로, 로지스틱 회귀(logistic regression)은 역로짓 함수(inverse-logit function)을 사용한다.)

좀 복잡해 보이지만 이 전개에는 고등학교 수준의 수학밖에 사용하지 않았다. 사실 나의 수학 실력도 고등학교 수준을 별로 벗어나지 않는다. 그나마도 40년 전에 배운 수학이다.

우리 사회에 매스포비아(math-phobia: 수를 두려워하는 사람)가 너무 많다. 우리 교육이 매스포비아를 양산하고 있는 것이다.

우리 사회는 빠른 속도로 수학과 통계학을 이용하는 기술 기반으로 바뀌어 간다. 그런데 우리의 학교 교육은 수학 ‘문맹자’를 양산하고 있다.