인간과 AI의 공존을 위한 대안의 모색

원본은 2019년 10월에, 한글본은 2021년 6월에 출판되었다. 왼쪽은 아마존 킨들 버전 표지이고 오른편은 한글 버전 표지이다.

최근 스튜어트 러셀 교수(Stuart Russell, UC Berkeley)가 또 하나의 역작을 냈다. 1995년 그가 구글의 피터 노빅(Peter Norvig)과 함께 출간한 Artificial Intelligence: A Modern Approach(옆 사진)는 AI에 관해 가장 널리 사용되는 교과서가 되었으며, 내 수업에서도 AI의 정의와 관련된 몇개의 장(chapter)이 소개되었다.

새 저서에서 러셀 교수가 제시한 주장을 간략히 요약하면 다음과 같다: 1) 머지않은 미래에 초지능(super-intelligence) AI가 출현할 것이다. 2) 그것은 인류에 중대한 위협이 될 수 있다. 3) 그러나 우리가 지금부터 AI의 개발 방향을 잘 잡아간다면 인간과 AI가 평화롭게 공존할 수 있을 것이다. 4) 그 방향은 “증명가능하게 이로운 AI(provably beneficial AI)”로 집약된다.

인공지능(Artificial Intelligence, AI)은 지능을 지닌 기계(intelligent machine)이다. 인공이라는 수식어는 자연발생적이 아니라 누군가(대체로 인간)에 의해 만들어졌다는 의미이고 지능이라는 명사와 합쳐져서 지능을 지닌 기계라는 특정한 의미를 지니게 된다. 여기서 기계는 물리적 외형을 가질 수도 있고 컴퓨터에 탑재된 소프트웨어일 수도 있다.  문제는 지능이 무엇인가 혹은 지능을 지녔다는 의미가 무엇인가이다.

러셀 교수는 지능을 다음과 같이 정의한다. “대강 말하자면, 한 존재는 자신이 하는 일이 자신이 지각해온 것을 토대로 자신이 원하는 것을 성취할 가능성이 있는 한 지적이다”(Roughly speaking, an entity is intelligent to the extent that what it does is likely to achieve what it wants, given what it has perceived)(p. 33. 이 글에서 인용 표기는 한글 버전의 쪽이다). 이 정의에는 인지(perception), 행동(action), 목표의 성취(achievement of objectives)라는 세 가지 요소가 담겨있다. 즉, 어떤 존재가 자신의(혹은 주어진) 목표를 갖고 있으며, 그와 관련해서 환경을 파악하고 그 목표를 성취하기 위해 행동하면 그 존재는 지적이(intelligent)라고 규정할 수 있다는 것이다.

필자는 지능에 관한 이 정의를 지지한다. 사실 필자는 3년 전에 지능에 대해 그와 유사한 정의를 내린 적이 있다(지능이라는 이름의 개임(4)). 당시에 필자는 환경에서의 생존을 모든 존재의 공통적이고 근본적인 목표로 보았기 때문에 지능을 환경으로부터의 도전에서 살아남는 능력이라고 규정하였다. 러셀 교수의 정의는 필자의 것보다 더욱 다양한 목표를 포용할 수 있다는 장점을 갖고 있다.

러셀은 현재 인공지능의 연구와 산업 분야에서 통용되고 있는 ‘표준적인 모형'(standard model of AI)에 이의를 제기한다. 그것은 인간이 부여한 정해진 목표를 기계가 최적화한다는 모형이다. 기계는 목표와 데이터가 주어지면, 목표로부터의 오차(사실 오차 제곱, 비용함수라고 부름)를 최소화하는 방식으로 학습하여 성취 능력을 향상시킬 수 있다. 최근에는 주어진 보상체계에 의지해서 기계 스스로 능력을 높여나가는 강화학습 모형이 널리 사용되고 있다. 

러셀은 실제로 초지능 AI(일반적 AI, general AI라고도 불림)의 개발을 목표로 하는 연구자나 기업이 존재하고 있고, 설령 그것을 목표로 삼지 않더라도 연구자들이 특수한 용도의 AI를 개발하는 과정에서 초지능 AI가 출현할 수 있다고 지적한다.

문제는 만약 궁극적으로 인간에 의해 통제받도록 설계되지 않으면 초지능 AI는 인간의 이익보다 AI 자신의 이익을 우선적으로 추구할 수도 있으며, 인간의 통제를 완전히 벗어날 수 있다는 것이다. 인간은 AI의 전기 코드조차 뽑지 못할 수도 있다. AI는 그러한 인간의 시도를 거부하고 방해할 수 있기 때문이다. 러셀에 의하면 현재의 표준 모형에 의한 AI의 연구와 개발은 언젠가 그러한 통제불능의 초지능 AI의 출현을 초래할 가능성이 높다.

초지능 AI의 관점에서 보면 그 AI의 표준 모형이야말로 AI 연구의 잘못된 길의 출발점이라는 것이 그의 주장이다. 그는 완전히 자율적인 초지능 AI의 출현을 차단하는 대안으로 그 표준모형을 대체할 지적이면서 이로운 기계(intelligent and beneficial machine) 모형을 제시한다. ‘지적인 기계(intelligent machine)’만으로는 충분하지 않다는 것이다. 그것은 지적인 동시에 반드시 ‘이로운 기계(beneficial machine)’이어야 한다.

러셀은 이로운 기계를 만들기 위한 세 가지 원칙을 제시한다. 첫째, 기계의 목적은 오로지 인간 선호의 실현을 최대화하는 것(이타성의 원칙)이어야 하며, 둘째, 기계는 그 선호가 무엇인지 처음에는 확실히 알지 못하고(겸손의 원칙), 셋째, 인간의 선호에 관한 정보의 궁극적 원천은 인간의 행동이다(인간 관찰의 원칙). 다시 말하면, AI는 어떤 경우에도 자신 혹은 자신의 존재를 인간의 선호보다 우위에 두어서는 안되며, AI는 목표에 대한 판단이 헷갈릴 때는 그것을 인간에게 묻거나 인간의 행동에 대한 관찰을 통해서 파악해야 한다. 어떤 경우에도 인간의 선호를 다 알고 있듯이 행동해서는 안된다는 것이다. 

러셀은 그러한 ‘증명가능하게 이로운’ AI 모형의 장래에 관해 낙관적이다. 그는 무엇보다 그러한 AI 모형이 표준적인 AI 모형보다 투자 기업들에게 더 매력적이며, 또한 인간의 선호를 학습하는데 필요한 자료가 아주 풍부하기 때문이라는 것이다.

이상은 책에 제시된 러셀 교수의 주장에 대한 간략한 요약이다. 그 책에 대한 요약은 아니다. 그 책에는 AI 발전에 관한 전망, AI의 오용에 대한 논의, 초지능 AI에 관한 다양한 주장과 태도에 대한 비판 등 AI와 관련된 다양하고 많은 논쟁과 그에 대한 논리적 검증이 제시되어 있다.

그 책에는 AI의 미래에 관해 다소 지루할 정도로 다양한 논의가 제시되고 있다. 어떤 독자는 그런 논의가 흥미롭다고 느낄 것이고 나아가 어떤 독자는 그러한 논의로부터 참신한 발상을 얻을 수도 있을 것이다. 여기서도 그러한 논의를 모두 사상하고 러셀 교수의 주장만 간추려 보았다. 그것만으로도 그 책은 충분한 가치를 지닌다고 생각되기 때문이다. (2021-07-25).  

‘가짜 뉴스’와 ‘진실’에 대해

‘가짜 뉴스’가 범람하고 진실은 그 속에서 실종되기 직전이라 생각되는 세상이다. 인터넷을 매개로 한 돈과 권력의 엄청난 추동력에 ‘가짜 뉴스’ 생산자는 폭발적으로 늘어가는 반면, 진실의 파수꾼은 급속히 설 자리를 잃어간다.

심지어 진실의 지킴이들마저도 이제 ‘진실’이 추구할만한, 수호할만한 가치가 있는 지 묻는 세상이 되어간다. 대학, 학자, 언론, 기자, PD, 종교인, 작가, 영화제작자, 감독 등 인류 역사상 진리의 발견자 혹은 수호자로 간주되었던 제도와 사람들이 모두 흔들리고 있다. 인터넷과 스마트폰과 같은 정보기술이 그들을 보호해 왔던 사회적 기제들을 송두리째 와해시켜버리고 있기 때문이다.

그래서 지금, 갑자기, ‘진실’이 무엇인지가 우주적 의문으로 떠올랐다. 그것은 시대적 문제인 가짜 뉴스 혹은 허위 정보를 정의하기 전에 반드시 답해야 할 질문이다. 우리에게,우리 삶에 있어 진실이 무엇인지, 진실이 추구할만한 가치가 있는지, 진실을 얼마나 감당할 수 있는지, 그리고 진실이 어떻게 만들어 지는 지를 명쾌히 이해해야 가짜뉴스를 규정하고 분석하고, 나아가 대안 마련도 가능하기 때문이다. 그래서 소위 가짜뉴스의 문제는 보다 근본적으로 진실의 문제인 것이다.

가짜뉴스를 다룬 저술은 대개 좁은 의미의 가짜뉴스를 분석하는 데서 멈추고 있다. 이 책은 그보다 한 걸음 더 들어가서 가짜뉴스와 진실의 문제를 바라볼 수 있도록 도와준다.

이 책은 진실이란 근본적으로 선택적이라는 입장이다. 그래서 어떤 사건에 관해 무엇이 진실인가라는 질문보다 누가 ‘어떤’ 진실을 말하는지, 누가 사실을 어떻게 ‘편집’하는지, 그리고 왜 그렇게 하는지에 대해 질문이 더 중요하다고 강조한다. 그렇게 함으로써 우리는 진실에 더 잘 접근할 수 있다는 것이다.

가짜뉴스와 진실의 문제에 대해 궁금한 사람들에게 이 책은 아주 유용하다고 생각된다. (2020-06-30)

지능이라는 이름의 게임(6): 두뇌-지능의 수수께끼를 풀어라!

세계 신경과학회(Society for Neuroscience)에는 3만8천명 이상의 회원이 가입되어 있으며 2017년 11월 미국 워싱턴 D.C.에서 개최된 신경과학 연례 컨퍼런스에는 3만명 이상의 학자와 전문가들이 참석하였다. 그 중에는 뇌와 신경 분야의 질병과 치료를 전공하는 의사들도 포함되어 있지만 참가자 대부분이 두뇌를 연구하는 학자들이라고 보면 될 것이다. 다시 말해  전세계적으로 수만 명의 학자와 전문가들이 인간 두뇌에 관심을 갖고 있다는 말이다. 덕분에 두뇌-지능(brain-intelligence)에 관해서 필자와 같은 비전공자가 따라잡기 불가능할 정도로 깊이 있고 다양한 연구가 발표되고 있다.

신경과학 연구의 핵심은 인간의 행동(혹은 의식)과 두뇌 구조 사이의 관계이다. 하지만 연구자에 따라 연구의 관점과 촛점이 크게 다르다. 어떤 연구자는 진화생물학적인 관점에서 접근하고, 어떤 연구자는 행동심리학적 관점에서 접근하며, 어떤 연구자는 두뇌의 기능적 측면에 관심이 있고, 어떤 연구자는 두뇌의 구조적 측면에 관심이 많다. 그런데 연구 성과들이 거의 대부분 뇌의 특정 영역이나 특정 기능을 다루고 있어, 필자와 같은 외부자들이 이해하기 쉽고, 두뇌-지능을 전체적으로 바라보게 해주며, 나아가 독창적인 이론적 관점을 담고 있는 논문이나 저서가 흔치 않다.

다행히 그런 저작 몇 편을 찾았다. 함께 그것들을 리뷰하면서 지능-두뇌를 이해해 보자. 먼저 예일대 신경과학과에 재직 중인 이대열 교수의 최근 저서, <지능의 탄생>(2017, 바다출판사)이다.

Image result for 지능의 탄생

이 교수는 지능을 생존을 위한 의사결정(decision making)으로 본다. 생물체의 진화는 지능(intelligence)의 진화를 수반한다. 생명의 핵심은 유전자의 자기복제인데, 유전자는 RNA에서 시작하여 DNA와 단백질로 분화하고, 단세포 생물체에서 다세포 생물체로, 식물에서 동물로, 곤충에서 파충류, 그리고 인간이 속한 포유동물에까지 진화한다. 각 생물체는 자신의 생존에 적합한 지능을 갖고 있다. 단순한 생명체는 낮은 지능만을 갖고 고등 동물은 높은 수준의 지능을 갖는다. 특히 날쌔게 움직여야 살아남을 수 있는 동물들에게는 신경세포가 모인 두뇌(brain)가 발생하였고, 예측과 판단을 위한 대뇌 신피질(cerebral neocortex)이 발생하였다. 특히 복잡한 사회생활을 해야하는 인간은 다른 동물에 비해 크고 복잡한 구조의 신피질을 갖게 되었다.

그런데 인간의 신피질은 세상에 태어나는 순간에 완성체로 출현하는 것이 아니라 성장 하면서 발달하고 살아가면서 변화된다. 의사결정에는 기억, 분류, 개념화, 비교, 예측, 그리고 학습이 필요하다. 감각기관을 통해서 외부의 자극을 받으면 신피질, 해마, 기저 핵 등에 신경세포-시냅스 네트워크가 형성되고, 일종의 학습 과정을 통해서 기억은 강화되거나 약화되고 혹은 소실된다.

지능은 기억을 가지고 하는 생존 게임이다. 유전자는 효과적인 생존을 위해 두뇌에게 자율성을 부여한다. 그래서 두뇌는 스스로 판단에 의해 생존–유전자의 자기복제–에 가장 유리한 행동을 선택해야 한다. 경험을 통해서 환경에 관한 정보를 인지하고 분류해서 저장해두고(기억), 특정 상황에서 취한 행동과 그것의 결과(보상, reward) 사이의 관계를 기억한다. 그리고는 새로운 자극이 들어오면 관련된 기억을 활성화하여 여러 가지 행동 옵션을 비교하여 선택한다.

Image result for reinforcement of memory in brain
출전: http://www.sashasheng.com/blog/2018-1-6-reinforcement-learning-taxonomy

경쟁하는 욕구들 혹은 가능한 행동들 사이에서 의사결정을 하려면, 다양한 옵션들의 예상 효과를 공통의 보상 척도로 측정할 수 있어야 하며, 각 옵션이 가져오는 당장의 영향 뿐 아니라 미래의 영향에 대해서도 그 값을 추정할 수 있어야 한다. 그 값들을 비교하여 두뇌–보다 구체적으로 대뇌 신피질–는, 항상 성공적인 결과가 보장되지는 않지만, 신속한 의사결정을 내린다.

이러한 과정이 학습(learning)이고 지능 작용인데, 거기에서 중요한 요소가 오류(error)와 가치(혹은 효용)이다. 두뇌는 저장된 과거 기억을 활용해서 행동이 가져올 가치(value)를 예견하고 행동을 명령한다. 행동한 이후에 생성된 가치가 예견된 가치보다 작거나 크면 보상 예측 오류(reward prediction errors)가 발생한다. 보상예측오류는 학습이 필요하다는 시그널이다. 두뇌가 행동의 가치값을 변화시킨다는 것이다. 그것이 학습이다.

Image result for reward prediction errors
출전: https://www.dialogues-cns.org/contents-18-1/dialoguesclinneurosci-18-23/

도파민(dopamine)은 보상예측오류를 반영하는 신경화학물질이다. 예상보다 결과가 좋으면 도파민 분비가 증가되어 다음 번에는 예측값을 높이도록 유도하고, 반대로 예상보다 결과가 좋지 않으면 도파민 분비가 감소되어 다음 번에는 예측값을 낮추도록 유도한다.

두뇌의 보상 예측 오류는 안도(relief)/후회(regret), 득의(elation)/실망과 같은 정서적 상태를 수반한다. 그러한 정서 상태는 두뇌가 기억을 강화할 것인지 갱신할 것인지를 결정하는 필요한 요소인지도 모른다. 이는 후회나 실망과 같은 부정적인 정서도 지능과정에 긍정적 역할을 수행함을 함축한다.

Related image
출전: www.planbox.com. https://www.planbox.com/2017/07/07/innovation-evolution-ai/

끝으로 생존을 위한 의사결정이라는 관점에서 보면 최고의 지능은 무엇보다 자율성을 지녀야 한다. 스스로 복제(reproduction)를 추구할 수 있어야 하고, 자기 복제(self-reproduction)를 위해 미래에 대비하거나 효과적인 의사결정을 내릴 수 있어야 한다. 인공지능(artificial intelligence)도 자기 복제 능력을 가질 수 있을까? 혹은 인공지능에게 자기 복제 능력을 허용해야 할 것인가? 이 교수는 언젠가 인공지능이 자기 복제 능력을 가질 정도로 테크놀로지가 발전하겠지만, 인공지능에게 자율성을 허용해서는 안 될 것이라고 주장한다. 인간과 인공지능 사이에 본인-대리인 문제(principal-agent problem)가 필연적으로 발생할 것이기 때문이다. 인간(본인)의 생존과 번영을 위해 존재해야 하는 인공지능(대리인)이 인간의 이익보다 자신의 이익을 우선시할 가능성이 있고, 그럴 경우 인공지능에 의해 인간의 생존이 위협받는 결과가 초래될 수도 있다는 것이다. (윤영민, 2018-02-25).

신자연주의론 메모(1): 특이점 그리고 그 이후

SAMSUNG CSC
김영사. 2007.

레이 커즈와일(Ray Kurzweil)은 뛰어날 뿐 아니라 담대하다. 그는 수학, 물리, 화학, 생물, 천문, 심리, 의학, 전산학 등의 첨단 연구를 종횡무진 인용할 뿐 아니라 자신의 입장을 주저없이 명쾌하게 제시한다. 사실 보수적이고 분절적인 학계에서는 그 두 가지 모두 위험천만한 행동인데 말이다.

2005년 출간 이래 <특이점이 온다>는 커다란 반향을 불러 일으켰다. 지난 10여년 동안에 출판된 책 중 가장 심대한 사회적 영향을 가져오지 않았나 싶다. 많은 찬사와 비판이 쏟아졌으며, 그 책으로 인해 Singularity University라는 초유의 기관이 설립되고 첨단기업들의 AI 연구가 크게 활성화되었다. 우리나라에서도 한글판이 10년 동안 9쇄나 인쇄되었으니 그 영향이 작지 않았다고 할 것이다. 물론 내용이 쉽지 않은데다 840쪽이나 되는 책을 독자들이 얼마나 충실히 읽었는지는 모르겠지만.

열흘 전쯤 일본 소프트뱅크의 손정의 회장이 특이점(singularity)을 언급하면서 내년으로 예정된 은퇴를 취소하겠다고 발표했다. 10년 정도 특이점의 도래에 대비한 사업을 주도하고 물러나겠다는 것이었다.

책은 저자의 주장을 뒷받침하는 자료로 가득하다.  하지만 저자의 분석 모형은 몇 가지 요소로 요약된다:

1) 인간 중심: 인간은 우주 진화의 정점. 인간은 21세기 중엽까지는 첨단 과학기술로 진화의 새로운 단계를 열 것이고, 궁극적으로 우주 전체를 지능적 존재로 탈바꿈시킬 것이다.

2) 지능 제일: 우주를 지배하는 최고의 힘은 지능(intelligence). 기억, 분석, 추론, 상상, 사랑, 공감 등은 모두 지능의 측면들이다. 진화는 보다 강력한 지능을 추구하는 단일한 경쟁이다. 지능은 인류와 지구가 직면한 문제, 나아가 우주에 존재하는 모든 문제에 해답을 줄 것이다.

3) 기술 진화: 지능은 과학기술의 발달로 집약되며, 과학기술의 발전은 가속적이다. 21세기는 GNR(Genetics, Nano technology, Robotics) 혁명의 무대. 2020년~2030년 정도이면 유전학은 질병과 노화를 대부분 해결하며 발전의 정점에 도달할 것이다. 2030~2040년에는 나노기술이 생물이라는 범주에서 벗어나지 못하는 유전학의 한계를 돌파할 수 있게 해 줄 것이다. 그것은 인간의 몸과 뇌, 그리고 인간이 사는 세상을 분자 수준으로 정교하게 재설계하고 재조립하게 해 줄 것이다. 가장 강력한 혁신은 로봇공학에 의해 실현된다. 인간은 인간을 뛰어넘는 인공지능(Artificial Intelligence)을 창조할 것이며 그 이후의 진화는 인공지능의 몫이다. 2040년~2050년에 인류는 특이점(singularity)에 도달한다. 생물과 비생물의 구분, 인간과 로봇의 구분, 현실과 가상의 구분이 사라지며, 인간에 대한 해독이 끝나고 인간은 전혀 새로운 존재양식을 갖게 된다. 특이점 이후 인간은 자신의 정체성, 신체 구성, 수명, 쾌락 수단 등을 자유롭게 선택하게 된다.

4) 유물론: 생명의 본질은 정보이며, 생명체는 정보를 처리하는 일종의 컴퓨터이다. 몇 가지 중대한 혁신이 이루어지면서 박테리아 수준의 생물체가 탄생했고, 생물체는 수십억 년 동안 진화를 거듭해 고도로 지능적인 인간에 도달했다. 인간은 특별한 존재이다. 과학기술을 발전시켜 스스로 자신을 뛰어넘는 존재로 진화한다. 과학기술 덕분에 질병, 노화, 죽음의 문제가 해결되면서 신과 종교는 불필요해진다. 죽음이 더 이상 미화될 필요가 없기 때문이다. 죽음은 예방될 수 있는 정보의 손실일 뿐이다.

<특이점이 온다>는 S.F.도 아니고 철학서도 아니다. 과학자이며, 발명가이고, 사업가인 한 천재가 제시한 미래 예측이다.  그리고 그것은 21세기의 인류 문명을 이끄는 기업과 기관들의 사업 로드맵에 반영되고 있다. 사실 그점이 이 책을 다른 미래전망서와 구분짓고 있다. 그 책은 단지 미래를 예측만 하는 것이 아니라 미래를 창조하고 있는 것이다.

특이점의 구체적인 범위와 도래 시점은 논란의 대상이고, 그의 예측은 맞는 것만큼이나 빗나가고 있기도 하다. 그러나 과연 특이점의 도래를 완전히 부정할 수 있을까. 과학기술은 커즈와일이 예견한 방향으로 빠른 속도로 발전하고 있고,  그에게서 영감을 받은 사업가들은 새로운 시대를 선점하기 위해 분주하다.

특이점은 올 것이다. 그가 묘사한 것처럼은 아닐지라도. 그가 얼마나 정확히 예측했느냐는 그다지 중요하지 않다. 문제는 과학기술의 발달이 가져올 대전환–그것을 무엇이라고 부르던–을 어떻게 바라보고 어떻게 예비할 것인가이다.

나는 과학기술의 발전을 적극 수용하지만 그의 기계론적 우주관–그것은 다수의 과학자들이 암묵적으로 취하고 있는 우주관이기도 하다–에는 동의하지 않는다. 그렇다면 어떤 대안이 있는가. 얘기해 보자. (2016/07/04)

(Bayes 학습)(11) 베이즈 추론의 역사

사십 대 여성이 정기 건강 검진의 일환으로 유방 엑스레이를 찍었다. 일주일 뒤 그녀는 유방암 검사 결과가 양성으로 나왔다는 통보를 받았다. 유방암에 관한 가족력도 없고 또 징후도 없는 그녀가 진짜로 유방암에 걸렸을 확률은 얼마일까?

나는 실제로 몇몇 의사, 간호사, 약사에게 물어 보았다. 80%, 60%, 30%, 10% 라고 대답했다. 모두 틀렸다. 그 확률은, 미국의 경우이기는 하지만, 3%에 불과하다!  그 확률은 아래의 베이즈 정리로 간단히 계산할 수 있다.

여기서 A는 유방 엑스레이 양성 반응이고, B는 유방암을 가지고 있음이다. 좌변의 P(B|A)는 유방 엑스레이 양성 반응이 나온 사람이 실제로 유방암을 가지고 있을 확률이다. 우변의 P(B)는 유방암을 가지고 있을 확률, P(A|B)는 유방암 환자가 유방 엑스레이 양성 반응이 나올 확률, 그리고 P(A)는 유방 엑스레이 양성 반응이 나올 확률이다.

미국에서 사십 대 여성 1만명 가운데 대략 40명이 유방암을 가지고 있다(유방암 발병 확률은 40/10,000이다). 그리고 유방암 환자가 유방 엑스레이 검사에서 양성 반응이 나올 확률은 80%이다. 그러면 그 40명 가운데 32명이 양성 판정을 받는다(그 확률은 32/40이다). 또한 유방 엑스레이 검사에서 양성 반응이 나올 확률은 10%이다(그 확률은 1,000/10,000이다).

이 수치를 위 공식에 대입해서 계산하면 다음과 같다.

3%이다. 간단하지만 매우 강력한 공식이다.

베이즈 정리라고 불리는 이 공식은 250여년 동안 역사적 퇴장과 등장을 반복하면서 살아남았다.  게다가 그 공식에 기반한 추론은 21세기에 다양한 분야에서 불확실성을 다루는 가장 강력한 도구가 되었다.

깊은 과학의 세계로 안내하는 유쾌한 동반자

이 책은 1740년대 영국의 토머스 베이즈 목사가 별로 자신없이 세상에 내놓았던 수학적 정리가 오늘날 온갖 학문과 현업 분야에서 불확실성을 다루는 강력한 도구로 떠오르기까지의 부침을 기록한 역사이다.

거기에는 숱한 영웅과 천재가 등장한다. 피에르 시몽 라플라스, 아서 베일리, 레너드 지미 새비지, 에드워드 몰리나, 앨버트 워츠 휘트니, 해럴드 제프리스, 데 피네티, 앨런 튜링, 잭 굿, 안드레이 콜모고로프, 존 튜키, 오스굿 쿠프먼, 제롬 콘필드, 앨버트 매단스키, 데니스 린들리, 로버트 오셔 슐라이퍼, 하워드 라이파, 프레더릭 모스텔러, 존 피냐 크레이븐, 에이드리언 래프터리, 저먼 형제, 에드리언 스미스, 앨런 겔팬드, 키스 헤이스팅스 등. 게다가 베이즈 추론을 없애버리려는 악당들(?)도 등장한다. 통계학을 공부한 사람이라면 누구나 그 이름을 기억할 로널드 피셔, 예지 네이만 등이 베이지언들의 공적으로 등장한다. 이 책에서 독자는 그 인물들을 딱딱한 수학자나 과학자가 아니라 생생한 인간으로 만나게 된다. 이 책의 첫번 째 뛰어난 점이다.

베이즈 접근은, 추론 과정에 연구자의 주관적 판단이 들어간다는 이유로 학계, 특히 통계학계에서는 철저하게 배제되었다. 베이즈 정리를 언급하면 대학에서 자리를 얻을 수 없을 정도였다.

반면에 실제 문제를 풀어야 하는 현업에서는 비교적 다양한 분야에서 수용되었다. 그러나 베이즈 접근이 본격적으로 대중화되기 위해서는 정적분 계산이라는 산을 넘어야 했다. 베이즈 정리의 분모에 적분이 들어가는데, 변수가 많아지면 그 계산은 종이와 연필, 계산자, 혹은 계산기를 사용해서는 거의 불가능했다.

다행히 1980년대 이후 한편으로 몇 명의 탁월한 학자들에 의해 그에 대한 해법이 발견되고, 다른 한편으로 컴퓨팅 환경이 급격히 향상하면서 비로소 대중화의 길이 열렸다. 1989년 발표된 마르코프 연쇄 몬테카를로(Markov Chain Monte Carlo, MCMC) 방법이 어려운 적분을 대체하게 되었다. 베이즈 추론이 계산의 악몽에서 벗어난 것이었다.

저자인 샤론 버치 맥그레인(Sharon Bertsch McGrayne)은 그러한 발전에 누가 어떻게 기여했는가를 어렵지 않게 기술하고 있다. 책에는 베이즈 추론을 위한 핵심적인 개념들과 절차들의 발견이 모두 망라되어 있다.

베이즈 추론과 관련된 수많은 사건들이 상세하게 기술된 점도 이 책이 흥미 진진하게 읽히는 이유이다. 드레퓌스 사건, 이차대전시 독일군 암호의 해독, 보험업계의 발전, 폐암 원인의 규명, 냉전시 소련 핵잠수함의 추적, 연방주의자 논고의 분석 등 신기한 스토리가 끝이 없는 듯이 이어진다. 이 책의 두번 째 매력이다.

6백쪽이 넘는 책이라 하루이틀 사이에 읽기는 힘들지만, 책을 한번 손에 잡으면 쉽게 놓을 수 없도록 이야기들이 박진감 넘치게 전개된다. 베이즈 추론에 관심을 가진 사람들, 베이즈 추론 자체에는 관심이 없더라도 학자의 삶에 대해 관심이 있는 사람들, 학문과 현업, 학문과 전쟁, 학문과 행정, 그리고 순수 학문과 응용 학문의 관계에 관심있는 사람들이라면 누구나 이 책으로부터 커다란 흥미와 교훈을 발견하게 될 것이다.

한 마디로 멋진 책이다. (2016/04/15/윤영민)

인문학의 실용성

zakaria

며칠 전 출간된 책에서 Fareed Zakaria가 인문 교육을 옹호하고 나섰습니다. 그는 몇 권의 베스트셀러를 가진 미국의 저명한 언론인입니다.

그 책을 보면 인문학의 위기가 우리 나라 뿐 아니라 미국에서도 나타나는 현상이네요. 학생과 학부모는 졸업 후 좋은 직장을 얻는데 직접적으로 도움이 되는 공학이나 경영학과 같은 실용적인 전공을 선호하고, 심지어 대통령이나 주지사와 같은 정치 지도자들마저도 인문학에 대한 지원을 줄이고 기술 교육에 대한 지원을 늘이겠다고 나서고 있답니다.

그러한 분위기에 대해 자카리아가 반기를 들고 나섰습니다. 그는 미국이 계속 세계를 리드하기 위해서는 전통적으로 미국 대학교육의 강점인 인문학 교육을 오히려 강화해야 한다고 역설합니다. 그리고 미국의 일류 기업들이 인문학 교육을 잘 받은 인재를 요구하고 있다고 주장합니다.

그 책의 제3장에서 그는 인문 교육(그는 인문학에 문학, 역사, 철학, 종교, 인류학 뿐 아니라 수학이나 물리학 같은 과학도 포함합니다)의 혜택을, 쓰기(how to write), 말하기(how to speak), 배우는 방법(how to learn) 세 가지로 요약합니다. 결국 커뮤니케이션 기술과 지식을 획득하는 기술, 두 가지를 말하는 것이지요.

저는 자카리아의 주장에 무척 공감합니다. 요즘과 같은 인터넷 세상에 쓸 줄 모르는 사람, 말할 줄 모르는 사람, 정보와 지식을 구할 줄 모르는 사람이 어디 있냐고요? 여러분 주위에는 자신의 생각을 정확하게, 정교하게, 그리고 설득력 있게 제시할 수 있는 사람이 많은가요? 그 정도야 앞으로 ‘구글신’이나 ‘빅 데이터’ 요술 방망이가 해결해 줄 것이라고요?

십수년 전 어떤 수업에서 저는, “자신의 생각을 제대로 쓸 줄만 알면 밥먹고 사는 걱정을 안해도 될 것이다”라는 말을 한 적이 있습니다. 그 후 세월이 많이 흘렀습니다. 이제 멀티미디어 시대가 되었으니 워딩을 좀 바꾸겠습니다. “자신의 생각을 제대로 표현할 줄만 알면 밥먹고 사는 걱정을 안해도 될 것이다.”

저는 학생들에게 프로그래밍과 같은 기술교육을 의무적으로 받게 합니다. 그들에게 기본적인 공학적 소양을 갖추라고 강조하는 것이지요. 그렇다고 공학도가 되라는 말은 아닙니다.

21세기의 인문학은 문학, 역사학, 철학, 예술, 심리학, 사회학, 과학, 그리고 공학적 소양까지 포함해야 합니다. 고도의 기술기반 사회에서 공학적 소양을 갖추지 못하면 할 수 있는 일이 많지 않기 때문입니다.

참, 책을 읽어주는 자카리아의 목소리에 인디언 액센트가 남아 있네요. 그도 인도 출신 미국인입니다.

그 책에 인용된 페이스북의 창업자 마크 저커버그의 다음 말이 뇌리에서 떠나지 않습니다.

“(페이스북)은 테크놀로지인 것만큼, 심리학이며 사회학입니다.” (윤영민, FB 2015/04/07)