신자연주의론 메모(1): 특이점 그리고 그 이후

SAMSUNG CSC
김영사. 2007.

레이 커즈와일(Ray Kurzweil)은 뛰어날 뿐 아니라 담대하다. 그는 수학, 물리, 화학, 생물, 천문, 심리, 의학, 전산학 등의 첨단 연구를 종횡무진 인용할 뿐 아니라 자신의 입장을 주저없이 명쾌하게 제시한다. 사실 보수적이고 분절적인 학계에서는 그 두 가지 모두 위험천만한 행동인데 말이다.

2005년 출간 이래 <특이점이 온다>는 커다란 반향을 불러 일으켰다. 지난 10여년 동안에 출판된 책 중 가장 심대한 사회적 영향을 가져오지 않았나 싶다. 많은 찬사와 비판이 쏟아졌으며, 그 책으로 인해 Singularity University라는 초유의 기관이 설립되고 첨단기업들의 AI 연구가 크게 활성화되었다. 우리나라에서도 한글판이 10년 동안 9쇄나 인쇄되었으니 그 영향이 작지 않았다고 할 것이다. 물론 내용이 쉽지 않은데다 840쪽이나 되는 책을 독자들이 얼마나 충실히 읽었는지는 모르겠지만.

열흘 전쯤 일본 소프트뱅크의 손정의 회장이 특이점(singularity)을 언급하면서 내년으로 예정된 은퇴를 취소하겠다고 발표했다. 10년 정도 특이점의 도래에 대비한 사업을 주도하고 물러나겠다는 것이었다.

책은 저자의 주장을 뒷받침하는 자료로 가득하다.  하지만 저자의 분석 모형은 몇 가지 요소로 요약된다:

1) 인간 중심: 인간은 우주 진화의 정점. 인간은 21세기 중엽까지는 첨단 과학기술로 진화의 새로운 단계를 열 것이고, 궁극적으로 우주 전체를 지능적 존재로 탈바꿈시킬 것이다.

2) 지능 제일: 우주를 지배하는 최고의 힘은 지능(intelligence). 기억, 분석, 추론, 상상, 사랑, 공감 등은 모두 지능의 측면들이다. 진화는 보다 강력한 지능을 추구하는 단일한 경쟁이다. 지능은 인류와 지구가 직면한 문제, 나아가 우주에 존재하는 모든 문제에 해답을 줄 것이다.

3) 기술 진화: 지능은 과학기술의 발달로 집약되며, 과학기술의 발전은 가속적이다. 21세기는 GNR(Genetics, Nano technology, Robotics) 혁명의 무대. 2020년~2030년 정도이면 유전학은 질병과 노화를 대부분 해결하며 발전의 정점에 도달할 것이다. 2030~2040년에는 나노기술이 생물이라는 범주에서 벗어나지 못하는 유전학의 한계를 돌파할 수 있게 해 줄 것이다. 그것은 인간의 몸과 뇌, 그리고 인간이 사는 세상을 분자 수준으로 정교하게 재설계하고 재조립하게 해 줄 것이다. 가장 강력한 혁신은 로봇공학에 의해 실현된다. 인간은 인간을 뛰어넘는 인공지능(Artificial Intelligence)을 창조할 것이며 그 이후의 진화는 인공지능의 몫이다. 2040년~2050년에 인류는 특이점(singularity)에 도달한다. 생물과 비생물의 구분, 인간과 로봇의 구분, 현실과 가상의 구분이 사라지며, 인간에 대한 해독이 끝나고 인간은 전혀 새로운 존재양식을 갖게 된다. 특이점 이후 인간은 자신의 정체성, 신체 구성, 수명, 쾌락 수단 등을 자유롭게 선택하게 된다.

4) 유물론: 생명의 본질은 정보이며, 생명체는 정보를 처리하는 일종의 컴퓨터이다. 몇 가지 중대한 혁신이 이루어지면서 박테리아 수준의 생물체가 탄생했고, 생물체는 수십억 년 동안 진화를 거듭해 고도로 지능적인 인간에 도달했다. 인간은 특별한 존재이다. 과학기술을 발전시켜 스스로 자신을 뛰어넘는 존재로 진화한다. 과학기술 덕분에 질병, 노화, 죽음의 문제가 해결되면서 신과 종교는 불필요해진다. 죽음이 더 이상 미화될 필요가 없기 때문이다. 죽음은 예방될 수 있는 정보의 손실일 뿐이다.

<특이점이 온다>는 S.F.도 아니고 철학서도 아니다. 과학자이며, 발명가이고, 사업가인 한 천재가 제시한 미래 예측이다.  그리고 그것은 21세기의 인류 문명을 이끄는 기업과 기관들의 사업 로드맵에 반영되고 있다. 사실 그점이 이 책을 다른 미래전망서와 구분짓고 있다. 그 책은 단지 미래를 예측만 하는 것이 아니라 미래를 창조하고 있는 것이다.

특이점의 구체적인 범위와 도래 시점은 논란의 대상이고, 그의 예측은 맞는 것만큼이나 빗나가고 있기도 하다. 그러나 과연 특이점의 도래를 완전히 부정할 수 있을까. 과학기술은 커즈와일이 예견한 방향으로 빠른 속도로 발전하고 있고,  그에게서 영감을 받은 사업가들은 새로운 시대를 선점하기 위해 분주하다.

특이점은 올 것이다. 그가 묘사한 것처럼은 아닐지라도. 그가 얼마나 정확히 예측했느냐는 그다지 중요하지 않다. 문제는 과학기술의 발달이 가져올 대전환–그것을 무엇이라고 부르던–을 어떻게 바라보고 어떻게 예비할 것인가이다.

나는 과학기술의 발전을 적극 수용하지만 그의 기계론적 우주관–그것은 다수의 과학자들이 암묵적으로 취하고 있는 우주관이기도 하다–에는 동의하지 않는다. 그렇다면 어떤 대안이 있는가. 얘기해 보자. (2016/07/04)

사회연결망분석, 충분히 유용한가?(1)

지난 40여 년 동안 사회연결망분석(social network analysis, SNA)은 사회 현상을 이해하는데 유용함을 증명했다. 구직 활동에서 개인의 ‘약한 관계(weak ties)’가 중요함을 보인 마크 그라노베터(Mark Granovetter)의 연구, 구조적 공백(structural hole)을 잘 메꾸는 사람이 승진에 유리하다는 로날드 버트(Ronald Burt)의 연구, 그리고 미국 로비 단체들의 커넥션과 대기업들의 상호 지배를 밝힌 에드워드 라우만(Edward Laumann)의 고전적 연구부터 시작해서 최근 빅데이터를 이용한 SNS 분석에 이르기까지 사회현상분석에 있어 SNA가 보인 성과와 잠재성에 이의를 달 생각은 없다.

그러나 개인에 있어 사회연결망(social network)이 그렇게 중요하다면 개인의 행복, 불행, 외로움, 두려움, 정체감, 삶의 질을 연구하는데 도움이 되어야 한다. 또한 그것은 사회경제적 불평등, 남북한 대립, 과학적 발견, 기술적 혁신, 정치적 후진성, 구조 조정, 저출산, 고령화 등과 같이 우리 사회의 중대한 현안을 해결하는데 도움을 줘야 할 것이다. 그런데 과문한 탓인지 그런 문제에 대한 해법이나 영감을 얻는데 기여한 SNA 연구를 본 적이 없다. (혹시 그런 소중한 연구를 알고 있는 분은 내게 꼭귀뜸해 주기 바란다.)

나는 SNA가 그러한 한계를 보이는 것이 연구자들이 무능해서라고 생각하지 않는다. 사실 지난 30여 년 동안 미국사회학 분야에서 가장 머리 좋은 젊은 학자들 중 상당수가 SNA에 뛰어들었고, 최근에는 우리나라에서도 사회학은 물론이고 커뮤니케이션, 경영학, 정치학 등 여러 분야에서 우수한 신진 학자들이 SNA 연구를 하고 있다. 한 마디로 SNA연구가 사회과학 분야의 가장 뛰어난 신진 학자들을 대거 흡수하고 있다고 해도 과언이 아니다.

나는 그것의 가장 근본적인 이유가 SNA 모델링이 방법론적 금기(methodological inhibition)와 규정화 오류(specification errors)에 막혀 있기 때문이라고 본다. SNA라는 도구가 학자들의 문제의식과 상상력을 억압하고 있다는 말이다.

C. 라이트 밀즈(Mills)는 사회과학 연구자들이 문제 의식을 따라서 연구주제를 선택하기 보다 자신이 적용하는 방법론이 허용하는 연구주제를 선택하는 경향이 있음을 비판하는데 방법론적 금기라는 개념을 사용했다. 그 비판을 SNA 연구에 적용하면, 사회관계중 양적으로(quantitatively) 측정이 가능하고, SNA 모형으로 표현이 가능한 사회관계만이 연구 대상이 되고 있다고 말할 수 있다.

그러다보니 규정화 오류라는 두번째 문제가 발생한다. 동일한 척도로 측정될 수 없는 요인은 아예 처음부터 모형에서 제외된다. 그것이 설령 중요한 결정 요인이라고 해도 예외가 될 수 없다. 예컨대 대화를 트윗(tweets)을 수집해서 분석한다면, 설령 현실에서 바디 랭귀지나 눈빛을 통한 대화가 중요하다고 하더라도 분석 모형에 포함될 수 없으며, 트위터를 사용하지 않은 사회 집단, 애완 동물, 식물 같은 존재는 원천적으로 분석모형에 포함될 수 없다. 분석모형에서 중요한 결정요인이 빠져 있으면 요인들의 계수 추정은 신뢰할 수 없게 된다.

나는 사회연결망(social network)을 확장해서 타자 관계망(network of  others) 분석으로 나아가야 한다고 생각한다. 타자관계망 분석은, 나는, 왜 불행한가, 왜 외로운가, 혹은 왜 두려운가, 나는 누구인가, 내게 가장 중요한 존재는 누구인가, 나는 세계와 어떻게 관계 맺고 있는가 등과 같은 문제에 답을 줄 수 있을 것이다. 물론 관계망 분석은 개인의 사회적 상황이나 심리상태에 대한 설명을 넘어서 개인의 미래를 예측하는데 있어서도 대단히 효과적인 접근방법이 될 수 있을 것이다.

그 관계망은 사회연결망(social networks)과 다르다. 사회적 관계망에는 인간과 조직만이 노드가 되지만 타자 관계망(network of others)에는 사람, 조직, 국가, 지역사회는 물론이고 생물, 무생물, 교통, 통신, 자연 환경까지도 노드가 될 수 있다. 아래 그림을 보면 타자관계망이 사회연결망과 얼마나 다른 지 금방 느낄 수 있을 것이다.

I network6

이렇게 이질적이고 다층적이며 복잡한 관계망이 과연 도움이 될까? 나는 타자의 중요성(significance of others)을 중심으로 모델링을 하면 충분히 간략해질 수 있으며, 질적 분석과 양적 분석이 모두 가능하다고 생각한다. 그 잠재성을 검토해 보자. (계속)

신의 언어, 선지자의 언어

이 세상을 창조하는데 왜 6일이나 걸렸을까? 전지전능한 신인데 한 순간이면 충분하지 않았을까?

그에 대해 성 아우구스티누스(St. Augustine)는 이렇게 생각했다. ‘6’이 완전한 숫자였기 때문이다. “하느님은 우주의 완전함을 계시하기 위해 일부러 6일이나 시간을 끌었다”(사이먼 싱, 1998에서 재인용).

완전수(complete number)란 약수들의 합이 본래의 수와 정확하게 일치하는 수를 말한다. 6의 약수는 1, 2, 3이고 그 셋을 더하면 6이다. 6 다음의 완전수는 28이다.

완전수의 존재를 발견한 것은 피타고라스(Pitagoras de Samos)였다. 피타고라스는 수학을 통해서 우주의 비밀을 밝힐 수 있다고 믿었다. 이 세상이 수학적 법칙에 따라 움직이기 때문이라는 것이었다. 유명한 피타고라스 정리는 그가 찾아낸 법칙 중 하나였다. 그로부터 2천년 후 갈릴레오(Galilo Galilei)는 같은 의미에서 “신이 우주를 창조할 때 사용한 언어가 수학이다”라고 주장했다.

수학자나 과학자가 아니고는 그러한 주장에 공감할 사람들이 얼마나 될 지 모르겠다. 그러나 아직도 그러한 믿음을 버리지 않은 수학자나 과학자들이 많다.

나는 그러한 믿음이 잘못되었다고 생각하지 않는다. 세상에 대한 수학적 해석을 이해할 수 있는 사람이 별로 많지 않다는 점이 좀 걸릴 뿐이다.

수학자들만 신의 의도를 읽으려 했던 것은 아니다. 선지자들(prophets)도 그러했다. 그러나 그들은 수학자들과 달랐다. 수학자들이 신의 기획을 이해하려고 했다면, 선지자들은 신의 뜻을 대중에게 전달하려고 했다.

대중과의 커뮤니케이션을 위해서 선지자들이 선택한 표현 형식은 메타포(metaphor, 은유 혹은 비유)였다. 예수, 공자, 석가모니와 같은 인류의 스승들은 예외 없이 메타포를 즐겨 사용했다.

메타포는 수학에 못지 않게 강력한 표현 도구이다. 그것은 청중의 수준에 맞추어 메시지가 전달될 수 있게 해주고, 선지자가 권력의 탄압을 피해갈 수 있게도 해준다. 게다가 두고두고 시대에 따라서 다르게 해석될 수 있는 여지를 남겨준다.

메타포의 구조는 단순하다. 한편에는 중대하거나 난해한 메시지가 있고 다른 한편에 일상적인 개념이 있다. 추상적인 메시지를 직관적 언어로 풀어주는 방법이다. “인생은 여행이다”, “TV는 바보상자”, “삶은 한편의 연극”, “인터넷은 정보의 바다”….

때로는 한 문장이나 한 문단이 아니라 책, 그림, 조각, 건물, 영화 등이 통째로 메타포일 수도 있다. 예컨대 성경 중 가장 난해하다는 요한 계시록이 그러하다.

나는 뛰어난 S.F. 소설이나 영화도 하나의 메타포로 간주한다. 조지 오웰의 <1984>, 리들리 스콧의 영화 ‘블레이드 러너’, 그리고 이번 주 학교 수업에서 다루었으며, 오늘 고전 문학 동아리에서 토론할 올더스 헉슬리의 <멋진 신세계(Brave New World)>도 그렇다.

역사는 단순히 과거의 기록이 아니다. 거기에는 오늘의 관점에서 재발견해야 하는 역사서의, 그리고 역사가의 메시지가 담겨 있다.  S.F.도 그러하다. 그것은 단순히 미래에 관한 상상의 산물이 아니다. 거기에는 오늘의 관점에서  재해석되어야 하는 작품의, 작가의 메시지가 담겨 있다.

탁월한 S.F.는 현대 사회에 대한 철학이며 윤리학이고 사회학이다. 거기에는 인간과 사회의 본질, 인간과 사회가 지향해야 할 가치와 규범에 대한 작가의 고뇌가 녹아있다. 청중은 거기에서 오늘날에 우리가 직면한 문제들에 대해 해답을 찾을 수는 없더라도 최소한 깊은 성찰의 기회를 갖게 된다.

수학으로부터, 그리고 뛰어난 메타포와 S.F.로부터 우리가 더욱 많은 지혜를 얻을 수 있었으면 좋겠다.

bravenewworld.covfin

 

 

인간 vs 인공지능, 진실은 어디에?

cyborg1-sjtek-umeshcom-10-728

10여년 전 <나는 왜 사이보그가 되었는가>라는 역서가 출간되었다. 영국의 리딩대학교(University of Reading)의 저명한 인공지능 연구자인 케빈 워릭 교수의 저서였다. 5백쪽이 넘는 책을 단숨에 읽었다. 그리고 다음 학기에 내 수업의 교재 중 하나로 채택했다.

그는 팔에 실리콘 칩으로 된 트랜스폰더를 이식했다. 그리고는 영국에서 인터넷을 통해서 미국에 있는 부인에게 신호를 전달하는데 성공했다. 덕분에 그에게는 최초의 인간-사이보그(cyborg)라는 별칭이 붙었다.

그 책을 읽힌 다음 나는 수업시간에 학생들에 물었다.

“자신이 90% 이상 사이보그라고 생각하는 사람 손 드세요?”

“자신이 70% 이상 사이보그라고 생각하는 사람은?”

“자신이 50% 이상 사이보그라고 생각하는 사람은?”

“자신이 30% 이상 사이보그라고 생각하는 사람은?”

“자신이 결코 사이보그라고 생각하지 않은 사람은?”

절대 다수의 학생들이 자신은 30% 이상 사이보그라고 대답했다. 워릭 교수는 결코 인간 최초의 사이보그가 아니었다. 사이보그가 되는데 몸에 굳이 칩을 이식할 필요가 없었다. 칩은 다만 상징일뿐.

통신 네트워크는 이미 매클루언적 의미에서 우리의 신체적(그리고 정신적) 연장(extension of body)이다. 인터넷과 스마트폰이 발명된 이후 우리는 아침에 눈 뜨면서부터 밤에 잠자리에 들 때까지 끊임없이 ‘접속’ 되어 있다. 그리고 우리의 두뇌 기능은 상당 부분 네트워크에 아웃소싱되어 인터넷과 스마트폰 없이는 우리는 제대로 생각할 수조차 없다. 그래도 단지 몸에 기계를 이식하지 않았다는 이유만으로 우리가 사이보그가 아니라고 자위할 것인가.

이세돌과 알파고의 대결에 관한 수많은 논의들 속에서 나는 다시 한번 인간과 기계 사이에 대한 범주착오(category mistake)를 본다. 알파고는 바둑에서 승리만을 미션으로 수행하는 인공지능이다. 인공지능이 아무리 뛰어난 계산, 판단, 추론 그리고 행동을 한다고 해도 그것은 프로그램된 존재(programmed being)이다.

그런데 우리는 프로그램된 존재가 아닌가? 유치원 때부터, 아니 심지어 어떤 아이들은 그보다 더 일찍부터 생존경쟁에서 이기도록 프로그램되고 있지 않는가? 지금 우리가 아이들에게 심어주려고 하는 알고리즘들은 오직 승리라는 목적만을 위해 사용되도록 개발된 것들이 아닌가? 우리가 가정과 학교에서 생존의 전사를 길러내고 있고 있음을 누가 부정할 것인가.

인공지능의 응용에서 가장 앞서 가는 업체 중 하나인 보스턴 다이내믹스(Boston Dynamics)가 생산하는 로봇이 어디에 일차적으로 사용될 것인가? 아마도 그것은 전투일 것이다.

Lance Cpl. Brandon Dieckmann, (front), native of Las Vegas and Pfc. Huberth Duarte, from Riverside, Calif., and infantrymen with India Company, 3rd Battalion, 3rd Marine Regiment, prepare to walk with the Legged Squad Support System through a grassy area at Kahuku Training Area on Oahu, Hawaii, July 12, 2014, during the Rim of the Pacific 2014 exercise. The LS3 is experimental technology being tested by the Marine Corps Warfighting Lab during the Advanced Warfighting Experiment. It is programmed to follow an operator through terrain, carrying heavy loads like water and food to Marines training. There are multiple technologies being tested during RIMPAC, the largest maritime exercise in the Pacific region. This year's RIMPAC features 22 countries and around 25,000 people. (U.S. Marine Corps photo by Cpl. Matthew Callahan/RELEASED)
The LS3 is experimental technology being tested by the Marine Corps Warfighting Lab during the Advanced Warfighting Experiment. It is programmed to follow an operator through terrain, carrying heavy loads like water and food to Marines training. There are multiple technologies being tested during RIMPAC, the largest maritime exercise in the Pacific region. This year’s RIMPAC features 22 countries and around 25,000 people. (U.S. Marine Corps photo by Cpl. Matthew Callahan/RELEASED)

장 보드리야르(Jean Baudrillard)의 인식 방법을 빌리자면, 알파고와, TV와 인터넷을 통해서 전세계에 중계된 이세고와 알파고의 바둑 대결은, 이미 우리 자신이 프로그램된 존재이고 우리 사회가 그런 전사들이 지배하는 황폐화된 전장임을 은폐하는 쇼가 아닐까? 기술비평가들은, 그리고 그 비평가들의 언설을 통해서 우리는 짐짓 진지하게 인간성(humanity)을 다시 생각한다. 그런데 그것은 하나의 의례(ritual)로 끝날 뿐이다. 언제 그랬냐는듯이 우리는 다시 생존의 ‘전장’으로 내몰리고 기꺼이 전투 모드로 돌아온다. 하나의 슬픈 코메디다.

미래 사회에서 우리를 지배하는 존재는 인간도 인공지능도 아닐 것이다. 그것은 거대한 시스템(system)이리라. 오직 최고의 이윤과 효율성만을 덕성으로 인정하는 비정한 시스템 말이다. 창의성도, 사랑도, 공감도, 인격도, 자연도, 인문학도, 심지어 비극마저도 돈이 될 때만 그 가치를 인정받는 시스템. 이미 그 시스템은 프로토타입(prototype) 수준을 넘어 우리 사회의 실제(reality)가 되어 있다.

진실로 우리가 인간이기를 바란다면 그 시스템에 싸움을 걸어야 할 것이다. 그런데 우리는 진실로 인간이기를 바라기나 하는 걸까? (2016/3/31, 윤영민)

bladerunnerroybatty
영화 Blade Runner의 한 장면. 인조인간 레플리컨트(replicant)와 레플리컨트를 사냥하는 인간 블레이드 러너 중 누가 더 인간적인가를 생각하게 하는 장면이다. (블레이드 러너 조차 인조인간이 아닌가하는 해석도 있다.)

이 시대를 이해하는 키워드

현대 사회는 마치 신기루 같습니다. 얼마나 빠르게, 얼마나 다양하게 자신의 모습을 바꾸는지 어떤 천재의 눈에도  쉽게 잡히지 않을 정도입니다. 그렇다고 손을 놓고 있을 수는 없겠지요. 어차피 우리는 살아야 하고 기왕에 살아야 한다면 잘 살아야 하니까요.

급변하는 세상에서는 자기가 태어난 땅에 살면서도 마치 이민자가 되어 낯선 세계에 살고 있는 것이나 마찬가지입니다. 우리 자신이 살고 있는 사회가 하루가 다르게 변하기 때문이지요.

그런데 성공적인 이민자들이 이민가서 가장 먼저 하는 일은 투자를 하는 것이 아니라 그 사회를 잘 이해하는 것입니다. 그래야 적응도 잘 하고 사업도 잘 운영할 수 있을테니까요.  마찬가지로 우리도 현재의 사회를 이해하려는 노력이 필요합니다.

지난 가을 교육부가 개통한 온라인 대학교육 서비스인 K-MOOC에 제가 <정보사회학 입문>을 개설한 이유는 이웃들이 새로운 세상를 이해하는데 조금이라도 도움이 되기 위해서였습니다.

그 강의에서 저는 현대 사회를 이해하는데 실마리가 되는 일곱 가지 키워드를 선정하고 그 키워드에 관련된 고전을 중심으로 현대 사회를 분석했습니다. 프라이버시, 맥도날드화, 위험사회, 유희, 네트워크, 연극공연, 그리고 선물경제가 제가 고른 키워드입니다.

SAMSUNG CSC

저는 공부하다가 난관에 부딪치면 고전에서 지혜와 영감을 구하곤 합니다. 이 강의에서 그런한 저의 노력을 이웃들과 공유하고자 하였습니다. 다만 저는 고전 문학에서 영감을 구하는 경우도 적지 않습니다만 과목의 성격상 강의에는 사회과학 고전만 포함시켰습니다.

4월 1일에 한양대학교 K-MOOC  서비스가 다시 시작됩니다. 이번에는 7주 동안 학기가 진행됩니다. 수강생들, 담당 교수, 그리고 운영진의 소통을 위해서 페이스북에 그룹(‘K-MOOC 정보사회학 입문’)을 만들었습니다.

지난 학기에는 9백명 정도가 <정보사회학 입문>을 수강했습니다만, 이번 학기에는 그보다 적은 수가 수강하지 않을까 예상합니다. 덕분에 수강생들과 함께 대화할 기회가 좀 더 많을 것 같습니다.

많은 관심을 부탁드립니다. 윤영민 배상.

디지털 시대의 사회조사 전문가

skopos_tmimatos

신입생들을 면담했더니 몇몇이 ‘사회조사분석사’라는 자격증에 관심을 보였다. 우리 학과 졸업생 중 사회조사분석사 자격증을 딴 학생들이 심심치 않게 눈에 띄는 걸 보면 그 자격증에 대한 학생들의 관심이 어제오늘이 아니었던 것 같다.

그런데 사실 나는 그 자격증의 실효성은 물론이고 시대적 적합성에 대해 무척 회의적이다. 사회조사방법과 사회통계학에 대한 지식을 테스트하는데 그 내용이 많이 낡았다. 기존에 개설된 관련 과목들을 제대로 수강했으면 누구나 합격할 수 있는 내용과 수준이다. 문제는 그것이 현장에서 사회조사자(social researcher)가 수행해야 하는 역할과의 불일치가 너무 심하다는 사실이다. (통계청 사이트의 사회조사분석사 검정자격기준을 참고하기 바람)

사회조사분석사가 1급과 2급으로 나누어 있듯이 사회조사자에도 다양한 수준이 있을 것이다. 하지만 오늘날과 같은 디지털 시대에 사회조사자가 갖춰야할 전문적 지식과 능력은 다음과 같지 않을까?

사회조사자는 (1) 무엇보다 주어진 과제를 연구문제(research question)로 번역할 수 있어야 할 것이다. 사회조사는 규칙적인 사회 현상(social regularities)에 관련된 의문이나 쟁점에 대한 해답을 얻는데 필요한 실증적 근거를 만들거나 찾는 작업이다. 규칙적인 사회현상에는 사회문제(social problems), 사회적 쟁점(social issues), 사회적 의문들(social questions), 혹은 사회학적 의문이나 쟁점(sociological questions or issues)이 포함될 수 있다. 사회현상에 대해, 왜 그럴까, 어떤 상태인가, 앞으로 어떻게 될까, 누구의 주장이 옳은가, 어떤 해법들이 있을까, 어떤 해법이 상대적으로 더 바람직한가 등에 대한 답을 제시하는데 있어 실증적 근거를 확보하는 것이 사회조사라고 할 수 있다.

최근 예측분석학(predictive analytics)에서 다루는 것 같은 개인의 행동에 대한 예측이 사회조사의 연구에 포함되어야 하는가는 논란이 될 수 있다. 전통적으로는 분명 아니다. 그러나 빅데이터 환경의 등장과 더불어 사회조사자가 ‘예측분석’ 능력을 갖추는 것은 거부할 수 없는 트렌드가 될 것으로 예상된다.

사회조사자는 (2) 주어진 의문과 여건 아래에서 무엇이 가장 효과적이고 효율적인 연구방법인지를 판단할 수 있어야 한다. 설문조사, 실험, 심층면접, 참여관찰, FGI, 델파이, 예측(forecasting), 이차분석(secondary analysis), 시나리오 플래닝(scenario planning) 등과 같은 전통적인 연구방법은 물론이고, 구글링(Googling), 모델링(modelling), 컴퓨터 모의실험(computer simulation), 집단지성, 데이터과학(data science), 사회연결망 분석(social network analysis) 등과 같은 새로운 연구방법이 고려되어야 한다.

사회조사자는 (3) 자신이 그러한 방법을 혼자서 수행하거나 타인이나 기관(혹은 기업)과 협업을 통해서 수행할 수 있는 능력이 있어야 한다. 모든 연구방법을 구사할 수 있는 사람은 없을 것이다. 중요한 점은 어떤 방식으로든 최선의 답을 얻어낼 수 있어야 한다는 것이다. 사실 오늘날 그것은 대부분의 경우 협업을 통해서 가능하다. 특히 해당분야 전문가, 통계학자, 수학자, 혹은 컴퓨터 프로그래머와의 협업이 필요하다.

흔히 제도는 변화를 따라오지 못한다. 제도의 장점이면서 동시에 단점은 쉽게 변하지 않는다는 사실이다. 안정적인 시대에는 제도가 힘을 발휘하지만 급변하는 시대에 제도는 시대착오적이 되곤 한다.

현재 사회조사분석사라는 제도가 후자에 해당되지 않나 싶다. 사회조사분석사가 디지털 시대에 있어 사회조사 능력을 보증하는 자격증이 되지 못하고 있다.

 

미래 예측의 세계

A businessman is consulting a crystal ball to foretell the future.

한 동안 나는 대학과 기업체에서 시나리오 기법을 강의했다. 시나리오 기법은 강력한 미래예측 방법 중 하나이다. 대학의 학부에서는 <미래학입문>이라는 타이틀로 시나리오 플래닝을 강의하다가 중단한 지가 4~5년 되었고, 일반인을 대상으로 한 온라인 강의 <미래고객 발굴을 위한 시나리오 플래닝>은 아직 서비스되고 있다.

미래학 수업을 중단한 이유는 세 가지이다.  첫째는 내 관심이 다른 분야로 이동했다. 소셜미디어, 집단지성, 데이터 사이언스와 같은 새로운 분야를 공부하는데도 시간이 넉넉하지 않았다. 둘째는 미래학 강의가 너무 부담스러웠다. 다루어야 할 내용은 많은데 학생들은 한 학기 동안에 시나리오 방법 하나 소화시키기도 힘겨워 했다. 셋째는 미래학의 이름으로 자신의 지적 불성실함을 감추려는 자들이 너무 많다. 그 분야에는 제사보다는 젯밥에 관심이 많은 자들이 넘친다.

그럼에도 불구하고 미래를 읽는 일은 참으로 흥미있다. ‘미래학’은 좀 엉터리일지 몰라도 말이다. 그런데 미래 전망은 과거에도 점성술이나 사주처럼 특별한 능력이 요구되었듯이 지금도 범상치 않은 능력을 요구한다. 그것이 함정이다. 일반인들에게도 그런 능력을 나누어 줄 수는 없을까.

사실 미래예측에 있어 중요한 것은 기술이나 기법이 아니다. 핵심은 문제의식이다. 문제의식은 네 가지 점에 대한 첨예한 인식으로 구성된다. 1) 예측하고자 하는 문제(questioning)에 대한 분명한 규정, 2) 예측하려는 문제의 불확실성(uncertainties)의 정도와 성격에 대한 정확한 인식, 3) 예측에 가용한 자원(available resources)에 대한 파악, 그리고 4) 얼마나 신속하게, 그리고 얼마나 정확하게 예측해야 하는가 하는 요구 조건(demanding conditions)의 인식이 필요하다. 이 네 가지에 대한 대답에 따라 미래전망의 효과적인 접근방법이 달라진다.

예컨대 시나리오(scenario) 방법은, 거시적 전망에 사용되는데, 전체적으로 불확실성이 상당히 크고,  연구자(혹은 연구의 클라이언트)가 관여하여 결과에 영향을 미칠 수 있는 가능성이 거의 없을 때 사용된다. 이 방법은 최적의(optimal) 해법 대신에 강고한(robust) 해법을 찾는다. 즉, 미래가 어느쪽으로 전개되더라도 잘 살아남을 수 있는 방법을 찾는다.

그런데 미래 읽기에 시나리오 방법만 있는 것이 아니다. 사실 미래 예측이나 전망에 가장 널리 사용되는 것은 이론(theory)이다. 각 영역(domain)에는 학자와 전문가들이 오랜 세월에 걸쳐서 개발해 놓은 이론들이 적지 않다. 이론은 보편적이거나 일반적인 인과관계(causal relations)를 담고 있기 때문에 미래 읽기의 강력한 도구가 된다. 이론의 가장 큰 장점은 미래 예측에 비용이 적게 들고 신속한 판단이 가능하다는 것이다.

수학도 이론에 못지 않게 유용할 수 있다. 자주 비현실적인 전제(assumptions)가 문제가 되기는 하지만 수학적 전개는 결정적(deterministic) 예측을 가능하게 해준다. 마르코프 연쇄(Markov chains)나 베이즈 추론(Bayesian inference)은 수학적 전망의 예가 될 수 있을 것이다. 수학적 해답이 불가능할 경우 통계적 근사(statistical approximation)가 유용한 대안이 된다.

아마도 미래 전망에 가장 애용되는 방법 중 하나가 바로 통계학일 것이다. 여론조사를 통한 선거 예측, 전문가 델파이 기법 등의 예를 들 수 있다. 최근 네이트 실버(Nate Silver)는 베이즈 추론을 이용해서 운동 경기와 선거 예측에 놀라운 혁신을 가져오기도 했다(참고로 FiveThirtyEight을 볼 것).

경제 예측(economic forecasting)에는 시계열 분석(time-series analysis)이 자주 사용된다. 그것은 기본적으로 현재까지의 추세(trend)를 연장시켜서 전망하는 외삽법(extrapolation)이다. 이 방법은 불확실성이 비교적 작을 때 유용하다.

컴퓨터와 인터넷이 발달한 후에는, 조건부 모의실험(what-if simulation)(사례: 기후변화 정책 결정을 위한 시뮬레이션)이나 집단지성(사례: Hollywood Stock Exchange)이 널리 사용되고 있으며, 빅데이터가 이용가능하게 되면서 예측 분석(predictive analytics)(사례: 수술 환자의 위험 예측)이 크게 확산되고 있다. 예측분석은 미시적 전망(개인에 관한 전망)에 촛점이 맞춰져 있다.

불확실성이 너무 커지면 백약이 무효하다. 그저 열심히 기도하는 게 상책이다. 그리고 자신이나 자신의 클라이언트가 개입해서 미래의 전개에 영향을 줄 수 있다면 객관적인 미래를 물을 것이 아니라 자신이나 자신의 클라이언트가 원하는 미래를 규명하는 것이 가장 중요할 것이다.

위에 언급된 방법들 중 쉽게 터득될 수 있는 것은 없다. 상당히 깊은 지식과 실전 경험이 필요하다. 그러나 그렇다고 무지가 양해되지는 않는다.

창조주를 제외하고 불확실성을 완벽하게 다룰 수 있는 자는 없다. 그래도 다행인 것은, 우리가 항상 세상에 애정을 갖고, 부지런히 자신이 지닌 지식과 도구를 갈고 닦으며, 그리고 무엇보다 욕심을 버리면 세상과 사람의 미래가 비교적 잘 읽힌다는 사실이다.

 

(Bayes 학습)(8) 마르코프 연쇄-(3)

이전에 올린 마르코프 연쇄에 관한 글에서 ‘정칙 마르코프 연쇄(regular Markov chains)’에 대해 언급했다. 널리 사용되는 마르코프 연쇄 유형에는 세 가지가 있다. 그 중 하나가 정칙 마르코프 연쇄이고, 다른 두 가지는 ‘에르고딕(ergodic) 마르코프 연쇄’‘흡수(absorbing) 마르코프 연쇄’이다.

알기 쉽게 설명하면, 시간의 흐름에 따라 어떤 객체(물체, 사람, 정신, 기체, 동물, 국가, 기업 등)가 한 상태(state)에서 다른 상태(state)로 이전할 때, 새로운 상태가 바로 직전의 상태에만 의존하면, 우리는 그러한 현상이 마르코프 연쇄의 모형을 따른다고 규정할 수 있다.

그런데 마르코프 연쇄 방식의 상태 이전(state transition)에 대해 흥미 있는 두 가지 가능성을 상상해 볼 수 있다. 하나는 가능한 모든 상태들의 공간(즉, 상태 공간, state space)에서 어느 상태로부터 다른 모든 상태로의 이전이 가능한(단 한 번의 이전에 그렇게 되지는 않더라도) 경우가 있을 것이고, 다른 하나는 일단 어느 상태에 들어가면 그 상태에서 다시는 빠져나오지 못하는 경우가 있을 것이다. 전자가 에르고딕 마르코프 연쇄(ergodic Markov chains)이고, 후자가 흡수 마르코프 연쇄(absorbing Markov chains)이다.

이전 글에서 소개한 정칙 마르코프 연쇄는 에르고딕 마르코프 연쇄의 부분집합이다. 추이행렬(transition matrix)의 거듭제곱이 오직 양의 원소들(positive elements)만 가질 때 그러한 마르코프 연쇄를 정칙 마르코프 연쇄라고 부른다.

상태의 수가 유한할(finite) 때, 다음 두 가지 조건을 충족하면 마르코프 연쇄는 에르고딕(ergodic)하다.

  1. 마르코프 연쇄가 기약적(irreducible)이어야 한다. 마르코프 연쇄가 기약적이려면 상태 공간에 흡수 상태(absorbing state)가 없어야 한다. 흡수 상태란 그 상태에 들어가면 빠져나올 수 없는 상태를 말한다. 흡수 상태가 없으면 더 이상 줄일 수 없다(irreducible)고 표현한다. 한 상태에서 어떤 다른 상태로 언젠가 갈 수 있으며, 그 경우 그 상태들이 하나의 집단을 이루고 있는 것으로 간주될 수 있기 때문이다.  기약적(irreducible) 마르코프 연쇄는 수학 기호를 사용하여 다음과 같이 표현할 수 있을 것이다.

즉, 모든  쌍(pair)에 대하여 마르코프 연쇄가, 초기상태(에서 궁극적으로() 어떤 상태(에 도달할 확률이 양이 되는 경우 이를 기약적(irreducible)이라고 말한다. 상태 공간에 흡수 상태가 하나라도 있으면 당연히 기약적이 될 수 없을 것이다.

  1. 기약적인 마르코프 연쇄(irreducible Markov chain)가 비주기적(aperiodic)이어야 한다. 어느 상태에서 일정한 주기(period)로 그 상태로 돌아가면 주기적(periodic)이라고 부르고, 같은 상태로 돌아오는 모든 시간(주기)들의 최대공약수(gcd)가 1뿐이면 공약수가 없으니 비주기적(aperiodic)이라고 부른다. 이를 아래와 같이 수학적으로 표현할 수 있을 것이다.

즉, 만약 모든 에 대하여, 초기 상태가 일 때 다시 에 도달할 확률이 양수이고, 거기에 해당되는 모든 시간의 최대공약수(gcd)가 1이면(즉, 그 시간들의 배열이 1의 배수, 2의 배수, 3의 배수….중 1의 배수에만 모두 포함되면) , 마르코프 연쇄가 비주기적(aperiodic)이라고 한다.

에르고딕 (마르코프 연쇄) 정리(Ergodic Markov Chains Theorem)는 다음과 같다. 에르고딕 마르코프 연쇄에 대해서 가 성립하는 유일한 확률 벡터 가 존재하며, 는 엄격하게 양수이다(정칙 마르코프 연쇄에서 보았던 정상상태의 공식이다). 를 충족하는 어떤 행 벡터(row vector)도 의 배수이다. 를 충족하는 어느 열 벡터(column vector) 도 상수 벡터(constant vector)이다.

에르고딕성(ergodicity)은 여러 학문 분야에서 분석적 잠재력이 크게 평가되고 있다. 년 전에는 일군의 통계물리학자들이 이 개념을 원용해서 우리나라에서 주요 성씨들의 분포를 에르고딕 분포와 비에르고딕 분포로 분류하기도 했다. 그들은 김해 김씨처럼 전국에 퍼져 있는 성씨는 에르고딕 분포라고 분류하였으며, 학성(울산) 김씨처럼 특정 지역에 집중되어 있는 성씨는 비에르고딕 분포로 분류하였다(참고: Matchmaker, Matchmaker, Make Me a Match, 2014)

흡수 마르코프 연쇄도 에르고딕 마르코프 연쇄 못지 않게 널리 응용된다. 한번 들어가면 빠져 나오지 못하는 상태를 흡수 상태(absorbing state)라고 하며, 마르코프 연쇄가 하나 이상의 흡수 상태를 포함하고, 유한한 수의 단계를 거쳐 비흡수 상태에서 흡수상태로 갈 수 있으면 흡수 마르코프 연쇄(absorbing Markov chains)이다. 마르코프 연쇄의 흡수 상태를 행렬로 표현하면, 그 상태에 대응하는 행이 주대각선(main diagonal)의 값이 1이고, 다른 모든 값이 0이다.

그런데 흡수상태(absorbing state)와 정상상태(stationary state)를 혼동하지 않아야 할 것이다. 흡수상태란 빠져나올 수 없는 상태를 말하는 것이지, 정상상태처럼 추이행렬의 거듭제곱이 극한 행렬(limiting matrix)에 근사함(approach)을 함축하지는 않는다.

그렇다고 흡수 마르코프 연쇄에 극한 행렬이 없는 것은 아니다. 만약 가 흡수 마르코프 연쇄의 추이행렬이고, 가 표준적인 형식을 갖추고 있다면(in standard form), 다음과 같은 조건을 만족하는 극한 행렬  가 존재한다. 수식으로 표현하면,

흡수 마르코프 연쇄의 추이행렬은 다음과 같은 표준형(standard form)으로 표시된다.

standard_form

Abs.는 흡수 상태, NA는 비흡수 상태를 나타낸다. 모든 흡수 상태를 모든 비흡수 상태들보다 앞에 위치시킨다. 행렬을 4분하면, 좌상의 제1사분면이 단위행렬(Identity Matrix)이고 우상의 제2사분면은 모두 0으로 채워지며, 좌하의 제3사분면의 sub-matrix를 R, 우하의 제4사분면의 sub-matrix를 Q로 표시한다.  예컨대,

여기서 좌상의 제1사분면은 단위행렬 이며, 제2사분면은 에서 보듯이 모두 0으로 채워지고, 제3사분면의 은 R, 제4사분면의 은 Q이다.

이 R과 Q가 중요하다. 그것들로부터 극한행렬 을 구할 수 있다. 위에서 보듯이

standard_form

이다. 위의 사례를 가지고 극한행렬을 계산해 보면, 다음과 같이 나올 것이다.

공식을 적용하지 않고도 표준형의 추이행렬

를 거듭제곱해가면, 아마도  혹은  정도에서는 동일한 극한행렬을 얻을 것이다.

1986년 사회연결망 이론가인 John Skvoretz는 Thomas Fararo와 함께 사회연결망에서 지배 위계(dominance hierarchies)의 형성을 모델링했다. (1986년 나는 University of South Carolina 대학원 사회학과에서 Skvoretz 교수로부터 사회이론 수업을 들었다. 그는 저명한 수리사회학자였다.) 그들의 주장은 다음과 같다.

i가 k를 공격했는데, j가 옆에서 그것을 목격했다. 처음에는 세 사람 사이에 지배 관계가 없었다. i가 k를 지배할 확률이 이고, i가 j를 지배할 확률이 이며, j가 k를 지배할 확률도 라면, 장기적으로 세 사람 사이에는 지배적인 관계가 되던지, 아니면 상호 견제하는 관계라는 두 가지의 흡수 상태에 도달하게 될 것이다. 그리고 각각의 흡수 상태에 도달할 확률은 와 에 달려 있다. (자세한 내용은 Fararo, T.J. and J. Skvoretz. 1986. “E-State Structuralism: A Theoretical Method.” American Sociological Review 51: 591-602을 참조).

이제 베이즈 추론에 사용되는 MCMC (Markov Chain Monte Carlo) 시뮬레이션을 이해하는데 필요한 마르코프 연쇄에 관한 기초 지식을 충분히 얻었다고 판단된다. 다음에는 몬테 카를로 방법(Monte Carlo Methods)에 관해 알아봐야겠다.

<참고 문헌>

Grinstead, Charles M. & J. Laurie Snell. 1997. Introduction to Probability, 2nd revised ed. American Mathematical Society. Chapter 11. (마르코프 연쇄에 관해 체계적인 이해를 도와주는 아주 좋은 문헌임. 책 전체가 pdf 파일로 공개되어 있음)

Fararo, T.J. and J. Skvoretz. 1986. “E-State Structuralism: A Theoretical Method.” American Sociological Review 51: 591-602

마르코프 연쇄에 관해 두 사람의 유튜브 강의가 아주 유용했다.

PatrickJMT   Markov Cahins (Part 1~9)

Brandon Foltz의 Finite Math의 마르코프 연쇄에 관한 강의 여러 편. 

(Bayes 학습)(8)대학에서 성공적으로 공부하려면….

앞 포스팅에서 학습한 마르코프 연쇄의 정상 상태를 현실 문제에 적용해 보자.

대학 신입생들은 대체로 두 가지 이유로 전공을 선택한다. 평소의 관심 혹은 수능 성적이다.

대학 입학 후 첫 학기가 끝났을 때 신입생들의 전공 관심 정도는 어떻게 될까? 어떤 요인이 주로 영향을 미칠까?

먼저 대학에 들어올 때의 전공 관심 정도와 처음 듣는 전공 과목 담당 교수의 교수 능력의 영향을 살펴보자. 학원 배치표에 따라 전공을 선택하는 학생들이 많은 우리 나라의 현실을 볼 때 학과 신입생들이 지닌 전공 관심의 비율은   정도가 되지 않을까? 전공에 관심을 가진 학생이 20%, 그렇지 않은 학생이 80%.

그런데 첫 전공 수업에서 교수 능력이 뛰어난 교수를 만났을 경우 전공수업의 효과는 다음과 같은 행렬로 나타낼 수 있을 것이다.

즉, 전공에 대해 관심 있는 학생이 수업을 듣고 전공에 대해 더욱 관심을 갖게 될 학률이 0.8, 전공에 대해 관심 있는 학생이 실망하여 전공에 대한 관심을 잃을 확률이 0.2, 그리고 전공에 대해 관심이 없는 학생이 전공에 관심을 가질 확률이 0.6, 전공에 대해 관심이 없는 학생이 계속 전공에 관심이 없을 확률이 0.4. 그 정도면 아주 잘 가르치는 교수(교수 1이라고 하자)가 아닐까?

반면에  수업을 잘 지도하지 못하는 교수(교수 2라고 하자)가 첫 전공 수업을 가르쳤을 경우, 그 추이행렬은,

 정도가 되지 않을까?

교수 1과 교수 2가 첫 전공 수업을 가르친 후 얼마 지나면 정상 상태(steady state)에 도달할 것이다. 지난 포스팅에서 나온 공식 를 이용해서 정상 행렬을 구해보면, 교수 1의 정상 행렬은 가 될 것이고, 교수 2의 정상 행렬은 이 될 것이다. 교수 1의 수업을 들은 학생들의 경우 75%가 전공에 대해 관심을 갖게 되고, 교수 2의 수업을 들은 학생들은  33%가 전공에 대해 관심을 갖게 될 것으로 예상된다. 교수의 영향이 무척 크다. 그리고 흥미 있게도 대학에 들어오면서 신입생들이 얼마나 전공에 관심에 가지고 있는가는 정상 상태에 영향을 미치지 못한다.

학생들 자신의 태도도 중요한 결정요인일 수 있을 것이다. 어떤 연유로 학과를 선택했든, 개방적인 자세를 가진 학생들은 첫 전공 수업을 듣고 전공에 관심을 갖게 될 것이고, 비개방적인 자세를 가진 학생들은 첫 전공 수업을 듣고도 전공에 관심을 갖지 않을 것이다. 그러한 학생들의 자세는 전공에 대한 관심 수준을 결정하는데 얼마나 영향을 미칠까?

전공에 대한 학생들의 개방적 태도를 추이행렬로 다음과 같이 표현해 볼 수 있지 않을까?

, , ,

첫번째 추이행렬은 아주 비개방적인 태도를 지닌 학생의 경우로, 수업을 듣고 전공에 대해 무관심에서 관심으로 전환될 확률이 10%밖에 되지 않는다. 두번째 추이행렬은 그 전환 가능성이 20%, 세번째 추이행렬은 40%, 그 다음은 60%, 마지막은 전환 가능성이 80%이다. 아래 행(row)의 숫자가 커질수록 점점 개방적이 됨을 의미한다. 마지막 두 추이행렬은 아주 개방적인 학생들일 것이다.

그런데 이 추이행렬을 가진 학생들이 동일한 교수의 전공수업을 수강했다고 가정하고 그들의 정상행렬을 계산해 보면 각각 다음과 같다.

,

입학 초기에 전공에 대한 관심이 어떤 상태인가에 관계없이, 전공에 대해 개방적인 태도를 지닌 학생의 전공에 대한 관심 비율(학문에 대한 관심 중 전공에 대한 관심이 차지하는 비율: 전공 대 비전공으로만 단순화시켜서 표현함)이 최대 80%나 되며, 전공에 대해 비개방적인 태도를 지닌 학생의 전공에 대해 관심 비율은 33%에 불과하다.

전공에 대한 관심은 전공 성적과 높은 상관관계를 갖고 있다. 다시 말해 신입생이 전공에 대해 얼마나 개방적인 태도를 갖고 있는가가 결국 전공에서의 학업성취에 커다란 영향을 미칠 것으로 추정된다.

물론 앞에서 살펴본 것처럼 전공 첫 수업을 어떤 교수가 가르치는가도 중요한 결정요인일 것이다. 여기서 교수 사례는 분석단위가 학과이고, 학생 사례는 분석단위가 개별 학생이다. 이점 때문에 다소 혼란스러울 수 있을 것이다.

이 예상들은 실증적인 조사 자료 없이 마르코프 연쇄 모형을 이용하여 수학적으로 도출되었다. 실제 조사를 해보면 예상과 많이 다를까? 사회과학적 추론에 있어 마르코프 연쇄의 잠재성이 아주 커보인다.

(Bayes 학습)(7)마르코프 연쇄-(2)

광고 후 3주일째 Brand A의 오렌지 쥬스 시장의 점유율은 어떻게 될까? 아래 식에서 보는 것처럼 86.96%이다.

시장 점유율이 여전히 증가하고 있으나 첫 두 주만큼 인상적이지는 않다. 광고효과가 동일하다고 가정하면 광고 후 4주부터 10주째까지 Brand A의 오렌지 쥬스 시장의 점유율은 각각 아래와 같이 예상된다.

Brand A의 시장점유율은 광고 후 5주차에 87.50%(반올림한 결과)에 도달한 이후 10주차까지 미세한 증가가 있으나 반올림하면 여전히 87.50%이다! 즉, Brand A의 시장점유율은 광고 후 5주차에 거의 불변상태에 도달할 것으로 예상된다(이는 대단히 흥미 있는 현상이다). 따라서 Brand A의 시장점유율은 광고 후 초반의 급속한 증가에도 불구하고 그 증가 속도가 빠르게 감소되되기 때문에 결코 100%에 도달하지 못할 것으로 판단된다.

이 사례는 마르코프 연쇄에 있어 정상 상태(steady state, stationary state, invariant state)가 존재함을 보여준다. 마르코프 연쇄에서 정상 상태에 도달하는 과정을 정상 상태에 수렴한다(convergence)고 표현한다.

그렇다면 모든 마르코프 연쇄가 정상 상태의 특성을 갖고 있는가? 그것은 아니다. 추이행렬(transition matrix)이 정칙(regular)인 마르코프 연쇄(그것을 정칙 마르코프 연쇄, regular Markov chains라고 부른다) 같이 특정한 유형의 마르코프 연쇄만이 그러한 속성을 갖고 있다. 어떤 추이행렬의 거듭제곱한 결과가 오직 양의 원소(only positive entries)만을 지닌 행렬일 때 그 추이행렬은 정칙이다.

정칙 마르코프 연쇄는 다음과 같은 속성을 갖는다.

(1)   (는 정상 행렬, 는 추이행렬)   이 공식으로 정상 행렬(stationary matrix)을 구할 수 있다.

(2) 초기 행렬  에 어떤 값이 주어지든 상태 행렬들(state matrices) 는 정상 행렬 에 수렴된다.

(3)추이행렬의 거듭제곱  는 하나의 극한 행렬(limiting matrix) 에 수렴한다. 의 각 행(row)은 정상 행렬 와 같다.

 공식을 이용해서 위 광고의 정상 행렬을 구해보자.

이 식을 과 에 관해서 풀면 다음 두 식을 얻는다.

 —–(1)

 —–(2)

그리고  —–(3)

(1)식과 (2)식 중 하나와 (3)식을 가지면 과 를 구할 수 있다. (1)과 (3)을 가지고 풀자.

(3)의 양변에서 를 빼면, 

이 것을 (1)에 대입하면,

양변에서 를 더하고 0.9를 우변으로 옮기면,

양변을 0.8로 나누면,

 이 된다. 이 값을 (3)에 대입하면, 이 구해진다. 이 값들로 행렬을 구하면,  이다. 이를 소수로 전환하면 이다.

위에서 일일히 행렬 계산을 통해서 구했던 정상 행렬이 공식을 사용해서 훨씬 쉽게 구해졌다.

정상 행렬(stationary matrix). 정상 상태(stationary state), 정상 분포(stationary distribution)은 베이즈 추론 과정의 MCMC (Markov Chain Monte Carlo) 시뮬레이션에 적용된다. 다음 글에서 마르코프 연쇄에 대해 조금만 더 알아보자.