지능이라는 이름의 게임(8): ‘창조주’가 되고 싶은 인간

인간에게 마지막 남은 미지의 영역은 아마도 생명일 것이다. 생존의 관점에서두뇌-지능은 생명과 가장 근접해 있는 영역이다. 두뇌-지능을 해독하면 인간(인간 대신 A.I.일지도 모른다)은 결국 생명이라는 수수께끼마저 완벽하게 풀어버릴 지도 모른다. 그것이 언제쯤일 지는 누구도 정확히 예측할 수 없겠지만 말이다. 아직 초보적인 수준이지만 인류는 이미 지능적인 기계(intelligent machines) 만들기 경쟁을 시작했다. 연구소와 기업들이 기계학습(machine learning) 혹은 인공지능(A.I.)을 응용한 상품 개발에 질주하고 있다. 스마트폰, 자동차, 스피커, 세탁기, 청소기, 가사 로봇 등등. 아마도 원하던 그렇지 않던 그 경주의 종착역은 ‘창조주(creator)’ 게임이 되지 않을까 생각된다. 지능, 두뇌, 생명의 창조 말이다.

최근에 발표된 Tie-Jun Huang 북경대 교수의 논문, “Imitating the Brain with Neurocomputer”(Internation Journal of Automation and Computing, 2017/10)는 정확히 그 지점을 건드리고 있다. 이 논문을 참고하면서 인공지능(artificial intelligence), 인공두뇌(artificial brain), 그리고 인공 생명(artificial life)에 대해 생각해 보자.

Image result for artificial intelligence, artificial brain, artificial life
출전: http://news.mit.edu/2009/ai-overview-1207

Huang 교수는 컴퓨터과학이 자율적(autonomous)이며 범용인(general) 인공지능–그의 표현으로 Artificial General Intelligence, AGI–을 추구한다고 전제한다. 그의 주장이, A.I.에게 결코 자율성을 부여해서는 안된다는 이대열 교수의 주장과 출발부터 충돌하는 것이다. 그리고 AGI를 구현하기 위해서는 지능(intelligence)의 모사가 아니라 두뇌(brain)의 모사에 연구를 집중해야 한다고 역설한다.

그의 주장에 따르면, 현재 득세하고 있는 기계학습(machine learning), 인공신경망(artificial neural network), 그리고 인공 지능(artificial intelligence)은 70여 년 전부터 지금까지 컴퓨터과학의 대세가 되어온 폰노이만(Von Neumann) 컴퓨터라는 패러다임 내에 있다.

1945년 존 폰노이만(John von Neuman)은 “First Draft of a Report on the EDVAC”이라는 논문 초고를 몇몇 지인들에게 돌렸다. 그 글에는 그 후 70년 이상 컴퓨터의 구조를 규정하는 설계가 제시되어 있었다. 폰 노이만이 논란의 여지없는 천재이기는 하지만 아마도 그 저술이 세상에 가장 커다란 영향을 미친 초고 논문이 될 것이라고는 꿈에도 상상하지 못했으리라.

폰 노이만 구조는 중앙처리장치(CPU), 저장장치(memory), 연결 통로(bus), 입출력 장치(I/O)로 구성된다. CPU는 데이터와 명령(instructions, 곧 소프트웨어)를 메모리로부터 불러내어 연산을 수행한다. 데이터와 소프트웨어는 동일한 메모리에 저장되고 동일한 버스로 이동한다.그 글에서 폰 노이만은 자신이 고등동물 두뇌의 작동 원리를 모방하여 컴퓨터의 구조를 설계하고 있음을 분명히 밝히고 있다. 특히 신경세포와 시냅스의 작동 원리를 단순화하여 진공관을 이용한 디지털 컴퓨터 설계에 적용하고 있음을 논문 곳곳에서 서술하고 있다(초고의 원문을 보려면 다음을 클릭: edvac.pdf).

폰 노이만은 복잡하고 지루한 수학 연산을 인간 대신 수행해 줄 기계를 구상했다. 폰 노이만의 설계에 따라 탄생한 디지털 컴퓨터는 지난 70여 년 동안 CPU와 메모리 칩이 진공관에서 트랜지스터 집적으로 바뀌고 데이터와 소프트웨어의 버스가 구분되었으며, 엄청난 컴퓨팅 파워와 처리 속도를 구가하게 되었고, 다양한 소프트웨어의 발달로 수학 연산을 넘어 문자, 이미지, 심지어 동영상까지 처리하고, 소형화를 거듭하고 있으며, 유무선 통신네트워크를 통해 컴퓨터는 물론이고 스마트폰을 비롯한 온갖 정보기기들이 연결되면서 놀라운 변신을 해왔다. 그러나 그럼에도 불구하고 놀랍게도 그것들에는 아직 기본적으로 폰 노이만의 설계가 유지되고 있다.

폰 노이만은 스스로 그렇게 표현하기도 했지만 생물의 신경세포 시스템을 유추(analogy)적으로 사용해서 컴퓨터를 만들었다. 즉, 그는 신경세포 시스템을 추상화시켜 도출한 몇 가지 원리를 가져다 사용했을 뿐 신경세포 시스템을 물리적으로 모사하려고 생각하지는 않았다. 사실 당시로서는 인간 두뇌에 대한 지식도 짧았고, 그것을 구현해 줄 기술도 거의 존재하지 않았기 때문에 놀라운 일이 아니다.

Image result for neurocomputer
출전: https://www.tutorialspoint.com/artificial_intelligence/artificial_intelligence_neural_networks.htm

그런데 Huang 교수는 물론이고 인공 두뇌(인공 지능과 혼동하지 말 것)를 연구하는 학자와 전문가들은, 폰 노이만과 앨런 튜링(Alan Turing)에서 출발한 컴퓨터와 인공지능에 대한 연구가 잘못된 방향을 걷고 있다고 생각한다. 그들이 제기하는 비판의 근거는 무엇보다 그들이 인간 두뇌가 어떻게 지능을 생산하는 지를 완전히 이해하지 못하고 있다는 것이다. 만약 그런 방식으로 AGI(그것은 strong AI라고 부르기도 함)를 발명하려면 인간 두뇌와 지능을 완전히 해독해야 하는데, 그것은 1백년 내 실현되기 어려울 것이라는 주장이다. “지능을 만들기(making intelligence)” 위해 먼저 “지능을 이해하기(understanding intelligence)”는 크게 잘못된 접근이라는 것이다. 전자가 후자보다 더 쉬운 작업인데, 후자를 먼저해야 한다면, 그것은 어려운 작업을 먼저 해결한 다음 쉬운 작업을 해결하겠다는 논리적 오류에 빠지는 일이라는 비판이다. 그는 심지어 그러한 접근이 말 앞에 수레를 연결하는 것만큼이나 잘못되었다고 지적한다.

대안으로 그는 모방주의(imitationalism)를 주창한다. 리버스 엔지니어링(reverse engineering)을 통해서 인간 두뇌의 물리적 구조를 밝히고 그것을 모방한 기계를 만들어 가자는 주장이다. 그것은 현실적으로 가능할 뿐 아니라 궁극적으로 인간 두뇌-지능을 이해하는 지름길이기도 하다고 역설한다.

그는 인간 두뇌의 생물학적 신경세포 시스템과 동일한, 혹은 그것과 최대한으로 유사한 물리적 구조를 지닌 컴퓨터를 개발하는 것이 모방주의 접근의 핵심 과업이라고 주장한다.  그 물리적 모방 엔지니어링(physical imitation engineering)의 목표는 신경세포와 시냅스의 기능을 모사할 수 있는 초소형 기기를 개발하여, 궁극적으로 아주 소규모의 물리적 공간과 적은 전력 소모라는 조건 아래에서 인간 두뇌급의 신경망 시스템을 구축하는 것이다. 그것은 신경 컴퓨터(neuromorphic computer, 간략히 neurocomputer)라고 불리는데, 그것에 대한 연구와 개발이 이미 상당히 진척되었다고 한다.

Image result for truenorth chip
출전: https://www.slideshare.net/SamMbc/ibm-truenorth

그에 의하면, 2008년 미국의 DARPA(Defence Advanced Research Projects Agency)는, 1kW의 전력만을 사용하면서(인간 두뇌는 약 30 와트의 전기를 사용함) 인간 두뇌의 신경세포와 같은 수준의 능력을 지닌 전자 기기를 개발하도록 IBM과 몇 개의 대학에 1억달러의 연구기금을 제공하였고, 2013년 유럽은 1억 유로 이상을 투입하여 정보기술과 생명과학을 결합하는 인간두뇌 프로그램을 시작하였으며, 같은 해에 미국의 오바마 대통령은 12년 내에 인간 두뇌의 역동적 지도를 그리겠다는 BRAIN Initiative에 45억 달러가 투입될 것이라고 발표했었다.

실제적인 성과도 가시화되어서, 2014년 8월 Science 지에, IBM은 1백만개의 (인공) 신경세포와 2억5천6백만개의 (인공) 시냅스로 구성된 트루노스(TrueNorth)라는 신경칩(neuromorphic chip)의 개발에 성공했다고 발표했다. 또한 2015년 독일의 하이델베르크 대학은 20만개의 신경세포와 5천만개의 시냅스를 8인치 웨이퍼에 집적하는데 성공했다. 신경컴퓨터는 300억개 이상의 신경세포와 3조개 이상의 시냅스로 구성된 인간 두뇌에 비하면 아직 유아적 수준에도 미치지 못하지만 신경컴퓨터 연구자와 개발자들은 인공신경망이나 인공지능에 비해 신경컴퓨터가 훨씬 빨리 AGI를 구현하게 될 것이라고 믿는다.

출전: http://www.scinexx.de/diaschau-117.html

신경컴퓨터 연구자들의 대전제는 기능(function)이 구조(structure)에서 나온다는 명제이다. 그것은 인간 두뇌의 신경세포와 시냅스와 최대한으로 유사한 물리적 구조를 지닌 지능적 기기–즉, 신경컴퓨터–를 개발하면 인간 두뇌급의 지능이 그것으로부터 창발되고(emerging) 성장할 수 있으리라는 믿음이다.

인공생명(artificial life, A-life)은 인공지능이나 인공두뇌와는 크게 다른 수준의 게임이다. 그것은 신경세포(neuron)가 아니라 신경세포의 세포핵(nucleus) 내부에 존재하는 RNA, DNA, 그리고 단백질을 스스로 창조하는 RNA를 인공적으로 만드는 도전이다. 그것은 생명을 모방하는 객체를 만드는 일일 수도 있고, 진짜 생명체를 창조하는 일일 수도 있다. 인공생명 연구의 아버지라고 불리는 존 폰 노이만–컴퓨터의 구조를 창안한 바로 그 폰 노이만–은 인공생명 연구에도 관심을 가졌다. 그가 일찍 세상을 떠나지 않았다면 인공생명에 대한 연구가 더 일찍 발달했을 지도 모르겠다.

Related image
출전: http://www.maxxtexx.de/dna-dient-als-erfahrungs-speicher-fuer-nachkommen/

폰 노이만은 생명의 핵심이 자기복제(self-reproduction)에 있다고 이해했다. 그의 정의에 따르면 오늘날 자기복제가 가능한 컴퓨터 바이러스는 하나의 인공생명이라고 말할 수 있을 것이다. 그러나 엄밀히 말하자면 그것은 진짜 생명이 아니라 생명의 흉내내기에 지나지 않는다. 물론 그것만으로도 인류를 위협할 정도이지만 인공적으로 창조된 생명체와는 거리가 아주 멀다. RNA, DNA, 단백질 등으로 구성된 세포핵을 지닌 생명체인 인간이 세상을 인식하고, 자신을 의식하며, 성장하고 진화하고, 자신을 재생산하는 위대한 모습을 생각해 보라.

Image result for great human beings
출전: https://hubpages.com/education/inspiringpeople

인공생명의 연구와 개발은 아직 인공지능은 말할 것도 없고 인공 두뇌의 연구에 비할 바가 아닐 정도로 낮은 수준이다. 그러나 향후 20~30년 후 기술적 특이점(singularity)–기계의 두뇌가 인간의 두뇌를 넘어서는 시점–을 지나고 나면 인공지능, 인공 두뇌 그리고 인공생명에 대한 연구는 인간 자신이 아니라 A.I.나 인공두뇌에 맡겨질 지도 모른다. 그렇게 되면 인공 생명, 나아가 생명의 창조의 시기가 크게 앞당겨질 지도 모를 일이다. 바로 그 시점이, 인간이 진정한 창조주로 등극하는 순간이다!

그런데, 그런데…. 과연 그것이 인류에게 축복일까 저주일까? 페이크 뉴스(fake news) 정도로 크게 흔들리는 인간 문명이 과연 인공지능, 인공두뇌, 그리고 인공생명을 사회적으로 감당할 수 있을까? 다음에는 이 문제를 생각해 보자. (윤영민, 2018-02-26)

<참고 문헌>

Huang,  Tie-Jun. 2017. “Imitating the Brain with Neurocomputer”, Internation Journal of Automation and Computing 14(5). Pp.520-531.

von Neumann, John (ed. by Michael D. Godfrey). 1945. “First Draft of a Report on the EDVAC.”  http://history-computer.com/Library/edvac.pdf

지능이라는 이름의 게임(7): 지능기계 설계자의 해석

앞 포스팅에서 소개한 이대열 교수의 저서가 진화생물학과 행동심리학의 관점에서 지능에 접근한 사례이라면, 이 포스팅에서 소개할 제프 호킨스(Jeff Hawkins)의 저서 <On Intelligence>(2004)는 컴퓨터과학 배경의 소프트웨어-하드웨어 개발자가 두뇌와 지능 연구자들에게 던지는 대담한 도전장이다.

Image result for on intelligence Image result for 생각하는 뇌 생각하는 기계

Hawkins가 지능과 두뇌에 관심을 갖기 시작할 때 던졌던 질문은 아주 명쾌하다. 지능(intelligence)이 무엇인가 이다. 이 의문은 인간의 두뇌가 근본적으로 어떤 점에서 지능적인가라는 질문과 바로 이어진다. 인간의 두뇌는 지상에서 가장 진화된 지능을 지니고 있기 때문이다. 그는 진정으로 지능적인 기계를 만들려면 먼저 인간의 두뇌를 제대로 이해해야 한다고 믿었다. 그는 기존의 연구들에서 자신의 의문에 대한 시원한 답을 찾을 수 없었고, 그래서 스스로 답을 제시하게 되었다. <On Intelligence>에는 Hawkins의 해답이 담겨 있다.

지능을 탐구하면서 그는 지금까지의 컴퓨터과학이 인간 지능(human intelligence)을 모사하는데 실패한 이유가 인간의 지능과 두뇌를 이해하지 못했기 때문이라는 결론에 도달했다. 그에 의하면, 인간의 두뇌는, 투입(input)이 들어가면 산출(ouput)을 내놓는 논리 기계나 정보처리 시스템이 아니며, 지능은, 튜링 테스트(Turing test)처럼 행동(behavior)을 측정하는 방식으로는 결코 이해될 수 없다. 지능이 무엇인지는, 간접적이거나 우회적인 방식이 아니라 두뇌의 내부 작용을 가지고 직접 규정해야 한다는 것이다.

Hawkins에 의하면, 인간 두뇌는 몇 가지 점에서 컴퓨터와 크게 다르다. 첫째, 두뇌는  S/WH/W의 구분이 없다. 지능을 주로 담당하는 대뇌 신피질은 신경세포와 시냅스로 구성된 네트워크인데, 그것은 전기-화학적 신호에 의해 작동하는 구조이지 그것들을 제어하는 별도의 S/W(혹은 그것과 유사한 무엇)가 존재하지 않는다. 

둘째, 컴퓨터와 달리 두뇌는 유전적 영향을 받기도 하지만 태생 후 성인이 될 때까지 발달하고  성인이 된 후에도 외부 자극과 경험에 의해 변화된다. 발달 단계로 보면 인간의 두뇌는 두 살 무렵에 뉴런-시냅스 조합이 폭발적으로 늘어나고, 그 다음 몇 년 동안 불필요한 뉴런-시냅스 조합은 점차 제거되며, 청소년기에 다시 한번 뉴런-시냅스 조합이 폭발적으로 증가한 후 성인이 될 때까지 불필요한 뉴런-시냅스 조합의 제거가 이루어지고 25-6세경 안정 단계에 도달한다. 그러나 성인이 된 후에도 뉴런-시냅스 조합은 계속 변화된다. 두뇌의 구조가 변하는 현상을 신경(혹은 두뇌) 가소성(neuroplasticity)이라고 부른다. Hawkins는 이러한 인식을 수용한다. 

셋째, 컴퓨터와 달리 두뇌는 대단히 유연하다. 두뇌의 특정 영역이 특정 기능만을 담당하지 않는다. 때문에 만약 어떤 부위가 손상을 받으면 그 부위가 맡던 기능을 다른 부위가 대신 수행하곤 한다. 이는 컴퓨터에서 상상하기 어려운 현상이다.  

이러한 차이를 인정하면서 Hawkins는 지능과 두뇌의 관계에 대해 기억예측 모형(memory-prediction model)이라는 가설을 제시한다. 그 모형을 요약하면 다음과 같다.

Image result for memory prediction model hawkins

지능은 인간의 두뇌에서 일어나는 정신적인 작용이다. 외부로부터 감각기관을 통해서 경험하는 자극(감각 정보)이 두뇌에 전달되면 신피질에서 그것은 전기-화학 신호로 전환되고 뉴런과 시냅스가 연결된 조합이 생성된다. 신피질에는 그렇게 해서 생성된 수많은 조합이 존재하며, 그것이 기억(memory)이다

가장 추상적인 수준에서 기억은 공간적시간적 패턴(spatial-temporal patterns)인데, 그것은 입력되는 감각 정보의 유형과 관계없이 항상 범주(category)와 순서(sequence)라는 요소로만 구성되어 있기 때문에 Hawkins는 그것을 불변표상(invariant representations)이라고 부른다(아래 그림 참조).

그에 의하면인간 두뇌는 ‘논리 기계라기보다는 ‘기억 기계이다두뇌는 끊임없이 분류하여 기억하고기억을 복원해서 예측/확인하고비교/판단한다신피질은 여섯 층(layers)의 구조를 지니고 있는데자주 반복적으로 입력되는 정보의 불변표상은 낮은 층으로 내려보내 외부 자극에 신속하게 반응하게 하고낯선 정보들은 상부 층으로 보내서 불변표상을 생성하며최 상위 층(Layer I)에서도 파악되지 않은 정보는 해마(hippocampus)로 보내 기억한다. 층2나 층3도 부분적으로 그렇지만 층1은 여러 영역으로부터 받은 정보를 결합(association)하는 역할을 수행한다(아래 그림 참조). 

Hawkins는, 신피질이 계층적 구조를 지닌 이유는 바로 현실세계가 그러한 계층적 구조를 지니고 있기 때문이라고 지적한다. 예컨대 문어(written language)를 보면, 글자가 모여서 음절이 되고, 음절이 모여 단어가 되며, 단어가 모여서 문장이 된다. 또한 세상의 모든 객체(object)는 작은 객체들의 집합이며, 대부분의 객체들은 보다 큰 객체들의 일부이다. 신피질의 계층 구조는 이러한 현실세계의 계층구조에 조응하고 있다는 것이다.

일단 기억들이 생성된 후에는, 감각 기관을 통해서 자극이 전달되면 그에 관련된다고 추정되는 불변표상이 호출되고, 그것을 이용해서 시간적으로 뒤따라 오는 정보를 예상한다(아래 그림 참조). 만약 새로 들어온 감각 정보가 불변표상을 가지고 예측한 모습과 일치하면 기존 뉴런시냅스의 조합이 유지되고, 만약 불일치하는 부분이 나타나면 그에 대해 새로운 판단이 내릴 수 있도록 조치한다. 만약 그러한 불일치가 반복되면 기존의 뉴런시냅스 조합이 갱신된다. 그러한 분류, 패턴 생성, 기억, 예측, 강화, 갱신 등의 과정이 바로 학습이며, 과거(기억)에 대한 유추를 통하여 미래를 예측하는 두뇌의 능력이 바로 지능이다.

진화적으로 보면, 신피질이 확대되고, 언어를 사용함으로써 인간의 지능은 다른 포유동물에 비해 획기적으로 향상되었으며, 고도의 상상, 창조, 논리적 추론 등이 가능해졌다. Hawkins에 의하면, 그럼에도 불구하고 인간 지능은 기억-예측 모형을 벗어나지 않는다. 

Image result for memory prediction model hawkins

Hawkins는 단순히 두뇌-지능을 연구만 할 뿐 아니라 직접 Numenta 라는 기업을 창업해서 연구와 기술 개발을 결합하고 있으며, 실제로 HTM (Hierarchical Temporal Memory)이라는 테크놀로지를 개발하였다(위 그림 참조). 그는 HTM을 이용하여 아직 상업화하지는 않았지만 여러 분야의 이상 탐지(anomaly detection)에 활용될 수 있는 애플리케이션들을 내놓고 있다.  (윤영민, 2018-02-25)

지능이라는 이름의 게임(6): 두뇌-지능의 수수께끼를 풀어라!

세계 신경과학회(Society for Neuroscience)에는 3만8천명 이상의 회원이 가입되어 있으며 2017년 11월 미국 워싱턴 D.C.에서 개최된 신경과학 연례 컨퍼런스에는 3만명 이상의 학자와 전문가들이 참석하였다. 그 중에는 뇌와 신경 분야의 질병과 치료를 전공하는 의사들도 포함되어 있지만 참가자 대부분이 두뇌를 연구하는 학자들이라고 보면 될 것이다. 다시 말해  전세계적으로 수만 명의 학자와 전문가들이 인간 두뇌에 관심을 갖고 있다는 말이다. 덕분에 두뇌-지능(brain-intelligence)에 관해서 필자와 같은 비전공자가 따라잡기 불가능할 정도로 깊이 있고 다양한 연구가 발표되고 있다.

신경과학 연구의 핵심은 인간의 행동(혹은 의식)과 두뇌 구조 사이의 관계이다. 하지만 연구자에 따라 연구의 관점과 촛점이 크게 다르다. 어떤 연구자는 진화생물학적인 관점에서 접근하고, 어떤 연구자는 행동심리학적 관점에서 접근하며, 어떤 연구자는 두뇌의 기능적 측면에 관심이 있고, 어떤 연구자는 두뇌의 구조적 측면에 관심이 많다. 그런데 연구 성과들이 거의 대부분 뇌의 특정 영역이나 특정 기능을 다루고 있어, 필자와 같은 외부자들이 이해하기 쉽고, 두뇌-지능을 전체적으로 바라보게 해주며, 나아가 독창적인 이론적 관점을 담고 있는 논문이나 저서가 흔치 않다.

다행히 그런 저작 몇 편을 찾았다. 함께 그것들을 리뷰하면서 지능-두뇌를 이해해 보자. 먼저 예일대 신경과학과에 재직 중인 이대열 교수의 최근 저서, <지능의 탄생>(2017, 바다출판사)이다.

Image result for 지능의 탄생

이 교수는 지능을 생존을 위한 의사결정(decision making)으로 본다. 생물체의 진화는 지능(intelligence)의 진화를 수반한다. 생명의 핵심은 유전자의 자기복제인데, 유전자는 RNA에서 시작하여 DNA와 단백질로 분화하고, 단세포 생물체에서 다세포 생물체로, 식물에서 동물로, 곤충에서 파충류, 그리고 인간이 속한 포유동물에까지 진화한다. 각 생물체는 자신의 생존에 적합한 지능을 갖고 있다. 단순한 생명체는 낮은 지능만을 갖고 고등 동물은 높은 수준의 지능을 갖는다. 특히 날쌔게 움직여야 살아남을 수 있는 동물들에게는 신경세포가 모인 두뇌(brain)가 발생하였고, 예측과 판단을 위한 대뇌 신피질(cerebral neocortex)이 발생하였다. 특히 복잡한 사회생활을 해야하는 인간은 다른 동물에 비해 크고 복잡한 구조의 신피질을 갖게 되었다.

그런데 인간의 신피질은 세상에 태어나는 순간에 완성체로 출현하는 것이 아니라 성장 하면서 발달하고 살아가면서 변화된다. 의사결정에는 기억, 분류, 개념화, 비교, 예측, 그리고 학습이 필요하다. 감각기관을 통해서 외부의 자극을 받으면 신피질, 해마, 기저 핵 등에 신경세포-시냅스 네트워크가 형성되고, 일종의 학습 과정을 통해서 기억은 강화되거나 약화되고 혹은 소실된다.

지능은 기억을 가지고 하는 생존 게임이다. 유전자는 효과적인 생존을 위해 두뇌에게 자율성을 부여한다. 그래서 두뇌는 스스로 판단에 의해 생존–유전자의 자기복제–에 가장 유리한 행동을 선택해야 한다. 경험을 통해서 환경에 관한 정보를 인지하고 분류해서 저장해두고(기억), 특정 상황에서 취한 행동과 그것의 결과(보상, reward) 사이의 관계를 기억한다. 그리고는 새로운 자극이 들어오면 관련된 기억을 활성화하여 여러 가지 행동 옵션을 비교하여 선택한다.

Image result for reinforcement of memory in brain
출전: http://www.sashasheng.com/blog/2018-1-6-reinforcement-learning-taxonomy

경쟁하는 욕구들 혹은 가능한 행동들 사이에서 의사결정을 하려면, 다양한 옵션들의 예상 효과를 공통의 보상 척도로 측정할 수 있어야 하며, 각 옵션이 가져오는 당장의 영향 뿐 아니라 미래의 영향에 대해서도 그 값을 추정할 수 있어야 한다. 그 값들을 비교하여 두뇌–보다 구체적으로 대뇌 신피질–는, 항상 성공적인 결과가 보장되지는 않지만, 신속한 의사결정을 내린다.

이러한 과정이 학습(learning)이고 지능 작용인데, 거기에서 중요한 요소가 오류(error)와 가치(혹은 효용)이다. 두뇌는 저장된 과거 기억을 활용해서 행동이 가져올 가치(value)를 예견하고 행동을 명령한다. 행동한 이후에 생성된 가치가 예견된 가치보다 작거나 크면 보상 예측 오류(reward prediction errors)가 발생한다. 보상예측오류는 학습이 필요하다는 시그널이다. 두뇌가 행동의 가치값을 변화시킨다는 것이다. 그것이 학습이다.

Image result for reward prediction errors
출전: https://www.dialogues-cns.org/contents-18-1/dialoguesclinneurosci-18-23/

도파민(dopamine)은 보상예측오류를 반영하는 신경화학물질이다. 예상보다 결과가 좋으면 도파민 분비가 증가되어 다음 번에는 예측값을 높이도록 유도하고, 반대로 예상보다 결과가 좋지 않으면 도파민 분비가 감소되어 다음 번에는 예측값을 낮추도록 유도한다.

두뇌의 보상 예측 오류는 안도(relief)/후회(regret), 득의(elation)/실망과 같은 정서적 상태를 수반한다. 그러한 정서 상태는 두뇌가 기억을 강화할 것인지 갱신할 것인지를 결정하는 필요한 요소인지도 모른다. 이는 후회나 실망과 같은 부정적인 정서도 지능과정에 긍정적 역할을 수행함을 함축한다.

Related image
출전: www.planbox.com. https://www.planbox.com/2017/07/07/innovation-evolution-ai/

끝으로 생존을 위한 의사결정이라는 관점에서 보면 최고의 지능은 무엇보다 자율성을 지녀야 한다. 스스로 복제(reproduction)를 추구할 수 있어야 하고, 자기 복제(self-reproduction)를 위해 미래에 대비하거나 효과적인 의사결정을 내릴 수 있어야 한다. 인공지능(artificial intelligence)도 자기 복제 능력을 가질 수 있을까? 혹은 인공지능에게 자기 복제 능력을 허용해야 할 것인가? 이 교수는 언젠가 인공지능이 자기 복제 능력을 가질 정도로 테크놀로지가 발전하겠지만, 인공지능에게 자율성을 허용해서는 안 될 것이라고 주장한다. 인간과 인공지능 사이에 본인-대리인 문제(principal-agent problem)가 필연적으로 발생할 것이기 때문이다. 인간(본인)의 생존과 번영을 위해 존재해야 하는 인공지능(대리인)이 인간의 이익보다 자신의 이익을 우선시할 가능성이 있고, 그럴 경우 인공지능에 의해 인간의 생존이 위협받는 결과가 초래될 수도 있다는 것이다. (윤영민, 2018-02-25).

지능이라는 이름의 게임(5): 두뇌의 구조

필자가 지능과 두뇌에 대해 관심을 갖는 것은 지금 그것들을 중심으로 경천동지할 변화가 일어날 조짐을 보이고 있기 때문이다. 오래 전 두뇌에 대뇌와 대뇌 신피질(cerebral neocortex)을 지닌 생물체가 출현하면서 생물체의 지능이 획기적으로 향상되었듯이, 앞으로 일어날 인간 두뇌의 급진적 변화–이미 그 변화가 시작되었다–로 인해 지금까지와는 완전히 다른 지능을 지닌 존재가 출현할 것으로 예상된다. 머신 러닝과 A.I.의 발전에서 그 조짐이 확인된다.

더 이상 지능과 두뇌를 신경과학자, 심리학자, 생물학자, 컴퓨터 과학자, 혹은 인류학자들의 손에만 맡겨둘 수 없다는 판단이다. 이미 꽤 오래 전부터 참여를 시작한 경영학자나 경제학자는 물론이고, 정치학자, 사회학자, 미래학자, 법학자, 또는 행정학자들도 지능과 두뇌에 관한 담론에 적극 참여해야 한다. 지능과 두뇌에 관한 오늘날의 발전은 100여 전 우생학과는 비교할 수 없는 규모와 방식으로–훨씬 근본적이며 광범위하게–개인과 사회에 영향을 미칠 것이기 때문이다.

지능의 관점에서 두뇌를 잠시 살펴보자. 우선 두뇌를 전체적으로 놓고 보면, 지능과 관련된 부위는 뇌의 최상부–대뇌(cerebrum)–를 약 90% 정도 덮고 있는 신피질(neocortex)–‘새겉질’이라고도 불림–로 알려져 있다. 신피질은 식탁용 냅킨 정도의 크기, 그리고 명함 여섯장을 합쳐놓은 두께(약 2mm)이며, 약 300억개(1천억개라고 추정하는 학자도 있음)의 신경세포(neurons)로 이루어져 있다(Hawkins, 2004).

인간의 뇌는 놀랍도록 조밀하게 연결된 신경세포 네트워크일 뿐 아니라 유연성이 큰 신경세포 집합이기 때문에 뇌의 특정 부위가 특정 기능을 수행한다고 단정하는 것은 원칙적으로 바람직하게 생각되지 않는다. 이 원칙은 여기서 논의하는 지능에도 해당된다.

예컨대 지능의 구현에서 중요한 기억(memory) 기능은 신피질 뿐 아니라 해마(hippocampus)에 의해서도 수행한다[Hawkins(2004)는, 해마가 신피질에서 해석되지 못한, 새로운 자극을 저장하는 것으로 추정한다]. 이대열(2017)은, 해마에는 서술적 기억(declarative memory: 다른 사람에게 언어를 이용해서 설명해 줄 수 있는 기억)이 형성되고, 절차적 기억(procedural memory: 동작 순서에 대한 기억)은 기저핵(basal ganglia)에 형성되는 것으로 추정한다. 시상(thalamus)의 경우도 마찬가지이다. Eagleman(2015)에 의하면, 시상에는 수많은 시각  피질(visual cortex)이 연결되어 있으며, 외부에서 들어온 시각 정보와 대뇌에 있는 내부 모형(internal model)을 비교하여 발견되는 차이를 대뇌에 알리는 기능을 담당한다고 지적한다.


Related image

신피질의 지능 작용–분류, 기억, 예측, 비교, 이해, 상상 등–은 신경세포 네트워크(neural networks)를 통해서 이루어진다. 신경세포(neurons)는 전기-화학적(electro-chemical) 반응을 통해서 정보를 전달, 저장, 복원, 혹은 업데이트한다.  자극을 받으면 신경세포는 시냅스(synapse)를 통해서 다른 신경세포들과 연결되어 하나의 네트워크 구조를 형성한다. 신경세포 하나가 할 수 있는 일은 거의 없다.

신경세포는 세포체(soma)와 세포핵(nucleus), 세포체에 붙은 나뭇가지 모양의 수상돌기(dendrite), 축삭(axon)이라는 신경 섬유, 그리고 축삭종말(axon terminal)로 이루어져 있다. 이 중 세포핵은 다른 세포의 세포핵처럼 RNA의 생성과 같은 세포의 생명유지 기능을 담당한다. 수상돌기는 신경세포의 일종의 정보 접수 창구이다. 수상돌기는 이웃 신경세포로부터 화학적 신호를 받거나 감각기관으로부터 물리적 자극을 받으면, 세포체와 함께 활동 전압(action potential)을 생성한다. 이 전기적 신호는 축삭을 통해서 축삭 종말에 전달된다. 축삭 종말은 신경전달물질(neurotransmitter)을 분비해서 그 전기적 신호를 화학적 신호로 바꾼다. 그 신경전달물질은 축삭종말과 인접 신경세포의  수상돌기 사이에 존재하는 시냅스를 통해서 전달된다. 이 시냅스 연결이 강화되거나 약화되면서 하나의 신경세포 네트워크로서의 새로운 기억이 형성되고, 기존의 기억이 재구성되거나 소실된다.

Related image

Image result for 시냅스

Hawkins에 의하면, 대뇌 신피질의 각 영역(region)은 계층(layer)과 기둥(column)으로 이루어져 있다. 대부분의 신경세포들은 여섯 개의 층(layers)으로 이루어져 있으며, 각 계층은 서로 다른 역할을 맡고 있다(아래 그림 참조).

Related image
출전: thebrain.mcgill.ca. 항목 The Retina.
Cerebral cortex layers microanatomy
신경과학에서 Afferent는 들어오는 신경, efferent는 나가는 신경을 말함. 출전: 표는 Epomedicine.com에서 가져왔음.

위 표에서 보듯이 계층 1의 경우 자체의 신경세포는 소수에 불과하고 하위 계층의 신경세포의 수상돌기들로 채워져 있다. 이는 계층 1이 여러가지 정보를 결합하는 기능을 하고 있음을 추정하게 한다. 계층 4는 시상(thalamus)으로부터 정보를 받아서 다른 계층들이나 기둥들에게 전달하는 역할을 하고, 계층 6는 뇌간으로부터 정보를 받거나 시상으로 정보를 내보낸다. 계층2은 신피질의 다른 영역으로부터 정보를 받으며, 계층3은 외부로부터 정보를 받거나 내보내고, 계층5는 동작 운동(motor movements)을 일으키는데 관여하는 것으로 알려졌다. 기둥들이 하는 역할에 관해서는 잘 밝혀져 있지 않다. 다만 Hawkins는, 기둥 구조가 인식 대상의 정보가 여러 계층 사이를 효율적으로 전달되게 하며, 특히 여러 개의 기둥들이 병렬로 작동하여 대상에 대한 신속한 인식과 판단을 가능하게 해주지 않나 추정한다(Hawkins, Ahmad, and Cui, 2017).

두뇌 구조에 관한 소개는 이 정도로 마치고 이제 다음 네 편의 저술에 제시된 해석을 따라 가면서 지능과 두뇌의 관계에 대해 보다 깊이 생각해 보겠다.

  1. <지능의 탄생>(이대열. 2017): 진화생물학 및 행동심리학적 접근
  2. <On Intelligence>(Hawkins, 2004): 지능 기계(intelligence machine) 설계자의 관점
  3. <The Brain>(Eaglman, 2015): 인지 신경과학(cognitive neuroscience)(심리학+신경과학)적 접근
  4. “Imitating the Brain with Neurocomputer”(Huang, 2017): 신경컴퓨터(neurocomputer) 연구자의 관점

<참고 문헌>

이대열. 2017. <지능의 탄생>. 바다출판사.

Eagleman, David. 2015. The Brain. Pantheon Books.

Hawkins, Jeff. 2004. On Intelligence. Times Books.

Hawkins, Jeff, Subutai Ahmad, and Yuwie Cui. 2017. “Why Does the Neocortex Have Columns, A Theory of Learning the Structure of the World.”

 https://www.biorxiv.org/content/biorxiv/early/2017/09/28/162263.full.pdf

(윤영민, 2018-02-24)

지능이라는 이름의 게임(4): 구별-분류-예측-판단-행동

지능(intelligence)을 환경으로부터의 도전 속에서 개체(entity)가 살아남는 능력이라고 규정한다면, 지능이 작동하는 과정은 아래 그림으로 표시될 수 있을 것이다.

개체는 환경(혹은 대상)을 인지하고(인지, cognition) 거기에 반응한다(행동, action). 예컨대 호랑이(대상)를 발견한(인지) 사슴(개체)은 전력을 다해 달아날 것(행동)이다.

개체는 환경(혹은 환경의 변화)에서 발생되는 신호(signals)를 감지하고 그것을 분류하고 판단하며, 거기에 대해 특정한 반응(행동)을 한다. 개체의 두뇌(혹은 기능적으로 두뇌의 역할을 하는 부분)는  감지된 대상이 위험한가 안전한가 혹은 적군인가 아군인가를 판별하고 그에 따라서 어떻게 반응할 것인지를 결정한다. 여기까지를 인지 과정이라고 할 수 있다.

앞 글에서 논의했듯이 20세기에는 인지 과정 혹은 인지 과정의 일부만을 지능으로 간주하는 것이 대세였지만, 결과주의적 경향이 강한 21세기에는 행동까지를 지능에  포함시키고 있다. 지능은 환경 혹은 환경의 변화 속에서 살아남는 능력을 가리키기 때문이다.

그런데 인지 과정과 행동 과정을 좌우하는 요인들이 다르다. 인지 과정에는 정보, 지식, 경험 등의 기억(memory), 기억의 선별적 복원(retrieval), 조합, 구분, 비교, 그리고 선택에 관련된 요인들이 관여된다. 행동 과정에는 공감, 의지, 용기, 반응 속도, 에너지, 선택과 집중, 결단 등이 관여될 것이다. 지능을 결정하는 데 있어 인지 능력이 단연 중요하기는 하지만 행동 능력의 중요성도 작지 않다. 예컨대 설령 사슴이 호랑이를 발견했다고 하더라도 공포에 사로 잡혀 움직이지 못한다면 그 사슴은 살아남지 못할 것이다.

여기서는 행동 능력에 대한 논의는 뒤로 미루고 먼저 인지 능력에 관해 살펴보자.  최근 심리학, 생물학, 그리고 신경과학이 크게 발전하였지만 아직 인지과정에 대한 이해가 높은 수준이라고 말하기는 곤란하다. 인간이나 동물의 인지가 두뇌에서 어떻게 일어나는지가 완전히 밝혀지려면 한참 더 많은 학술적 진전이 있어야 할 것이다. 아직 어떤 학문도 뛰어난 작곡, 페인팅, 작시, 작문, 학문적 추론 혹은 초인적인 상상이나 예견이 어떻게 가능한가를 설명하지 못한다. 그러나 인지 과정에 관해 현재까지 밝혀진 것만 해도 대단하기 때문에 그 정도 수준에서라도 논의할만한 가치가 충분하다.

옥스포드 영어사전에 따르면, 인지(cognition)란 사고(), 경험, 감각을 통해서 지식과 이해를 획득하는 정신적 과정을 총체적으로 가리키는 전문 용어이다. 그런데 지식과 이해를 얻는다는 말이 무슨 의미일까?

Image result for cognition

 

인지를 더 이상 해체할 수 없을 때까지 분해하면 마지막에 도달하는 작용은 아마도 구별(혹은 식별, distinguish)일 것이다. 구별이란 차이를 알아차리는 것이다. 차이(difference)를 알아차리려면 어떤 기준(criterion)을 가지고 대상들을 비교해 판단해야 한다. 대상들을 구별하면 그것들은 구분(혹은 분류, classify)된다. 분류(구별과 혼동되기 쉬운 구분이라는 말 대신 이 용어를 쓰겠다)란 어떤 기준을 가지고 대상들을 범주화하는 정신 작용이다. 대체로 범주(categories)의 수는 대상(objects)의 수보다 작다. 덕분에 우리는 대상들을 효율적으로 인식할 수 있다.

우리는 끊임없이 세상을 구별하고 분류한다. 그것은 생존을 위해서 필수적이다. 우리는 생물과 무생물, 동물과 식물, 여자와 남자, 덥다와 춥다, 뜨겁다와 차다, 적과 동료, 낮과 밤, 봄/여름/가을/겨울, 아름답다와 추하다, 좋아하는 것과 싫어하는 것, 죽은 것과 산 것, 선과 악, 진실과 거짓 등등, 구체적일 수도 있고 추상적일 수도 있는 대상들을 구별하여 분류한다. 구별-분류가 중단되는 순간 우리는 생존을 위협받게 될 것이다.

인지 능력이 발달한다는 말은 근본적으로 분류하는 능력이 강력해짐을 의미한다고 해도 과언이 아니다. 곤충보다는 포유동물이, 포유동물 중에서도 개나 고양이보다는 사람이, 아이보다는 어른이,  교육을 받지 않은 사람보다는 교육을 많이 받은 사람이 대상을 더욱 정교하게 혹은 더욱 복잡하게 분류할 수 있다.

Related image

인간은 언어를 사용하기 때문에 분류된 대상을 추상적인 개념(concept)으로 규정할 수 있다. 개념화(conceptualization)란 어떤 대상이 다른 존재들과 구분되어 인식될 수 있도록 일종의 이름을 부여하는 정신 활동이다.

정신적으로 성장한다는 것 혹은 교육을 받는다는 것은 무엇보다 분류 능력과 개념 작용(conception)의 향상을 의미한다.  지적으로 성장하면 이전에는 보지 못했던 대상이 눈에 들어오기도 하고 대상들 사이의 미세한 차이를 감지할 수 있으며, 나아가 그것을 정확하고 정교하게 표현할 수 있게 된다.

학문의 발달도 분류와 함께한다. 흔히 분류체계(taxanomy)와 함께 학문이 시작하고, 학문이 발달하면 분류체계도 정교해진다. 식물의 분류, 동물의 분류, 질병의 분류, 병원균의 분류, 집단의 분류, 사회의 분류, 인종의 분류, 직업의 분류, 문헌의 분류 등등 분류에 관해서는 끝을 찾기 어려울 정도로 긴 목록이 존재한다.

Journal of Classification

그런데, 분류는 어떻게 가능한 것일까? 그리고 왜 분류를 하는 것일까?

아마도 분류를 가능하게 해주는 것은 무엇보다도 기억(memory)일 것이다. 우리의 두뇌에는 살아오면서 학습된 개념, 이미지, 경험, 이론 등이 내장되어 있다. 그리고 그 때 그 때 일부 기억들이 복원(retrieve)되면서 대상들을 비교하고 판단하는 기준이 된다. 만약 우리가 기억할 수 없고, 혹은 기억을 적절히 복원할 수 없다면, 우리는 인식을 위한 비교 대상, 판단 기준을 가질 수 없고, 따라서 인지가 불가능하게 된다.

분류 자체가 목적일 수는 없을 것이다. 분류는 궁극적으로는 당연히 유전자의 자기복제, 즉, 생존을 위한 것이겠지만, 좀 더 직접적으로 우리는 무엇을 위해서 끊임없이 분류하는 것일까? 분류가 무엇을 가능하게 하여 생존에 기여하는 것일까?

분류는 예측(predictions), 판단(judgement),  또는 행동(action)을 위한 것이 아닐까 생각된다. 분류와 예측은 동어반복일 수도 있다. 분류는 예측의 한 형태이기도 하고, 예측은 분류의 한 형태일 수도 있기 때문이다. 일단 두 가지를 별개의 정신 과정으로 본다면, 분류는 예측을 가능하게 해주는 요건이라고 말할 수 있다. 예컨대 앞에 서 있는 사람이 위험 인물로 분류되면, 그가 육체적으로 공격하거나 속임수를 쓰지 않을까 우려된다(예측). 만약 그럴 것이라고 판단되면(판단) 그 사람을 피하거나 마음의 준비를 단단히 할 것이다(행동). 혹은 지금 걷고 있는 길이 막다른 골목이라고 간주되면(분류), 더 이상 갈 수 없게 될 것이라 예상하고(예측), 되돌아가기로 결정하며(판단), 실제로 발길을 돌릴 것이다(행동).

인지를 담당한 신체 부위는 두뇌(brain)이다. 인간의 신체 중 가장 중요한 부위는 두뇌이다. 법적으로도 두뇌가 사람의 정체(성)을 결정짓는다고 본다. 어떤 사람이 뇌사 판정이 나야 사망으로 간주된다. 최근에 두뇌 이식이 시도되고 있는데, 정확히 말하자면 두뇌 이식이 아니라 신체 이식이다. 두뇌에 다른 사람의 신체를 갖다 붙이는 것이다.

그런데 두뇌에서 인지 작용은 어떻게 진행되는 것일까?(윤영민, 2018-02-13).

지능이라는 이름의 게임(3): 새 패러다임

지난 20여년 사이에 집단지성(collective intelligence)은 수 억명의 인터넷 사용자들에게 일상의 일부가 되었고, 아주 최근까지도 겨우 영화적 상상 속에서나 존재감을 보여주던 인공지능(artificial intelligence, A.I.)은 단기간에 대중을 기대와 우려의 혼돈 속에 밀어넣고 있다. (집단지성보다는 집단지능이 collective intelligence의 더 적합한 역어이다.) 예컨대 아마존 닷컴, 옥션, G-마켓 등 온라인 상점에서 고객은 별점 정보와 댓글을 확인하며 판매자의 신뢰와 상품의 품질에 대해 판단하고, 거래가 끝나면 별점을 매기고 댓글을 올려서 판매자와 상품을 평가한다. 아마도 전세계적에서 매일 수천 만  혹은 수억 건의 온라인 거래가 그런 방식으로 이루어지고 있을 것이다. 그것은 다름 아닌 집단지능이 일상화된 예이다. SNS의 맞춤형 친구 추천, 검색 사이트의 개인화 서비스. 인터넷 쇼핑몰이나 인터넷 서점의 맞춤형 상품 추천 , 스마트폰의 음성 어시스턴트, A.I. 스피커의 음성 제어, 자율주행 자동차, 자동화 공장, 드론 등 인공지능의 목록은 이미 끝을 알 수 없을 정도이다.

Image result for ai examples in everyday life

이러한 현상을 지능(intelligence)의 관점에서 파악하려다 보면, 우리는 중대한 결정을 내려야 한다. 지능에 대한 20세기적 패러다임, 즉, IQ 패러다임을 포기하던지 아니면, 그러한 현상을 지능이 아니라 다른 개념으로 표현해야 한다. 지능 개념의 현실 부적합 정도가 심각하다는 의미이다. 아무 일도 없었던 것처럼 지능이라는 용어를 그대로 쓸 수는 없다. 필자는 지능에 관해 새로운 패러다임이 요구된다고 본다. 집단 지능이나 인공지능을 굳이 지능이 아닌 다른 용어로 표현할 필요가 없다는 말이다.

1) 그렇다면 지능을 어떻게 규정해야 할까? 앞 글에서 지적한 IQ 패러다임의 다섯 가지 특성을 재고하면서 논의해 보자. 지능은 정신적인 능력(mental capability)인가? 지능이 추론, 문제 풀이, 추상적 사고, 이해, 학습, 기억 등을 포괄하는 정신적 능력인가? 정신적인 능력으로만 지능을 정의하면 우리는 두 가지 문제에 봉착하게 된다. 첫째, 지능이 어디서 나왔는지, 그리고 왜 출현하였는지에 대해 설명할 수 없게 된다. 둘째, 정신(mind)이 없으면 지능이 없다는 함정에 빠지게 된다. 정신은 두뇌(brain)를 가진 존재만이 갖게 되는데, 두뇌가 없으면 지능이 없는 것으로 간주하게 된다. 예컨대 두뇌가 없는 식물이나 사물은 지능을 가질 수 없게 된다.

Image result for 지능의 탄생

지능에 대한 좀 포괄적인 정의를 보자. 신경과학자 이대열(2017: 26)은, 지능을 “다양한 환경에서 복잡한 의사결정의 문제를 해결하는 능력”이라고 정의한다. 환경에서 생존과 번영–그것을 이 교수는 유전자의 자기복제라고 한다–에 관련된 문제를 발견하고 그것을 해결하는 능력이라는 의미이다. 행동과 결과에 촛점을 맞춘 이 정의는 앞의 두 가지 문제를 피해갈 수 있게 해준다. 지능을 진화론적, 발생론적으로 접근할 수 있고 지능을 정신 혹은 두뇌와 분리해서 생각할 수 있다는 말이다.

2)  지능은 개인적인 능력인가? 만약 지능이 정신 능력이 아니라 생존을 위한 문제 해결 능력이라면, 더 이상 지능은 개인적인 속성으로만 간주될 수는 없다. 환경이나 주위로부터 도전은 개인적인 차원을 넘어서 집단적으로 접근해야 더 잘 대처할 수도 있기 때문이다. 적지 않은 생물학자들이 지적하듯이 개체들 사이의 경쟁이 아니라 개체들 간의 협력(collaboration)이 유전자의 자기복제, 즉, 생존과 번영에 효과적으로 도움이 될 수 있다(크로포트킨, 2005; 벤클러 2015;  이대열, 2017).

Image result for 초협력자

1990년대 인터넷이 대중적으로 보급되면서 인터넷을 통해서 나타나는 새로운 유형의 지능 현상에 주목하는 사회과학 저술이 등장하였다. 그것은 집단지능(collective intelligence: 레비, 1994/2002; 셔키, 2008; 리드비터, 2009)이라고 불리기도 하고, 군중의 지혜(wisdom of crowds: 서로위키, 2004)라고 불리기도 했으며, 군집지능(swarm intelligence: Gloor, 2006)이라고 불리기도 했지만, 모두 동일한 방향을 가리키고 있었다. 그것은, 인터넷 상에서는 중앙의 조정 없이도 많은 사람들이 생존에 관련해서 높은 수준의 지능, 즉, 상황 대처 능력, 문제해결 능력을 가질 수 있다는 사실이었다. 가장 최근에 등장한 블록체인(blockchain)도 집단지능의 일종이다. 그것은 P2P 기술을 이용하여 사람들의 협력을 유도하고 그것을 기반으로 교환(거래)에 요구되는 신뢰와 인증 문제를 해결하고 있다(Norman, 2017).

3) 지능은 선천적인 능력인가? 집단지능을 지능 혹은 지능 현상으로 인정하면, 지능이 선천적인 것이냐 양육될 수 있는 것이냐는 하는 논의는 무의미해진다.  집단 구성원의 상호작용, 특히, 협력을 통해서 창출되는 지능은 정의상 천부적일 수 없기 때문이다.

더구나 아직 충분히 실현되었다고는 말할 수 없지만, 화학적, 물리적 혹은 의학적 처치로 지능을 일시적으로 강화시키거나 무생물에게마저 인위적으로  지능을 부여할 수 있는 시대가 된다면, 지능은 더 이상 자연적인라고도, 양육을 통해서 얻어질 수 있는 것이라고도 말할 수 없는 하나의 기능(function)이 된다. 이미 신경 향상(neuro-enhansment) 기술의 초기 버전이라고 할 수 있는 모다피닐(Modafinil)은 기면증 치료제로 개발되었음에도, 대학생, 컨설턴트,  심지어 군인들이 집중력을 높이기 위한 두뇌 강화제로 사용하고 있으며(Battleday et. al., 2015), 인공지능-로봇은 안내, 문서처리, 회계 등과 같은 정부 업무를 수행하기 시작했다(Baart, 2016).

Related image

4) 지능은 IQ 테스트와 같이 동일한 척도로 측정되고 비교될 수 있을까? 알파고처럼 바둑을 두는 A.I., 전자제품을 자율적으로 제어하는 A.I., 전투를 수행하는 A.I. 로봇, 화성을 탐험하는 A.I.로봇, 자율주행차, 산업스파이용 A.I. 드론, IBM Watson 같은 암진단 전용 A.I.,  그리고 가사용 A.I. 로봇처럼 특정한 분야에서 특정한 기능을 수행하는 A.I.가 빠르게 증가하고 있는데, 그러한 A.I.들의 지능 수준이 어떻게 측정되고 상호 비교될 것인가. 또 서로 다른 분야, 서로 다른 기능을 수행하는 A.I.의 지능이 설령 비교될 수 있다고 하더라도 그것이 무슨 의미를 갖겠는가.

Image result for alphago zero vs human

5) 지구상에서 인간이 가장 높은 지능을 지니고 있을까?  인간은 생물 중 가장 복잡한 문제들에 관해 의사결정을 할 수 있는 존재이다. 이대열 교수(2017)는, A.I.가 스스로 자신을 복제하고, 그 복제를 위해 두뇌를 사용할 수 없는 한 A.I.의 지능이 높은 수준이라고 말할 수 없다고 주장한다. 그는 먼훗날 A.I.가 그렇게까지 진화할 수 있을지도 모르겠지만 가까운 시일 내에 그럴 가능성은 없다고 본다. 그리고 아무리 바둑을 잘 두고 암 진단을 잘 한다고 할 지라도 자율성이 없는 A.I.는 결코 인간의 지능을 넘어설 수 없다는 말이다.

Image result for intelligence genes

그러나 위에서도 지적했지만, 누가 누구보다 더 지능이 높다는 판단이 무슨 의미가 있을까? 지구상에서 인간이 가장 복잡하고 발전된 문명을 이룩했지만, 만약 바로 그 문명 때문에 핵전쟁이 일어나고 지구가 죽음의 행성으로 변해버린다면 과연 인간은 아메바나 식물보다 더 지능이 높다고 말할 수 있을까? 그렇게 되면 인간은 유전자의 자기 복제에 완전히 실패한 것이 될텐데.

이제 지능이라는 개념을 20세기적 IQ 패러다임에서 풀어주자. 그럴 때가 되었다. (윤영민, 2017-02-05).

참고문헌

레비, 피에르(권수경 역). 1994/2002. <집단지성: 사이버공간의 인류학을 위하여>. 문학과지성사.

리드비터, 찰스(이순희 역). 2009. <집단지성이란 무엇인가>. 21세기북스.

벤클러, 요차이(이현주 역). 2013. <펭귄과 리바이어던>. 반비 출판.

서로위키, 제임스(홍대운/이창근 역). 2004. <대중의 지혜: 시장과 사회를 움직이는 힘>. 랜덤하우스.

서키, 클레이(송연석 역). 2008. <끌리고쏠리고들끓다>. 갤리온.

이대열. 2017. <지능의 탄생>. 바다출판사.

크로포트킨, P. A.(김영범 역). <만물은 서로 돕는다>. 르네상스.

Baart, Ruben. 2016/09/07. “Robots Taking Government Jobs”. NNN. 

Gloor, Peter. 2006. Swarm Creativity. Oxford University Press.

Norman, Alan T. 2017. Block Chain Explained. Alan T. Norman. Kindle book.

지능이라는 이름의 게임(2): IQ 패러다임

오늘날의 관점에서 보면 참으로 어처구니 없게 느껴지지만 20세기초 사회적으로 가장 영향력 있는 학문 중 하나는 우생학(eugenics)이었다.  우생학이란 좋은 형질의 유전은 장려하고 나쁜 형질의 유전은 억제해서 인간의 유전체를 개선하겠다는 학문이다.

우생학은 인종주의와 결합되어 독일에서는 히틀러 정부의 유태인 학살, 미국에서는 반인종적 이민법, 일본에서는 조선인 학살과 식민 지배의 정당화를 낳았으며, 일부 국가들에서는 범죄자나 정신박약자는 물론이고 사회적 약자들을 없애는 거세법(단종법)과 같은  야만적, 범죄적, 반인도주의적 정책과 제도를 낳기도 했다.

Image result for eugenics

그런데 흥미있게도 우생학의 시조로 간주되는 프랜시스 갈톤(Francis Galton)–그는 진화론의 창시자인 찰스 다윈(Charles Darwin)의 사촌이다–은 현대 지능 연구의 창시자 중 1인이기도 하다. 그는 사람들이 지닌 지적 능력의 차이에 관심이 많았고, 지능을 측정하는 통계적 방법을 고안했다(Ritchie, 2015). 그에게 지능은 인간의 정신적 능력(mental capability)을 의미했으며, 지능은 기본적으로 유전적이나 양육에 의해서 일부 영향을 받을 수도 있다고 생각했다. 그는 지능과 관련해서 오늘날까지도 사용되는 “자연과 양육(nature and nulture)”이라는  유명한 표현을 남기기도 했다.

갈톤의 연구를 이어받아 20세기 전반 지능에 대한 연구를 끌어간 것은 영국, 독일, 프랑스, 미국의 심리학자들이었다. 그 중 미국 스탠포드 교육대학원의 심리학자 루이스 터먼(Lewis Terman)은 IQ(Intelligence Quotient)라는 용어를 고안했고 IQ의 측정 도구의 개발과 향상에 앞서 갔다. 흥미있게도 그는 심리학자이면서 갈톤과 마찬가지로 저명한 우생학자였다.

터먼이 제시한 공식에 의하면, 한 사람의 IQ는 그의 정신 연령을 생물학적 연령을 나눈값에 100을 곱한 값이다(아래 그림 참조). 만약 어떤 사람의 IQ가 100이라면, 그는 생물학적 나이와 정신 연령이 동일한, 즉, 동 세대의 평균적 지능을 갖고 있다고 추정된다.

Image result for intelligence quotient Lewis Terman

아주 흥미있는 공식이다. 이 공식에 따르면 피검자의 ‘정신 연령’이 결국 IQ를 좌우한다. 만약 아동에 대한 IQ 테스트라면, 아동이 조숙할수록(정신 연령이 높을수록), IQ가 높게 나오게 된다. 예컨대 IQ 점수가 아주 높아 ‘신동’으로 간주될 정도라면 그것은 그 아이가 이례적으로 조숙함을 의미하는 셈이다. 아동의 높은 IQ는, 그가 평생동안 뛰어난 지능을 지닐 것임을 함축하지는 않는 것이다. 특히 인간의 두뇌 능력이 대부분 선천적으로 결정된다는 우생학적 입장이 아니라, 만약 우리가, 지능이 교육과 같은 후천적인 노력에 의해 크게 영향을 받으며 평생 동안 변화될 수 있다는 입장에 선다면, 아동의 IQ는 그 아이의 조숙성의 정도를 가리키고 있을 뿐이라고 해석할 수 있다.

당시 IQ를 연구하던 심리학자들에게 지능이란 추론, 문제 풀이, 추상적 사고, 이해, 학습, 기억 등을 포괄하는 정신적 능력을 의미했으며, 그것은 상당부분 선천적으로, 다시말해 유전적으로 결정되는 속성이었다. 그들은, 특히, 뛰어난 정신적 능력, 즉, 천재(天才)는 문자 그대로, 하늘이 주는 재주, 타고나는 능력이라고 믿었다.

그런데, 초기 IQ 연구자들은 왜 굳이 인간의 지능을 측정하려고 했을까? 그것과 우생학과의 친화성을 생각해 보면 아마도 사람들을 선별하기 위해서였을 것이다. 아마 “머리가 아주 나쁜 사람들”을 골라내거나 반대로 “머리가 아주 좋은 사람들”을 골라내기 위해서였을 것이다. 역사적 기록을 보면 후자보다는 전자가 더 큰 이유였던 것으로 보인다. 20세기초 프랑스에서는 공립(초등)학교 입학 대상 아동들 중 수학 능력이 없는 학생들을 선별하여 입학에서 배제하는데 사용되었으며, 1차대전 때는 지능이 떨어지는 청년들을 징병에서 배제하는 데 사용되었다는 보고가 있다. IQ가 사회적 배제(social exclusion)의 도구였던 것이다.

iq and social exclusion에 대한 이미지 검색결과

필자의 생각에도 IQ 검사는 백해무익하다. IQ가 높게 나온 피검자는 평생 자신이 머리가 좋다는 착각 속에 빠져 살고, IQ가 낮게 나온 피검자는 평생 그 숫자를 낙인이나 저주처럼 안고 살아갈 가능성이 있다. 개인의 능력을 측정할 수 있는 다양한 방법들이 발달한 오늘날 IQ 검사의 유일한 용도는 사회적 배제 뿐이 아닌가 생각된다.

그럼에도 불구하고 IQ 중심의 지능 연구는 20세기 내내 지능에 대한 인류의 상상을 지배했다. 학자들에 따라서 지능이 다소 다르게 정의되고, 다르게 분류되거나 유형화되었지만 다음  다섯 가지 점에 있어서는 별로 다르지 않았다: 1) 지능은 정신적인 능력이다, 2) 지능은 개인적인 능력이다, 3) 지능은 상당부분 선천적이다, 4) 지능은 IQ 테스트와 같이 동일한 척도로 측정되고 비교될 수 있다, 5) 지구상에서 인간이 가장 높은 지능을 지니고 있다.

그런데 과연 지능은 IQ 패러다임 내에서 밖에 이해될 수 없는 것일까? 지능의 다섯 가지 특성은 21세기에도 여전히 유효한 것일까? 보다 최근의 연구와 현상을 가지고 그 특성들을 음미해 보자. (2018-02-02, 윤영민)

참고 문헌: Ritchie, Stuart. 2015. Intelligence: All That Matters. London: John Murray Learning.

Image result for Intelligence: All That Matters

지능이라는 이름의 게임(1): 배경

개인이나 집단의 생존과 번영을 결정하는 가장 중요한 요소는 무엇일까?

경제학에서 생산의 3요소로 토지, 노동, 자본을 드는 것을 보면 적어도 현대경제학의 토대가 마련된 18-19세기에는 그 세 가지가 핵심적인 요소가 아니었을까 생각된다. 자원이 넉넉하고(자연 자원), 열심히 일하며(노동), 돈이 충분히 투입되면(자본) 개인이든 기업이든 풍부한  가치를 생산할 수 있다는 인식이 널리 퍼져 있었던 추측된다. 물론 그러한 인식은 남의 자원을 강탈하거나 남의 노동을 착취하고 돈이 돈을 낳게 하면서 생존과 번영을 추구하는 모습으로 실현되기도 했다.

19세기말에서 20세기초에 중화학공업, 대기업, 대량생산 체제가 출현하고,  20세기 전반에는 1, 2차 세계대전을 겪으면서 과학과 기술(science and technology), 경영(management), 그리고 국가(state)가 생존과 번영을 좌우하는 요소로 추가되었다.  비행기, 잠수함, 원자폭탄 등과 같은 첨단 병기가 전쟁의 승패를 좌우하였으며, 교통통신의 발달로 시장이 전국화되고 국경을 넘어가면서 기업의 규모가 팽창하고 대량 생산, 대량 유통, 대량 판매가 실현되었으며, 덕분에 기업 경영의 중요성이 부상하고 경영학이 하나의 새로운 학문 분야가 되기도 했다.  또한 각 민족들이 앞다투어 독립적인 국가를 세우면서 다수의 민족-국가(nation-state)가 등장하고, 독일이나 일본 같은 소위 후발국들이 국가 주도의 경제발전에 성공하면서  민족-국가가 생존과 번영의 새로운 단위, 새로운 주체로 자리잡았다.

Related image

1950년대 이후 정보이론의 출현과 함께 계산과 제어 기술이 급속히 발전하였으며, 1960년대 후반에는 그 기술이 통신공학과 접합되면서 네트워크 기술이 추가되었다. 사실 그것은  국가간 첨단무기 경쟁과 민족국가 발전의 부산물이라고 말할 수 있다. 2차대전이 냉전으로 이어지면서 강대국 사이에는 미사일과 핵무기, 우주 탐험, 정보전 등을 둘러싸고 치열한 경쟁이 벌어졌으며, 경제, 금융, 교육, 연구, 복지, 주택 등 사회의 전 분야에 걸쳐 국가의 역할이 점차 확대되면서 정부의 정책 수립과 업무 수행은 인구 조사, 주택조사, 산업체 조사, 시장 조사, 여론 조사 등 온갖 유형의 대규모 조사를 토대로 이루어졌고, 그것은 계산, 제어, 네트워크, 암호 기술 등 정보통신기술의 발전을 수반하였다.

Related image

이차대전 이후 과학기술은 기업들 사이의 경쟁에서 뿐 아니라  국가간 경쟁에서도 가장 첨예한 전선을 형성하였다. 주요 선진국들에서는 기업은 물론이고 정부도 RND 투자에 팔을 걷어부쳤다. 이는 20세기 후반 정보기술(information technology)을 필두로 생명공학(bio-technology), 신경과학(neuro-sciecne) 등의 눈부신 발전을 가져왔다.

이러한 변화를 목격하면서 학자와 사회비평가들 사이에서는 가치의 원천에 대한 다양한 이론과 해석이 등장하였다. 1960년대 이후에 새로운 가치가 정보(information) 혹은 지식(knowledge)에서 나온다는 주장이 힘을 얻었으며, 데이터베이스, 인터넷, 스마트폰이 발달한 1990년대 이후에는 네트워크(network) 이론이 주목을 받았고, 2010년대에는 데이터(data)가 새로운 시대의 석유라는 주장이 대두하였다.

Image result for artificial intelligence

그리고 가장 최근에는 집단지성(collective intelligence)과 인공지능(Artificial Intelligence)에 대한 연구와 산업이 폭발적으로 성장하면서 지능(intelligence)이 가치의 원천으로 주목받고 있다.  특히 인공지능은 정보서비스 산업은 물론이고 로봇 산업을 위시한 각종 제조업에 도입되면서 인류의 미래를 규정할 테크놀로지로 사람들의 기대와 우려를 동시에 받고 있다.

이러한 맥락을 염두에 두고 이제 지능에 대해 생각해 보자. 지능의 본질은 무엇일까? 신경과학, 진화생물학, 컴퓨터 과학, 화학, 물리학등의 발달에 기반한 집단지성, 인간 강화 기술, 그리고 인공지능을 어떻게 이해해야할까? 지능은 과연 과학과 산업의 새로운 프런티어가 될 것인가? 앞으로 지능은 과연 어떤 모습으로 진화하게 될까? 그리고 지능의 진화는 인간사회를 어떻게 바꾸어 놓을까? 무척 무겁고 어려운 질문들이지만 가볍게 산책하는 마음으로 탐색해 보자.  (2018-02-01, 윤영민)

사회통계(11): 확률분포

[문제 1] 재벌구조조정에 대한 한 신문사의 여론조사 결과 우리 국민들중 80%는 강도있는 재벌구조조정에 찬성, 그리고 20%는 반대하는 것으로 나타났다고 하자. 만일 임의로 5명이 선택되어졌을 때 3명이 반대할 확률은 얼마인가?(김은정, 2017: 52)(이항분포)

[문제 2] 어떤 응시자가 자동차 운전시험에 합격할 확률은 1/2이라 하고, 매 시험마다 일정하다고 할 때, 다섯 번째 비로소 합격할 확률은 얼마인가? 또, 처음으로 합격하는 횟수의 기대값은?(김은정, 2017: 57)(기하분포)

[문제 3] 주중 아침 15분 동안 자동차를 탄 채로 은행 서비스를 받기 위해 drive-through 창구에 도착하는 자동차 대수에 관심이 있다. 과거의 자료로 볼 때 15분 동안 도착하는 자동차는 평균 10대이고 포아송 분포를 따른다. 그렇다면 15분 동안에 5대가 도착할 확률은 얼마일까?(Anderson, et., al., 2016: 280)

[문제 4] 어떤 사거리에 다음 차가 도착하기까지 걸리는 시간이 평균 12초의 지수확률분포를 따른다.(Anderson, et., al., 2016: 328)

(1) 지수확률분포의 그래프를 그리시오.

(2) 다음 차가 도착하는데 걸리는 시간이 12초 이하일 확률은?

(3) 다음 차가 도착하는데 걸리는 시간이 6초 이하일 확률은?

(4) 다음 차가 도착하는데 걸리는 시간이 30초 이상일 확률은?

[문제 5] 서울 강남 소방서가 시간당 평균 1.6회의 119 전화를 받는다고 하자. 또한 시간 당 전화수가 포아송확률분포를 따른다고 가정하자. 119 호출 사이의 간격이 한 시간 이내일 확률은? (Anderson, et. al., 2016: 329 변형)(지수확률분포)

[문제 6] 국내 대기업의 주식형 펀드에 대한 평균 수익률은 2009-2011 3년간 14.4%였다. 3년간 수익률이 표준편차 4.4%로 정규확률분포를 따른다고 가정하자. 개별 대기업 주식형 펀드의 3년간 수익률이 적어도 20%일 확률은? (Anderson, et., al., 2016: 321)

사회통계의 꽃은 역시 학률분포이다. 통계학자나 계량사회학자는 확률분포를 가지고 세상을 보려고 한다. 그런데 확률분포는 많은 사회과학 전공 학생들에게 넘사벽처럼 인식되기도 한다.

확률분포가 중요한 이유는, 우리가 관심을 갖는 어떤 사회현상의 확률분포를 알면 그 사회현상에 관한 다양한 사건(event)의 확률을 쉽게 예측할 수 있기 때문이다. 확률분포는 사회현상이 지닌 규칙성(regularity)을 효율적으로 표현한다.

앞 포스팅에서 확률분포의 특징을 보여주는 도구로 모멘트(moment, 적률)를 소개했다. 그런데 모멘트나 모멘트를 이용해 구성한 왜도나 첨도는 확률분포의 특징을 요약해주기는 하지만 그것만으로 확률분포를 완전하게 묘사할 수 없다. 확률분포는 다양한 모습을 가질 수 있다(아래 그림을 참조).

확률변수 X의 특정값이나 어떤 범위가 발생할 확률을 예측하려면 확률함수(probability distribution)을 알아야 한다. X의 확률분포는 확률함수 에 의해 정의되며, 확률함수는 확률변수의 값에 확률이 어떻게 부여되는지를 말해준다.

사회통계를 배우는 사람들에게 나쁜 소식은 이론적으로 무한한 수의 확률분포(확률함수)가 존재할 수 있다는 사실이며, 좋은 소식은 사회현상을 연구하는데 있어 20개 미만의 확률분포만 알고 있으면 된다는 사실이다.(확률분포의 종류를 보려면 여기를 클릭) 그 확률분포들은 자유도 같은 하이퍼 퍼라미터(hyper-parameter)에 의해 규정되는 많은 변종들을 가지고 있기 때문에 우리가 관심 갖는 대부분의 사회현상을 표현할 수 있다. 다음은 상대적으로 많이 사용되는 확률분포들이다.참고) Student’s t, Chi-squared, Beta, Gamma 분포의 확률함수에 보이는 는 계승(factorial)이 실수까지 적용될 수 있도록 일반화한 것으로 이해하면 되고, F 분포의 분모에 보이는 (베타함수)는 이항계수를 일반화한 것이라고 생각하면 된다.

확률분포를 생성하는 학률함수를 보고 겁먹을 필요는 없다. 수백년에 걸친 통계학자들의 노고 덕분에 확률분포를 수식으로 표현할 수 있게 된 점을 감사히 생각하고 잘 사용하면 된다. 각 분포들이 주로 사용되는 현상들이 무엇인지를 잘 판별하면(인터넷을 뒤져보면 금방 알 수 있음) 적절히 사용할 수 있을 것이다.

이중 정규분포가 가장 널리 적용되며, 통계적 추론에는 카이자승분포, t분포, F분포가 자주 사용되고, 베이즈 추론에는 베타와 감마 분포도 자주 사용된다. 이항분포, 포아송 분포, 지수 분포도 잘 기억해 두면 확률 추정에 유용하게 사용될 수 있을 것이다.

이항분포는 성공(이나 실패) 확률을 추정하는데 사용된다. 포아송 분포는 어떤 사건이나 현상의 단위 시간당 발생 횟수에 자주 적용되며, 지수확률분포는 어떤 사건의 발생 간격 혹은 어떤 사건을 완료하는데 걸리는 시간에 관한 확률을 계산하는데 적용되곤 한다. 단위 시간당 발생 횟수인 경우 포아송 분포, 그것을 발생의 시간 간격으로 바꾸면 지수확률분포가 적용되므로 두 분포는 서로 관련된다.

위의 문제들을 풀어보면 확률분포와 확률함수를 이해하는데 도움이 될 것이다. MS Excel에서 위에 제시된 대부분의 확률함수들이 주는 확률값을 계산할 수 있다. 미국 아이오아 대 통계학과의 Matthew Bognar 박사가 개발하여 제공하는 휴대폰 앱인 Probability Distributions (혹은 그의 웹사이트에서도 이용 가능함)을 이용하여 계산할 수 있다. 이 앱은 확률분포 그래프를 직접 보면서 확률값을 계산할 수 있다는 장점이을 가지고 있다.

<문제 풀이>

[문제 1]

[문제 2] ,

[문제 3]  . 대신 를 사용하기도 한다. 참고로 포아송 분포에서는 이지만, 지수분포에서는 이다.

(Probability Distributions app. 이용)

[문제 4] (1)

(2) 0.63065  (3) 0.39226 (4) 0.08291 (Probability Distributions app. 이용)

[문제 5] 전화가 걸려오는 평균 시간 간격은 60/1.6=37.5분,  (Probability Distributions app. 이용)

[문제 6]  (Probability Distributions app. 이용)

<참고 문헌>

Anderson, David R, Dennis J., Sweeney, Rhomas A. Williams (류귀열, 김창규, 최승은, 김민중, 이성철 역). 2016. <앤더슨의 통계학>. 한올.

김은정. 2017. <사회조사분석사 사회통계>. 학진북스.

(윤영민, 2017/09/11)

사회통계(10): 교차표 분석의 기초

[문제 1] 미국 동부 주요 대도시에 근무하는 경찰관 남녀의 승진 사례이다. 경찰관 1,200명 중 960명은 남자, 240명은 여자이다. 지난 2년 동안 324명이 승진하였다. 다음 표에 과거 2년간 경찰관의 승진 현황이 제시되어 있다. 승진 결과를 검토한 다음, 여경위원회는 240명의 여경 중 36명만이 승진하였다는 사실을 근거로 여성차별이 있다고 문제를 제기했다. 경찰인사관리위원회는 여성이 상대적으로 적게 승진한 것은 여성차별 때문이 아니라 여성 수가 상대적으로 적기 때문이라고 주장했다. 과연 누구의 주장이 옳을까? 통계학은 이 첨예한 갈등을 합리적으로 해결하는 데 기여할 수 있을까?

이 교차표를 접근하는데는 두 가지 방법이 있다. 이 교차표가 모집단의 수치를 보여주는 경우 조건부 확률(conditional probability)을 사용하면 되고, 이 교차표가 하나의 표본에 관한 정보로 간주된다면 카이자승() 을 가지고 가설 검증을 하면 된다.

어느 데이터가 모집단(population)에 관한 것인가 혹은 표본(sample)에 관한 것인가는 근본적으로 연구자가 어떤 대상에 대해 주장을 제시하고 싶은가에 달려 있다. 예컨대 이 사례에서 연구자가 해당 경찰청의 과거 2년 동안에 발생한 승진 케이스들에 대해서만 성차별이 존재하는지를 따지겠다면, 이 데이터는 전수 데이터로 모집단에 관한 것이라고 간주될 수 있다. 반면에 연구자가 해당 경찰청의 데이터를 가지고 미국의 전체 경찰이나 미국 사회 전체에 존재하는 성차별에 관해 따지겠다면 이 데이터는 표본에 관한 것이라고 간주되어야 한다.

이 교차표를 가지고 그 두 접근을 모두 검토해 보자. 먼저 조건부 확률부터 논의하겠다.

최근 조건부 확률은 그 어느 때보다도 중요한 지식이 되었다. 현업에서 가설 검증보다는 예측이 훨씬 더 많이 요청되고 있으며, 예측에 널리 사용되는 베이즈 추론(Bayesian inference)의 논리적 토대가 조건부 확률이다. 현업에서 스스로 예측을 하거나, 최소한 남이 하는 예측을 이해하고 싶다면, 조건부 확률에 관련된 개념들을 꼼꼼하게 익혀둘 필요가 있다.

확률을 다룰 때는 먼저 사건을 정의해야 한다.

M = 경찰관이 남성; W = 경찰관이 여성; A = 경찰관이 승진;  =  경찰관이 승진하지 못함

= 무작위로 뽑힌 경찰관이 남성이고 승진;  = 무작위로 뽑힌 경찰관이 남성이고 승진하지 못함; = 무작위로 뽑힌 경찰관이 여성이고 승진; = 무작위로 뽑힌 경찰관이 여성이고 승진하지 못함

위의 표는 아래 확률들을 가지고 승진에 관한 결합확률표(joint probability table)로 전환될 수 있다. 

이러한 확률들은 두 사건의 곱사건의 확률로서 결합확률(joint probability)라고 부른다.

결합확률 주변에 있는 값들은 각 사건의 확률이다. 즉, P(M) = 0.80; P(A) = 0.20; P(A) = 0.27; P() = 0.73이다. 이러한 값들을 주변확률(marginal probability)이라고 부른다. 결합확률표에서 관련된 행이나 열의 결합확률을 합하면 주변확률을 구할 수 있다. 예컨대 이다. 이점을 잘 기억해두면 베이즈 추론에 도움이 될 것이다.

결합확률과 주변확률을 가지면 조건부 확률(conditional probability)을 구할 수 있다.  예컨대 어떤 경찰관이 남성일 경우 그가 승진할 확률, 을 구해보자.

도수를 사용해서 구하면, 288/960=0.3이 될 것이다. 확률을 이용해서 구해도 0.24/0.80=0.3으로 동일한 값이다. 확률을 이용한 조건부 확률의 계산을 일반화하면 다음과 같다.

결합확률을 주변확률로 나눈 값이다. 다른 말로 주변확률에 대한 결합확률의 비율이다.

경찰관이 여성인 경우 승진할 확률은,

이다.

즉, 남성경찰관의 승진확률은 0.3으로 여성경찰관의 승진확률 0.15의 두 배이다. 이 결과는 경찰인사관리위원회보다 여경위원회의 주장을 지지한다.

만약 이 데이터가 표본이라면 조금 다른 방식으로 접근할 수 있다. 교차표에 나타난 차이가 우연적 결과이다 혹은 승진에 관해서 성차별이 없다(통계학적으로 표현하면, 경찰관의 성별과 승진이 독립 사건이다) 라는 가설을 검증하는 방법이다. 이를 영가설(null hypothesis)이라고 하는데, 만약 영가설이 기각되면 대립가설(alternative hypothesis)을 수용하게 된다. 이는 바로 가설 검증(hypothesis testing)이다.

만약 경찰관의 성별과 승진이 독립 사건이라면 결합확률표는 어떤 모습일까? 남자 경찰관 중 승진자 비율, 여성 경찰관 중 승진자 비율, 그리고 전체 경찰관 중의 승진자 비율이 같을 것이다(아래 결합확률표 참조).

이를 일반화하여 표현하면 다음과 같다.

이를 도수의 교차표로 나타내려면 각 결합확률이나 주변확률에 총사례수인 1200을 곱하면 된다.

이는 영가설 아래서 얻은 예측값이다. 이 예측값과 실제 관찰값의 차이가 영가설을 기각할 수 있을 만큼 충분히 큰가? 이것을 검증하는 기법이 카이자승 검증( test)이다.

각 셀의 카이자승 값은 그 셀의 관찰값에서 예측값(영가설 아래)을 뺀 값을 제곱한 수를 그 셀의 예측값으로 나누면 된다. 각 셀의 카이자승 값들을 모두 합한 수가 전체 카이자승 값이다.  카이자승 분포()은 아래 그림에서처럼 자유도에 따라 모양이 변한다. (아래 그림은 위키피디아에서 가져왔음.)

Chi-square pdf.svg

교차표에서 자유도를 구하는 공식은 다음과 같다.

위의 사례에서는 자유도는, (2 – 1)(2 – 1)=1이다.

엑셀에서는 바로 카이자승 값을 구할 수 없다. 위 공식들을 이용해서 구해야 한다. 다만 예측값의 교차표를 구하면, CHISQ.TEST 함수를 이용해서 바로 카이자승 값의 p- 값을 구할 수 있다. 아래는 그 두 가지 방법을 모두 이용해 구한 값들이다.

이 교차표의 카이자승 값의 p-값은 영가설을 충분히 기각할 수 있을 정도로 작다. 위에서 조건부 확률을 가지고 얻은 결과를 카이자승 검정을 통해서 다시 확인한 셈이다.

도수의 교차표(cross-table)든, 결합확률표이든 범주형 변수를 분석하는데 대단히 유용한 도구이다. 사회과학에는 범주형 변수들이 많다. 이 기법들을 잘 익혀두면 유용하게 사용할 수 있을 것이다. (윤영민, 2017-08-25)