데이터를 다시 생각한다(2): 사회과학적 관점

어떤 사회 제도(social institutions)나 존재 이유와 내부 질서(혹은 구조)를 갖고 있다. 하나의 사회제도로서 과학—사회과학을 포함—도 그렇다. 과학의 존재 이유는 진리(truth)(다르게 표현하면, 지식, knowledge)의 탐구이며, 과학의 내부 질서는 주로 고유한 연구방법–다시 말해 과학적 지식이 생성되는 방법–에 달려 있다.

과학적 지식은 연역적 추론(deductive reasoning), 귀납적 추론(inductive reasoning), 혹은 유추(analogy)와 같은 방법으로 생성된다. 삼단논법에 보듯이 보편적 전제로부터 개별적 결론이 도출될 수도 있고(연역적 추론), 개별적 사실들로부터 일반적 원리를 끌어낼 수도 있으며(귀납적 추론), 한 사물이나 현상을 보고 다른 사물이나 현상에 대해 추측할 수도 있다(유추).

과학에서는 어떤 이론이나 가설도 경험적 검증을 거쳐야 지식으로 인정받게 된다. 가설(hypothesis)을 세우고(그것은 이론으로부터 도출될 수도 있고 선행연구의 발견으로부터 가져올 수도 있다), 관찰, 실험, 인터뷰 등 과학적이라고 인정되는 방법으로 데이터를 수집한 다음, 그것을 가지고 가설을 검증한다. 가설 검증 과정에서 연역적 추론, 귀납적 추론, 유추 등이 사용된다.

가설은 데이터에 의해 지지되거나(supported) 기각되며(rejected), 기각된 경우에는, 새로운 방법이나 새로운 데이터를 가지고 가설을 재검증하거나 가설을 수정하여 다시 검증하기도 한다. 가설이 한번에 검증되는 경우는 없으며 반복적인 검증을 통과해야 한다. 그런 의미에서 모든 이론과 가설–다시 말해, 지식–은 잠정적(temporary)이라고 말할 수 있다.

사회과학에서 연구자는, 먼저 연구 문제(research question)와 가설(hypothesis)을 가지며, 그런 다음 그것을 검증해줄, 현실을 대표한다고 믿어지는 데이터(data)를 구한다. 데이터란 사람, 집단, 사회현상 따위에 관한 사실(facts) 혹은 정보(information)를 말한다.

빅데이터 시대 이전까지 일반적으로 데이터는 연구자가 연구를 위해 의도적으로 수집한 것이었다. 연구 목적에 부합되도록 조사를 기획하고 실험, (참여) 관찰, 설문조사와 같은 방법을 통해서 데이터를 수집하였다. 사회과학에서 데이터란 그러한 데이터를 의미하였으며, 엄밀하게 계획되고 설계된 절차를 통해서 수집된 데이터만이 학문적으로 인정받을 수 있었다.

Image result for big data social science research

사회과학 연구에 있어 빅데이터가 제기하는 가장 근본적인 문제 중 하나는 데이터에 관한 그러한 전통적인 인식에 대한 것이다. 빅데이터는 데이터가 단순히 양적으로 증가했다는 의미를 넘어서 데이터가 질적으로 달라졌음을 함축한다. 이는 데이터가 무엇인가에 대해 다시 생각해보아야 하고 데이터의 학문적 타당성에 대해서도 다시 살펴보아야 함을 의미한다.

사회과학의 연구 대상은 개인, 집단, 사회조직, 사회제도, 사회적 상호작용, 사회운동, 혁명, 전쟁, 의례와 관행, 가치와 규범, 의식과 태도 따위이다. 과거에도 그랬고, 현재도 그러하며, 미래에도 그러할 것이다. 문제는 데이터가 ~에 대한 것을 넘어서 ~자체가 되었다는 사실이다(Purdam and Elliot, 2015).

예컨대 개인(individual)을 생각해보자. 과거에 개인 데이터(personal data)란 개인의 속성(attributes), 자산, 습관, 취미, 관심, 태도, 행동 등을 알려주는 고정적인 것이거나 상당히 안정적인 것이었다. 그리고 이름, 성별, 나이, 주소, 전화번호, 주민등록번호, 출생지, 직업, 가족관계, 소득, 교육수준, 종교, 국적, 병역 사항, 은행잔고, 부동산 소유 현황, 혈액형, 병력, 지지정당, 노조가입 여부, 지문, 흡연량, 음주량 따위가 개인 데이터였다.

그런데 인터넷, 스마트폰, CCTV, 센서 등 디지털 기술이 확산되면서 개인을 규정하는데 있어 훨씬 동적이며 가변적인 데이터가 추가되었다. 통화기록, 문자메시지 송수신 기록, 로그파일, 쿠키, 전자우편, 블로그, 트위터, 페이스북 같은 소셜 미디어상의 상호작용, CCTV 영상, 자동차 블랙박스 영상, 은행 ATM 사용기록, 인터넷 쇼핑 기록, 인터넷 뱅킹 기록 등 개인의 온라인 행동은 물론이고 오프라인 행동까지 실시간으로 기록되면서 엄청난 양의 데이터가 개인을 규정하는데 활용되고 있다.

Image result for personal data

개인의 일상이 광범위하게 기록되고, 그렇게 수집된 데이터로부터 개인의 생각을 추정하고 행동을 예측할 수 있게 됨에 따라 개인 데이터는 점점 개인 자체와 일치해 가고 있다. 더구나 개인은 자기 스스로가 생각하거나 주장하는 정체성(identity)이 아니라, 신용카드 이용처럼 일상 속에서 자신이 직접 생성하거나 생성에 동의한 데이터, 기계에 의해 모니터링된 데이터, 인터넷, 스마트폰, 자동화기계를 사용하면서 남긴 흔적 등에 의해 추정되거나 결정된 정체성에 의해 규정된다. 나는 더 이상 내 자신이 규정한 ‘나’가 아니라 개인 데이터를 기반으로 사회가 규정해준 ‘나’가 된 것이다. 그런 의미에서 개인은 데이터로 존재하고 살아간다고 말할 수 있다.

사회과학의 연구 대상 중 개인만 그러겠는가. 집단, 사회조직, 국가, 민족과 같은 사회적 행위자는 물론이고, 세계, 시장, 문화, 사회관계, 사회운동, 혁명, 전쟁, 갈등, 협력 등 어떤 사회현상에 있어서도 데이터는 그것에 대한 것이 아니라 그것 자체의 중요한 구성 요소가 되었다. 사회연구는 데이터의 이러한 새로운 성격을 충분히 고려해야 할 것이다.

그렇다면 빅데이터는 기존의 데이터와 어떻게 다를까? Laney (2001)는 빅데이터가 세 가지 차원에서 기존의 데이터와 구별된다고 지적했다. 첫째, 데이터의 양이 과거와 비교할 수 없을 정도로 크고(규모, volume), 둘째, 숫자, 문자, 영상, 동영상, 거래기록 등 데이터의 형식이 매우 다양하며(종류, variety), 셋째, 데이터가 대단히 빠르게 생성된다(속도, velocity). 물론 모든 데이터가 이 세 가지 속성을 모두 갖는 것은 아니다. 예컨대 CCTV 데이터는 실시간이고 대규모이지만 형식은 동영상으로만 되어 있으며, 인터넷 사이트 접속 로그 파일은 실시간이고 대규모이지만 형식은 숫자와 문자만으로 되어 있다.

Laney의 정의가 널리 알려 있기는 하지만 모든 연구자가 그의 정의를 취하지는 않는다. 연구자에 따라 빅데이터의 특정한 성격이 강조되기도 한다. 어떤 학자는 사건이나 상호작용이 발생하면서 바로 기록되는 실시간 데이터(real-time data)라는 점에 주목하고, 어떤 학자는 연구자의 개입 없이 발견되는 데이터(found data)라는 점을, 어떤 학자는 비정형 데이터(unstructured data)가 증가하고 있음에 주목하고, 또 어떤 학자는 데이터가 인간이 아니라 점점 센서(censor)에 의해 생성된다는 사실에 주목한다(Connelly et. al. 2016).

사회과학 연구의 관점에서 보자면, 전통적으로 사용되는 데이터와 최근의 빅데이터는 다음과 같이 대비될 수 있다. 전자가 의도적으로(intentionally) 생성된 반면 후자는 연구를 목적으로 생성되지 않는다. 그래서 어떤 전문가는 전자를 ‘기획된 데이터(designed data)’라고 부르고, 그에 대비해서 후자를 ‘유기적 데이터(organic data)’라고 부른다. 또한 어떤 학자는 전자를 ‘제조된 데이터(made data)’라고 부르고, 그에 대비해서 후자를 ‘발견된 데이터(found data)’라고 부른다.

Image result for big data's effects on social science research

Purdam and Elliot( 2015)은 데이터에 관한 체계적이고 유용한 분류를 제공해 준다. 그들은 데이터가 어떻게 생성되었는가에 따라서 다음과 같이 여덟 가지 유형으로 분류한다.

① 정통의 의도된 데이터(orthodox intentional data): 설문조사, FGI, 실험

② 참여적 의도된 데이터(participative intentional data): crowdsourced data

③ 결과적 데이터(consequential data): 행정기록, 전자의료기록, 상업적 거래 데이터, 온라인 게임 경기 기록

④ 자기 발간 데이터(self-published data): 긴 형식의 블로그 포스팅, 온라인 이력서, 온라인 프로필

⑤ 소셜 미디어 데이터(social media data): 트위터, 페이스북, 온라인 게임 대화

⑥ 데이터 흔적(data traces): 온라인 검색 로그 파일, 온라인 구매 로그 파일

⑦ 발견된 데이터(found data): 공개 공간(public spaces)에 대한 관찰

⑧ 인공 데이터(synthetic data): 시뮬레이션 데이터, 합성 데이터

Mayer-Schoenberger & Cukier(2013: 78)는, 오늘날 점점 인간 뿐 아니라 컴퓨터에 의해 분류되고 분석될 수 있도록 사회적 존재나 현상이 디지털화되고 계량화되는 현상을 데이터화(datafication)라고 불렀다. 책 속의 단어들이 컴퓨터가 읽을 수 있는 데이터가 되고, 사람이나 사물의 위치가 컴퓨터가 처리하는 데이터가 되며, 사람들 사이의 상호작용(예: 트위터, 페이스북)이 컴퓨터로 분석되는 데이터가 된다. 데이터화는 사회과학 연구에 있어 데이터의 유형만큼이나 다양한 데이터 출처가 존재하게 만들고 있다.

Image result for data in star trek

데이터 분석 및 마케팅 전문가인 Lynda Partner(2016)의 지적처럼, 어쩌면 이제 “데이터가 모든 것이고, 모든 것이 데이터”인 세상일 지도 모른다. 학자와 전문가들은 정보시스템, 데이터 시스템, 지식관리시스템, ERP, 가설 검증, 예측, 분류라는 응용적 측면에서 데이터를 바라보지만, 데이터는 이미 인문학적 사유의 대상으로 넘어가고 있는 지도 모른다. 이미 30여 년 전 TV 시리즈인 스타 트렉(Star Trek)은 ‘데이터’라는 출연 인물(?)을 통해서 그러한 가능성을 보여주었고, 20여 년 영화 매트릭스(Matrix)는 모든 것이 데이터로 존재하는 세상인 가상공간을 실감나게 보여주었지 않았던가.  (윤영민, 2018-03-05)

<참고 문헌>

Connelly, Roxanne, Christopher J. Playford, Vernon Gayle, and Chris Dibben. 2016. “The Role of Administrative Data in the Big Data Revolution in Social Science Research”, Social Science Research 59. Pp.1-12.

Laney, D., 2001. “3D Data Management: Controlling Data Volume, Velocity and Variety.” META Group Research Note 6.

Mayer-Schoenberger, Viktor and Kenneth Cukier. 2013. Big Data: A Revolution that will Transform How We Live, Work, and Think. Boston: Houghton Mifflin Harcourt.

Partner, Lynda. 2016. “Data is everthing, and everything is data.” https://blog.pythian.com/data-everything-everything-data/

Purdam, Kingsley & Mark Elliot. 2015. “The Changing Social Science Data Landscape”, Halfpenny, J. Peter & Rob Procter (ed.). Innovations in Digital Research Methods. Chap. 2. London: Sage. Pp.25-58.

데이터를 다시 생각한다(1): 공학적 관점

지난 10여 년 사이 발생한 가장 뚜렷한 사회변화 중 하나는 인류에게 대단히 낯선, 데이터 기반 사회(Data-based society)가 출현하고 있다는 사실이다. 고 Peter Drucker가 예견했던 지식사회도, 필자를 포함해 수많은 학자들이 설파한 정보사회도, 마뉴엘 카스텔(Manuel Castells)이 전망한 네트워크사회도 아닌 데이터 기반 사회–그냥 짧게 줄여서 데이터 사회(data society)라고 부르자–가 등장하고 있는 것이다.

Related image

앞 포스팅들에서 길게 논의했던 새로운 개념의 “지능(intelligence)”도 근본적으로는 데이터 사회의 한 측면이다. 인간, 사회조직, 자연, 심지어 우주에 관한 데이터의 폭발적 증가는 인류가 지금까지 경험해 보지 못한 새로운 모습의 사회를 탄생시키고 있다. 지능이 개인과 조직, 그리고 사회가 생존하는 데 있어 가장 중요한 생존 요인 중 하나가 된 것이 바로 데이터 때문이다.

이제 데이터(data)에 관해 얘기해 보자. 데이터를 제대로 규정하지 않고 데이터 사회를 논할 수는 없지 않겠는가.

데이터에 대한 정의는 학문 영역에 따라 상당히 다르다. 그것은 데이터를 전혀 다른 대상으로 간주하기 때문이라기보다 서로 다른 맥락에서 데이터를 바라보기 때문이거나 데이터의 서로 다른 측면을 분석하기 때문일 것이다. 데이터를 크게 공학적 관점과 인문/사회과학적 관점으로 나누어 살펴보자.

공학 중 데이터에 관해 가장 정교한 규정을 제시하는 분야는 경영정보학(MIS)이 아닐까 싶다. 경영정보학은 데이터가 핵심인 데이터베이스(D/B), 정보시스템(IS), 지식관리시스템(KMS), ERP(Enterprise Resource Planning), 데이터 마이닝(data mining), BI(Bussiness Intelligence) 등을 모두 다루어야 하기 때문일 것이다. 경영정보학에 의한 규정은 인접분야인 컴퓨터과학(computer science), 문헌정보학(library and information science), 교육공학(educational technology) 등과 공유된다.

경영정보학에서는 크게 세 가지 서로 다른 데이터 프레임워크(혹은 이론)가 제시되었다. 그중 가장 오랫동안, 그리고 가장 널리 수용되는 데이터 프레임워크는 가치 사슬 모형(value chain model), 흔히 DIKW 계층 모형이라고 알려진 것이다.

Image result

이 모형에서 데이터(data)는, 통상 가공되지 않은 상태의, 객체(objects)나 사건(events)에 대한 묘사(description) 혹은 사실(facts)을 의미하며, 정보(information)는 데이터를 가공한(processed: 분류, 요약, 혹은 이전되었다는 의미) 것으로, 맥락이 부여된(contextualized) 데이터이다. 따라서 데이터와 달리 정보는 의미(meaning)를 가지며, 특정한 용도에 유용하다. 또한 정보가 체계적으로 조직되면(organized) 지식(knowledge)이 되고, 지식이 고도로 추상화되면 지혜(wisdom)이 된다.

이 피라미드의 상부로 올라갈수록 가치(value)가 상승하는 것으로 간주된다. 이 때문에 이 모형은 가치 사슬 모형이라고 불린다.

이 피라미드 모형은 나름대로 유용하다. 데이터-정보-지식-지혜의 관계에 대해 최소한의 가이드라인이 되어주며, 나아가 연구자들에게, 지식, 정보, 데이터 중 어떤 것을 다루더라도 다른 두 가지와의 관계를 고려해야 하고, 앎(knowing)에 관한 어떤 모형도 이 세 가지 사이의 관계에 대해 명쾌한 해석 혹은 입장을 포함하고 있어야 함을 알려준다(Kettinger and Li, 2010).

지혜는 지식과 특별히 구분되지 않거나, 지나치게 추상적이기 때문에 실무 차원에서는 논외로 하는 경우가 많다. 예컨대 “이웃을 사랑하라” 혹은 “타인에게 자비를 베풀라”는 훌륭한 지혜이겠지만 현실 비즈니스에서 적용되기는 어렵지 않겠는가.

Related image

이 모형의 약점은 핵심 개념인 데이터, 정보, 지식 사이의 상관관계가 명백하지 않다는 사실이다. 특히 데이터와 정보, 그리고 정보와 지식의 개념적 관계가 애매하여, 연구자들 사이에 해석이 분분하다(Alavi and Leidner, 2001).

Tuomi (1999)는 가치 사슬 모형을 거꾸로 뒤집어 놓은 구체화 모형(materialization model)을 제안했다. 가치 사슬 모형과는 반대로 데이터는 정보로부터, 정보는 지식으로부터 생성된다는 인식이다. 지식이 데이터와 정보에 대한 인식의 출발점이라는 것이다. 이 모형의 가장 중요한 특징은 지식이 데이터와 정보로부터가 아니라 다른 원천으로부터 생성된다는 인식이다. Tuomi에 의하면, 노나카 이쿠지로(Nonaka Ikuziro)가 말하는 암묵적 지식(tacit knowledge)과 명시적 지식(explicit knowledge) 사이의 다이내믹한 상호작용은 지식이 생성되는 한 가지 방식이다.

잠재적 지식이 개념적으로 명료하게 표현되고(articulated), 구조화되면(sturctured), 지식은 정보가 되며(그렇다면 정보는 다름 아닌 명시적 지식!), 그렇게 만들어진 구조에 데이터를 수집해서 집어넣어 정보를 구체적으로 표현할 수 있다(아래 그림을 참조).

이 과정을 구체적인 사례를 갖고 보면 아래 그림과 같다. 보일-샤를의 법칙과 아보가드로의 법칙이라는 화학적 지식을 결합하여 이상기체 상태방정식(PV = nRT)를 도출하면 그것이 정보이다. 그리고 그 정보를 응용하면 체온계를 만들 수 있다. 그 체온계로 체온을 재면, 체온이 의미를 지닌 숫자–예컨대 36.5도–로 구체화되어 표현된다.이 과정에 의하면, 정보란 데이터에 의미를 추가해서 생성되는 것이 아니라, 지식으로부터 도출된다. 그리고 정보를 구조화하면 의미를 지닌 데이터가 창출될 수 있다.

세 번째로 소개할 데이터-정보-지식 프레임워크는 상호작용 모형(interactive model)이다. 이것은 정보가 지식과 데이터의 상호작용에 의해 생성된다는 발상으로 지식 기반의 정보이론(knowledge-based theory of information, KBI)이라고 불린다((Kettinger and Li, 2010). 이 모형의 핵심적인 인식은, 정보는 데이터와 지식의 결합 함수이며, 낮은 수준의 정보는 높은 수준의 정보를 생산하는 데 투입으로 사용된다(information is the joint function of data and knowledge, and lower level information is used as input to produce higher-level information)이다.

이 모형에서도 지식이 대단히 중요한 위치를 차지하고 있다. 지식은 구성물 사이의 관계에 대한 정당화된 진실한 믿음(justified true belief of the relationship between constructs)이다.

이 명제는 네 가지 의미를 내포하고 있다. 1) 지식은 믿음(belief)이다. 그런데 그 믿음은 추가적인 증거에 의해 일반화되거나(generalizable) 검증될 수 있는(verifiable) 것이어야 한다. 2) 지식은 진실이거나, 어떤 상황에서 진실에 접근해야 하며, 그리하여 실질적 목적을 위해서 의문의 여지가 없는 것으로 받아들여져야 한다. 3) 지식의 진실성은, 자격을 갖춘 엘리트(전문가, 권위자)에 의해 정당화되거나 인정되어야 한다. 이점이 지식을 정당화되지 못한 믿음과 구별시켜준다. 4) 지식은, 수단-목적 짝(mean-end pairs), 조건-행동 짝(condition-action)과 같이 구성물 사이의 관계(relationship between constructs)에 대한 믿음이다. 지식의 가장 흔한 형식은 IF-THEN 짝이다(사회학, 통계학에서는 가설 형식이라고 부름). 지식은 지식틀(knowledge frames), 지식지도(knowledge maps), 시맨틱 네트워크(semantic networks) 등과 같은 형식을 취할 수도 있다.

데이터는 객체나 사건에 관한 서술이나 측정값이다. 그것은 통상 객체나 사건의 속성(attributes of objects or events)들을 측정하는, 상호연관된 데이터 항목들의 집합(a set of interrelated data items)을 말한다.

S1: A 형 부품 17개가 남아 있다.

S2: 비가 내리고 있다.

이 두 진술은 ‘there-is(~있다)’ 유형으로, 어떤 존재하는 객체나 사건에 대한 사실(facts)에 관한 진술로 데이터이다. 데이터는 상황에 관한 선결조건(pre-conditions) 혹은 투입 값(input values)을 규정하고, 그것을 기반으로, 그 상황에서의 의사결정 혹은 행동의 선택을 가능하게 하는 정보가 생산된다. 그러나 데이터만으로는 행동이나 의사결정에 요청되는 정보를 낳을 수 없다.

정보는 지식 프레임워크를 토대로 데이터로부터 생산된 의미(meaning)이다. 지식 프레임워크는 목적 지향적 행동들을 위한 조건적인 준비의 상태의 선택과 결합되어 있다(Information is the meaning produced from data based on a knowledge framework that is associated with the selection of the state of conditional readiness for goal-directed activities).

이 규정은 의미(meaning)가 정보의 본질적 속성이라는 정보시스템 연구의 전통적인 관점을 반영하고 있다. 메시지의 의미를, 조건적 준비의 상태에 대해 수신자가 지닌 범위에 대한 선택적 기능이라고 볼 수 있다. 정보에 의해 선택, 판단, 혹은 불확실성 감소가 일어난다는 것이다.

예를 가지고 살펴보자. 위의 S1 데이터 명제와 관련된 아래와 같은 지식 명제를 생각할 수 있을 것이다.

S3:  만약 A형의 부품의 재고가 20개 이하이면, 부품 부족을 방지하기 위해 A형의 부품을 주문해야 한다.

지식 S3가 데이터 S1을 만나면, “A형 부품을 적어도 3개 이상 주문해야 한다”는 정보가 생성된다.

이 기본 모형은 좀 더 확대될 수 있다. 비와 외출에 관해서 두 가지 이론이 있다고 하자. 하나는 “S4: 비가 내리면 외출을 삼가한다.”, 그리고 다른 하나는 “S5: 비가 내리면 우산을 갖고 나간다.”라고 하자. 이 이론들이 S2(비가 내리고 있다)라는 데이터를 만나면, 그것이 이론 S4와 결합할 경우, “외출을 하지 않는다”라는 정보가 도출된다. 반면에, 이론 S5와 결합할 경우, “우산을 갖고 나간다”라는 정보가 도출된다. 동일한 데이터라도 적용되는 지식에 따라서 정보가 달라짐을 알 수 있다(아래 그림 참조).

KBI 이론에 따르면, 데이터가 정보의 주요 원천이기는 하지만, 정보는 또다른 원천으로부터도 생성된다. 그것은 다른 사람이 갖고 있는 정보(other people’s information)이다. 그런데 다른 사람의 정보는 이미 그 사람의 지식과 데이터의 결합에 의해 생성된 것이다.

이 모형은 데이터로부터의 정보가 생산되기 위해서는 지식을 필요로 하며, 지식이 변하면 정보도 달라짐을 시사한다. 가설적 수준의 이론이지만 대단히 흥미있는 모형이다. 이 모형은 다음에 소개할 사회과학적 관점과도 잘 어울리는 장점을 갖고 있다. (윤영민, 2018-03-05).

<참고문헌>

Alavi, M and Leidner DE (2001). “Knowledge management and knowledge management system: conceptual foundations and research issues.” MIS Quarterly 25(1): 107-136.

Kettinger, William J and Yuan Li (2010). “The infological equation extended: towards conceptual clarity in the relationship between data, information and knowledge,” European Journal of Information Systems, 19(4): 409-421.

Tuomi, I (1999). “Data is more than knowledge: implications of the reversed knowledge hierarchy for knowledge management and organizational memory.” Journal of Management Information Systems 16(3): 103-177.

지능이라는 이름의 게임(8): ‘창조주’가 되고 싶은 인간

인간에게 마지막 남은 미지의 영역은 아마도 생명일 것이다. 생존의 관점에서두뇌-지능은 생명과 가장 근접해 있는 영역이다. 두뇌-지능을 해독하면 인간(인간 대신 A.I.일지도 모른다)은 결국 생명이라는 수수께끼마저 완벽하게 풀어버릴 지도 모른다. 그것이 언제쯤일 지는 누구도 정확히 예측할 수 없겠지만 말이다. 아직 초보적인 수준이지만 인류는 이미 지능적인 기계(intelligent machines) 만들기 경쟁을 시작했다. 연구소와 기업들이 기계학습(machine learning) 혹은 인공지능(A.I.)을 응용한 상품 개발에 질주하고 있다. 스마트폰, 자동차, 스피커, 세탁기, 청소기, 가사 로봇 등등. 아마도 원하던 그렇지 않던 그 경주의 종착역은 ‘창조주(creator)’ 게임이 되지 않을까 생각된다. 지능, 두뇌, 생명의 창조 말이다.

최근에 발표된 Tie-Jun Huang 북경대 교수의 논문, “Imitating the Brain with Neurocomputer”(Internation Journal of Automation and Computing, 2017/10)는 정확히 그 지점을 건드리고 있다. 이 논문을 참고하면서 인공지능(artificial intelligence), 인공두뇌(artificial brain), 그리고 인공 생명(artificial life)에 대해 생각해 보자.

Image result for artificial intelligence, artificial brain, artificial life
출전: http://news.mit.edu/2009/ai-overview-1207

Huang 교수는 컴퓨터과학이 자율적(autonomous)이며 범용인(general) 인공지능–그의 표현으로 Artificial General Intelligence, AGI–을 추구한다고 전제한다. 그의 주장이, A.I.에게 결코 자율성을 부여해서는 안된다는 이대열 교수의 주장과 출발부터 충돌하는 것이다. 그리고 AGI를 구현하기 위해서는 지능(intelligence)의 모사가 아니라 두뇌(brain)의 모사에 연구를 집중해야 한다고 역설한다.

그의 주장에 따르면, 현재 득세하고 있는 기계학습(machine learning), 인공신경망(artificial neural network), 그리고 인공 지능(artificial intelligence)은 70여 년 전부터 지금까지 컴퓨터과학의 대세가 되어온 폰노이만(Von Neumann) 컴퓨터라는 패러다임 내에 있다.

1945년 존 폰노이만(John von Neuman)은 “First Draft of a Report on the EDVAC”이라는 논문 초고를 몇몇 지인들에게 돌렸다. 그 글에는 그 후 70년 이상 컴퓨터의 구조를 규정하는 설계가 제시되어 있었다. 폰 노이만이 논란의 여지없는 천재이기는 하지만 아마도 그 저술이 세상에 가장 커다란 영향을 미친 초고 논문이 될 것이라고는 꿈에도 상상하지 못했으리라.

폰 노이만 구조는 중앙처리장치(CPU), 저장장치(memory), 연결 통로(bus), 입출력 장치(I/O)로 구성된다. CPU는 데이터와 명령(instructions, 곧 소프트웨어)를 메모리로부터 불러내어 연산을 수행한다. 데이터와 소프트웨어는 동일한 메모리에 저장되고 동일한 버스로 이동한다.그 글에서 폰 노이만은 자신이 고등동물 두뇌의 작동 원리를 모방하여 컴퓨터의 구조를 설계하고 있음을 분명히 밝히고 있다. 특히 신경세포와 시냅스의 작동 원리를 단순화하여 진공관을 이용한 디지털 컴퓨터 설계에 적용하고 있음을 논문 곳곳에서 서술하고 있다(초고의 원문을 보려면 다음을 클릭: edvac.pdf).

폰 노이만은 복잡하고 지루한 수학 연산을 인간 대신 수행해 줄 기계를 구상했다. 폰 노이만의 설계에 따라 탄생한 디지털 컴퓨터는 지난 70여 년 동안 CPU와 메모리 칩이 진공관에서 트랜지스터 집적으로 바뀌고 데이터와 소프트웨어의 버스가 구분되었으며, 엄청난 컴퓨팅 파워와 처리 속도를 구가하게 되었고, 다양한 소프트웨어의 발달로 수학 연산을 넘어 문자, 이미지, 심지어 동영상까지 처리하고, 소형화를 거듭하고 있으며, 유무선 통신네트워크를 통해 컴퓨터는 물론이고 스마트폰을 비롯한 온갖 정보기기들이 연결되면서 놀라운 변신을 해왔다. 그러나 그럼에도 불구하고 놀랍게도 그것들에는 아직 기본적으로 폰 노이만의 설계가 유지되고 있다.

폰 노이만은 스스로 그렇게 표현하기도 했지만 생물의 신경세포 시스템을 유추(analogy)적으로 사용해서 컴퓨터를 만들었다. 즉, 그는 신경세포 시스템을 추상화시켜 도출한 몇 가지 원리를 가져다 사용했을 뿐 신경세포 시스템을 물리적으로 모사하려고 생각하지는 않았다. 사실 당시로서는 인간 두뇌에 대한 지식도 짧았고, 그것을 구현해 줄 기술도 거의 존재하지 않았기 때문에 놀라운 일이 아니다.

Image result for neurocomputer
출전: https://www.tutorialspoint.com/artificial_intelligence/artificial_intelligence_neural_networks.htm

그런데 Huang 교수는 물론이고 인공 두뇌(인공 지능과 혼동하지 말 것)를 연구하는 학자와 전문가들은, 폰 노이만과 앨런 튜링(Alan Turing)에서 출발한 컴퓨터와 인공지능에 대한 연구가 잘못된 방향을 걷고 있다고 생각한다. 그들이 제기하는 비판의 근거는 무엇보다 그들이 인간 두뇌가 어떻게 지능을 생산하는 지를 완전히 이해하지 못하고 있다는 것이다. 만약 그런 방식으로 AGI(그것은 strong AI라고 부르기도 함)를 발명하려면 인간 두뇌와 지능을 완전히 해독해야 하는데, 그것은 1백년 내 실현되기 어려울 것이라는 주장이다. “지능을 만들기(making intelligence)” 위해 먼저 “지능을 이해하기(understanding intelligence)”는 크게 잘못된 접근이라는 것이다. 전자가 후자보다 더 쉬운 작업인데, 후자를 먼저해야 한다면, 그것은 어려운 작업을 먼저 해결한 다음 쉬운 작업을 해결하겠다는 논리적 오류에 빠지는 일이라는 비판이다. 그는 심지어 그러한 접근이 말 앞에 수레를 연결하는 것만큼이나 잘못되었다고 지적한다.

대안으로 그는 모방주의(imitationalism)를 주창한다. 리버스 엔지니어링(reverse engineering)을 통해서 인간 두뇌의 물리적 구조를 밝히고 그것을 모방한 기계를 만들어 가자는 주장이다. 그것은 현실적으로 가능할 뿐 아니라 궁극적으로 인간 두뇌-지능을 이해하는 지름길이기도 하다고 역설한다.

그는 인간 두뇌의 생물학적 신경세포 시스템과 동일한, 혹은 그것과 최대한으로 유사한 물리적 구조를 지닌 컴퓨터를 개발하는 것이 모방주의 접근의 핵심 과업이라고 주장한다.  그 물리적 모방 엔지니어링(physical imitation engineering)의 목표는 신경세포와 시냅스의 기능을 모사할 수 있는 초소형 기기를 개발하여, 궁극적으로 아주 소규모의 물리적 공간과 적은 전력 소모라는 조건 아래에서 인간 두뇌급의 신경망 시스템을 구축하는 것이다. 그것은 신경 컴퓨터(neuromorphic computer, 간략히 neurocomputer)라고 불리는데, 그것에 대한 연구와 개발이 이미 상당히 진척되었다고 한다.

Image result for truenorth chip
출전: https://www.slideshare.net/SamMbc/ibm-truenorth

그에 의하면, 2008년 미국의 DARPA(Defence Advanced Research Projects Agency)는, 1kW의 전력만을 사용하면서(인간 두뇌는 약 30 와트의 전기를 사용함) 인간 두뇌의 신경세포와 같은 수준의 능력을 지닌 전자 기기를 개발하도록 IBM과 몇 개의 대학에 1억달러의 연구기금을 제공하였고, 2013년 유럽은 1억 유로 이상을 투입하여 정보기술과 생명과학을 결합하는 인간두뇌 프로그램을 시작하였으며, 같은 해에 미국의 오바마 대통령은 12년 내에 인간 두뇌의 역동적 지도를 그리겠다는 BRAIN Initiative에 45억 달러가 투입될 것이라고 발표했었다.

실제적인 성과도 가시화되어서, 2014년 8월 Science 지에, IBM은 1백만개의 (인공) 신경세포와 2억5천6백만개의 (인공) 시냅스로 구성된 트루노스(TrueNorth)라는 신경칩(neuromorphic chip)의 개발에 성공했다고 발표했다. 또한 2015년 독일의 하이델베르크 대학은 20만개의 신경세포와 5천만개의 시냅스를 8인치 웨이퍼에 집적하는데 성공했다. 신경컴퓨터는 300억개 이상의 신경세포와 3조개 이상의 시냅스로 구성된 인간 두뇌에 비하면 아직 유아적 수준에도 미치지 못하지만 신경컴퓨터 연구자와 개발자들은 인공신경망이나 인공지능에 비해 신경컴퓨터가 훨씬 빨리 AGI를 구현하게 될 것이라고 믿는다.

출전: http://www.scinexx.de/diaschau-117.html

신경컴퓨터 연구자들의 대전제는 기능(function)이 구조(structure)에서 나온다는 명제이다. 그것은 인간 두뇌의 신경세포와 시냅스와 최대한으로 유사한 물리적 구조를 지닌 지능적 기기–즉, 신경컴퓨터–를 개발하면 인간 두뇌급의 지능이 그것으로부터 창발되고(emerging) 성장할 수 있으리라는 믿음이다.

인공생명(artificial life, A-life)은 인공지능이나 인공두뇌와는 크게 다른 수준의 게임이다. 그것은 신경세포(neuron)가 아니라 신경세포의 세포핵(nucleus) 내부에 존재하는 RNA, DNA, 그리고 단백질을 스스로 창조하는 RNA를 인공적으로 만드는 도전이다. 그것은 생명을 모방하는 객체를 만드는 일일 수도 있고, 진짜 생명체를 창조하는 일일 수도 있다. 인공생명 연구의 아버지라고 불리는 존 폰 노이만–컴퓨터의 구조를 창안한 바로 그 폰 노이만–은 인공생명 연구에도 관심을 가졌다. 그가 일찍 세상을 떠나지 않았다면 인공생명에 대한 연구가 더 일찍 발달했을 지도 모르겠다.

Related image
출전: http://www.maxxtexx.de/dna-dient-als-erfahrungs-speicher-fuer-nachkommen/

폰 노이만은 생명의 핵심이 자기복제(self-reproduction)에 있다고 이해했다. 그의 정의에 따르면 오늘날 자기복제가 가능한 컴퓨터 바이러스는 하나의 인공생명이라고 말할 수 있을 것이다. 그러나 엄밀히 말하자면 그것은 진짜 생명이 아니라 생명의 흉내내기에 지나지 않는다. 물론 그것만으로도 인류를 위협할 정도이지만 인공적으로 창조된 생명체와는 거리가 아주 멀다. RNA, DNA, 단백질 등으로 구성된 세포핵을 지닌 생명체인 인간이 세상을 인식하고, 자신을 의식하며, 성장하고 진화하고, 자신을 재생산하는 위대한 모습을 생각해 보라.

Image result for great human beings
출전: https://hubpages.com/education/inspiringpeople

인공생명의 연구와 개발은 아직 인공지능은 말할 것도 없고 인공 두뇌의 연구에 비할 바가 아닐 정도로 낮은 수준이다. 그러나 향후 20~30년 후 기술적 특이점(singularity)–기계의 두뇌가 인간의 두뇌를 넘어서는 시점–을 지나고 나면 인공지능, 인공 두뇌 그리고 인공생명에 대한 연구는 인간 자신이 아니라 A.I.나 인공두뇌에 맡겨질 지도 모른다. 그렇게 되면 인공 생명, 나아가 생명의 창조의 시기가 크게 앞당겨질 지도 모를 일이다. 바로 그 시점이, 인간이 진정한 창조주로 등극하는 순간이다!

그런데, 그런데…. 과연 그것이 인류에게 축복일까 저주일까? 페이크 뉴스(fake news) 정도로 크게 흔들리는 인간 문명이 과연 인공지능, 인공두뇌, 그리고 인공생명을 사회적으로 감당할 수 있을까? 다음에는 이 문제를 생각해 보자. (윤영민, 2018-02-26)

<참고 문헌>

Huang,  Tie-Jun. 2017. “Imitating the Brain with Neurocomputer”, Internation Journal of Automation and Computing 14(5). Pp.520-531.

von Neumann, John (ed. by Michael D. Godfrey). 1945. “First Draft of a Report on the EDVAC.”  http://history-computer.com/Library/edvac.pdf

지능이라는 이름의 게임(6): 두뇌-지능의 수수께끼를 풀어라!

세계 신경과학회(Society for Neuroscience)에는 3만8천명 이상의 회원이 가입되어 있으며 2017년 11월 미국 워싱턴 D.C.에서 개최된 신경과학 연례 컨퍼런스에는 3만명 이상의 학자와 전문가들이 참석하였다. 그 중에는 뇌와 신경 분야의 질병과 치료를 전공하는 의사들도 포함되어 있지만 참가자 대부분이 두뇌를 연구하는 학자들이라고 보면 될 것이다. 다시 말해  전세계적으로 수만 명의 학자와 전문가들이 인간 두뇌에 관심을 갖고 있다는 말이다. 덕분에 두뇌-지능(brain-intelligence)에 관해서 필자와 같은 비전공자가 따라잡기 불가능할 정도로 깊이 있고 다양한 연구가 발표되고 있다.

신경과학 연구의 핵심은 인간의 행동(혹은 의식)과 두뇌 구조 사이의 관계이다. 하지만 연구자에 따라 연구의 관점과 촛점이 크게 다르다. 어떤 연구자는 진화생물학적인 관점에서 접근하고, 어떤 연구자는 행동심리학적 관점에서 접근하며, 어떤 연구자는 두뇌의 기능적 측면에 관심이 있고, 어떤 연구자는 두뇌의 구조적 측면에 관심이 많다. 그런데 연구 성과들이 거의 대부분 뇌의 특정 영역이나 특정 기능을 다루고 있어, 필자와 같은 외부자들이 이해하기 쉽고, 두뇌-지능을 전체적으로 바라보게 해주며, 나아가 독창적인 이론적 관점을 담고 있는 논문이나 저서가 흔치 않다.

다행히 그런 저작 몇 편을 찾았다. 함께 그것들을 리뷰하면서 지능-두뇌를 이해해 보자. 먼저 예일대 신경과학과에 재직 중인 이대열 교수의 최근 저서, <지능의 탄생>(2017, 바다출판사)이다.

Image result for 지능의 탄생

이 교수는 지능을 생존을 위한 의사결정(decision making)으로 본다. 생물체의 진화는 지능(intelligence)의 진화를 수반한다. 생명의 핵심은 유전자의 자기복제인데, 유전자는 RNA에서 시작하여 DNA와 단백질로 분화하고, 단세포 생물체에서 다세포 생물체로, 식물에서 동물로, 곤충에서 파충류, 그리고 인간이 속한 포유동물에까지 진화한다. 각 생물체는 자신의 생존에 적합한 지능을 갖고 있다. 단순한 생명체는 낮은 지능만을 갖고 고등 동물은 높은 수준의 지능을 갖는다. 특히 날쌔게 움직여야 살아남을 수 있는 동물들에게는 신경세포가 모인 두뇌(brain)가 발생하였고, 예측과 판단을 위한 대뇌 신피질(cerebral neocortex)이 발생하였다. 특히 복잡한 사회생활을 해야하는 인간은 다른 동물에 비해 크고 복잡한 구조의 신피질을 갖게 되었다.

그런데 인간의 신피질은 세상에 태어나는 순간에 완성체로 출현하는 것이 아니라 성장 하면서 발달하고 살아가면서 변화된다. 의사결정에는 기억, 분류, 개념화, 비교, 예측, 그리고 학습이 필요하다. 감각기관을 통해서 외부의 자극을 받으면 신피질, 해마, 기저 핵 등에 신경세포-시냅스 네트워크가 형성되고, 일종의 학습 과정을 통해서 기억은 강화되거나 약화되고 혹은 소실된다.

지능은 기억을 가지고 하는 생존 게임이다. 유전자는 효과적인 생존을 위해 두뇌에게 자율성을 부여한다. 그래서 두뇌는 스스로 판단에 의해 생존–유전자의 자기복제–에 가장 유리한 행동을 선택해야 한다. 경험을 통해서 환경에 관한 정보를 인지하고 분류해서 저장해두고(기억), 특정 상황에서 취한 행동과 그것의 결과(보상, reward) 사이의 관계를 기억한다. 그리고는 새로운 자극이 들어오면 관련된 기억을 활성화하여 여러 가지 행동 옵션을 비교하여 선택한다.

Image result for reinforcement of memory in brain
출전: http://www.sashasheng.com/blog/2018-1-6-reinforcement-learning-taxonomy

경쟁하는 욕구들 혹은 가능한 행동들 사이에서 의사결정을 하려면, 다양한 옵션들의 예상 효과를 공통의 보상 척도로 측정할 수 있어야 하며, 각 옵션이 가져오는 당장의 영향 뿐 아니라 미래의 영향에 대해서도 그 값을 추정할 수 있어야 한다. 그 값들을 비교하여 두뇌–보다 구체적으로 대뇌 신피질–는, 항상 성공적인 결과가 보장되지는 않지만, 신속한 의사결정을 내린다.

이러한 과정이 학습(learning)이고 지능 작용인데, 거기에서 중요한 요소가 오류(error)와 가치(혹은 효용)이다. 두뇌는 저장된 과거 기억을 활용해서 행동이 가져올 가치(value)를 예견하고 행동을 명령한다. 행동한 이후에 생성된 가치가 예견된 가치보다 작거나 크면 보상 예측 오류(reward prediction errors)가 발생한다. 보상예측오류는 학습이 필요하다는 시그널이다. 두뇌가 행동의 가치값을 변화시킨다는 것이다. 그것이 학습이다.

Image result for reward prediction errors
출전: https://www.dialogues-cns.org/contents-18-1/dialoguesclinneurosci-18-23/

도파민(dopamine)은 보상예측오류를 반영하는 신경화학물질이다. 예상보다 결과가 좋으면 도파민 분비가 증가되어 다음 번에는 예측값을 높이도록 유도하고, 반대로 예상보다 결과가 좋지 않으면 도파민 분비가 감소되어 다음 번에는 예측값을 낮추도록 유도한다.

두뇌의 보상 예측 오류는 안도(relief)/후회(regret), 득의(elation)/실망과 같은 정서적 상태를 수반한다. 그러한 정서 상태는 두뇌가 기억을 강화할 것인지 갱신할 것인지를 결정하는 필요한 요소인지도 모른다. 이는 후회나 실망과 같은 부정적인 정서도 지능과정에 긍정적 역할을 수행함을 함축한다.

Related image
출전: www.planbox.com. https://www.planbox.com/2017/07/07/innovation-evolution-ai/

끝으로 생존을 위한 의사결정이라는 관점에서 보면 최고의 지능은 무엇보다 자율성을 지녀야 한다. 스스로 복제(reproduction)를 추구할 수 있어야 하고, 자기 복제(self-reproduction)를 위해 미래에 대비하거나 효과적인 의사결정을 내릴 수 있어야 한다. 인공지능(artificial intelligence)도 자기 복제 능력을 가질 수 있을까? 혹은 인공지능에게 자기 복제 능력을 허용해야 할 것인가? 이 교수는 언젠가 인공지능이 자기 복제 능력을 가질 정도로 테크놀로지가 발전하겠지만, 인공지능에게 자율성을 허용해서는 안 될 것이라고 주장한다. 인간과 인공지능 사이에 본인-대리인 문제(principal-agent problem)가 필연적으로 발생할 것이기 때문이다. 인간(본인)의 생존과 번영을 위해 존재해야 하는 인공지능(대리인)이 인간의 이익보다 자신의 이익을 우선시할 가능성이 있고, 그럴 경우 인공지능에 의해 인간의 생존이 위협받는 결과가 초래될 수도 있다는 것이다. (윤영민, 2018-02-25).

지능이라는 이름의 게임(5): 두뇌의 구조

필자가 지능과 두뇌에 대해 관심을 갖는 것은 지금 그것들을 중심으로 경천동지할 변화가 일어날 조짐을 보이고 있기 때문이다. 오래 전 두뇌에 대뇌와 대뇌 신피질(cerebral neocortex)을 지닌 생물체가 출현하면서 생물체의 지능이 획기적으로 향상되었듯이, 앞으로 일어날 인간 두뇌의 급진적 변화–이미 그 변화가 시작되었다–로 인해 지금까지와는 완전히 다른 지능을 지닌 존재가 출현할 것으로 예상된다. 머신 러닝과 A.I.의 발전에서 그 조짐이 확인된다.

더 이상 지능과 두뇌를 신경과학자, 심리학자, 생물학자, 컴퓨터 과학자, 혹은 인류학자들의 손에만 맡겨둘 수 없다는 판단이다. 이미 꽤 오래 전부터 참여를 시작한 경영학자나 경제학자는 물론이고, 정치학자, 사회학자, 미래학자, 법학자, 또는 행정학자들도 지능과 두뇌에 관한 담론에 적극 참여해야 한다. 지능과 두뇌에 관한 오늘날의 발전은 100여 전 우생학과는 비교할 수 없는 규모와 방식으로–훨씬 근본적이며 광범위하게–개인과 사회에 영향을 미칠 것이기 때문이다.

지능의 관점에서 두뇌를 잠시 살펴보자. 우선 두뇌를 전체적으로 놓고 보면, 지능과 관련된 부위는 뇌의 최상부–대뇌(cerebrum)–를 약 90% 정도 덮고 있는 신피질(neocortex)–‘새겉질’이라고도 불림–로 알려져 있다. 신피질은 식탁용 냅킨 정도의 크기, 그리고 명함 여섯장을 합쳐놓은 두께(약 2mm)이며, 약 300억개(1천억개라고 추정하는 학자도 있음)의 신경세포(neurons)로 이루어져 있다(Hawkins, 2004).

인간의 뇌는 놀랍도록 조밀하게 연결된 신경세포 네트워크일 뿐 아니라 유연성이 큰 신경세포 집합이기 때문에 뇌의 특정 부위가 특정 기능을 수행한다고 단정하는 것은 원칙적으로 바람직하게 생각되지 않는다. 이 원칙은 여기서 논의하는 지능에도 해당된다.

예컨대 지능의 구현에서 중요한 기억(memory) 기능은 신피질 뿐 아니라 해마(hippocampus)에 의해서도 수행한다[Hawkins(2004)는, 해마가 신피질에서 해석되지 못한, 새로운 자극을 저장하는 것으로 추정한다]. 이대열(2017)은, 해마에는 서술적 기억(declarative memory: 다른 사람에게 언어를 이용해서 설명해 줄 수 있는 기억)이 형성되고, 절차적 기억(procedural memory: 동작 순서에 대한 기억)은 기저핵(basal ganglia)에 형성되는 것으로 추정한다. 시상(thalamus)의 경우도 마찬가지이다. Eagleman(2015)에 의하면, 시상에는 수많은 시각  피질(visual cortex)이 연결되어 있으며, 외부에서 들어온 시각 정보와 대뇌에 있는 내부 모형(internal model)을 비교하여 발견되는 차이를 대뇌에 알리는 기능을 담당한다고 지적한다.


Related image

신피질의 지능 작용–분류, 기억, 예측, 비교, 이해, 상상 등–은 신경세포 네트워크(neural networks)를 통해서 이루어진다. 신경세포(neurons)는 전기-화학적(electro-chemical) 반응을 통해서 정보를 전달, 저장, 복원, 혹은 업데이트한다.  자극을 받으면 신경세포는 시냅스(synapse)를 통해서 다른 신경세포들과 연결되어 하나의 네트워크 구조를 형성한다. 신경세포 하나가 할 수 있는 일은 거의 없다.

신경세포는 세포체(soma)와 세포핵(nucleus), 세포체에 붙은 나뭇가지 모양의 수상돌기(dendrite), 축삭(axon)이라는 신경 섬유, 그리고 축삭종말(axon terminal)로 이루어져 있다. 이 중 세포핵은 다른 세포의 세포핵처럼 RNA의 생성과 같은 세포의 생명유지 기능을 담당한다. 수상돌기는 신경세포의 일종의 정보 접수 창구이다. 수상돌기는 이웃 신경세포로부터 화학적 신호를 받거나 감각기관으로부터 물리적 자극을 받으면, 세포체와 함께 활동 전압(action potential)을 생성한다. 이 전기적 신호는 축삭을 통해서 축삭 종말에 전달된다. 축삭 종말은 신경전달물질(neurotransmitter)을 분비해서 그 전기적 신호를 화학적 신호로 바꾼다. 그 신경전달물질은 축삭종말과 인접 신경세포의  수상돌기 사이에 존재하는 시냅스를 통해서 전달된다. 이 시냅스 연결이 강화되거나 약화되면서 하나의 신경세포 네트워크로서의 새로운 기억이 형성되고, 기존의 기억이 재구성되거나 소실된다.

Related image

Image result for 시냅스

Hawkins에 의하면, 대뇌 신피질의 각 영역(region)은 계층(layer)과 기둥(column)으로 이루어져 있다. 대부분의 신경세포들은 여섯 개의 층(layers)으로 이루어져 있으며, 각 계층은 서로 다른 역할을 맡고 있다(아래 그림 참조).

Related image
출전: thebrain.mcgill.ca. 항목 The Retina.
Cerebral cortex layers microanatomy
신경과학에서 Afferent는 들어오는 신경, efferent는 나가는 신경을 말함. 출전: 표는 Epomedicine.com에서 가져왔음.

위 표에서 보듯이 계층 1의 경우 자체의 신경세포는 소수에 불과하고 하위 계층의 신경세포의 수상돌기들로 채워져 있다. 이는 계층 1이 여러가지 정보를 결합하는 기능을 하고 있음을 추정하게 한다. 계층 4는 시상(thalamus)으로부터 정보를 받아서 다른 계층들이나 기둥들에게 전달하는 역할을 하고, 계층 6는 뇌간으로부터 정보를 받거나 시상으로 정보를 내보낸다. 계층2은 신피질의 다른 영역으로부터 정보를 받으며, 계층3은 외부로부터 정보를 받거나 내보내고, 계층5는 동작 운동(motor movements)을 일으키는데 관여하는 것으로 알려졌다. 기둥들이 하는 역할에 관해서는 잘 밝혀져 있지 않다. 다만 Hawkins는, 기둥 구조가 인식 대상의 정보가 여러 계층 사이를 효율적으로 전달되게 하며, 특히 여러 개의 기둥들이 병렬로 작동하여 대상에 대한 신속한 인식과 판단을 가능하게 해주지 않나 추정한다(Hawkins, Ahmad, and Cui, 2017).

두뇌 구조에 관한 소개는 이 정도로 마치고 이제 다음 네 편의 저술에 제시된 해석을 따라 가면서 지능과 두뇌의 관계에 대해 보다 깊이 생각해 보겠다.

  1. <지능의 탄생>(이대열. 2017): 진화생물학 및 행동심리학적 접근
  2. <On Intelligence>(Hawkins, 2004): 지능 기계(intelligence machine) 설계자의 관점
  3. <The Brain>(Eaglman, 2015): 인지 신경과학(cognitive neuroscience)(심리학+신경과학)적 접근
  4. “Imitating the Brain with Neurocomputer”(Huang, 2017): 신경컴퓨터(neurocomputer) 연구자의 관점

<참고 문헌>

이대열. 2017. <지능의 탄생>. 바다출판사.

Eagleman, David. 2015. The Brain. Pantheon Books.

Hawkins, Jeff. 2004. On Intelligence. Times Books.

Hawkins, Jeff, Subutai Ahmad, and Yuwie Cui. 2017. “Why Does the Neocortex Have Columns, A Theory of Learning the Structure of the World.”

 https://www.biorxiv.org/content/biorxiv/early/2017/09/28/162263.full.pdf

(윤영민, 2018-02-24)

지능이라는 이름의 게임(4): 구별-분류-예측-판단-행동

지능(intelligence)을 환경으로부터의 도전 속에서 개체(entity)가 살아남는 능력이라고 규정한다면, 지능이 작동하는 과정은 아래 그림으로 표시될 수 있을 것이다.

개체는 환경(혹은 대상)을 인지하고(인지, cognition) 거기에 반응한다(행동, action). 예컨대 호랑이(대상)를 발견한(인지) 사슴(개체)은 전력을 다해 달아날 것(행동)이다.

개체는 환경(혹은 환경의 변화)에서 발생되는 신호(signals)를 감지하고 그것을 분류하고 판단하며, 거기에 대해 특정한 반응(행동)을 한다. 개체의 두뇌(혹은 기능적으로 두뇌의 역할을 하는 부분)는  감지된 대상이 위험한가 안전한가 혹은 적군인가 아군인가를 판별하고 그에 따라서 어떻게 반응할 것인지를 결정한다. 여기까지를 인지 과정이라고 할 수 있다.

앞 글에서 논의했듯이 20세기에는 인지 과정 혹은 인지 과정의 일부만을 지능으로 간주하는 것이 대세였지만, 결과주의적 경향이 강한 21세기에는 행동까지를 지능에  포함시키고 있다. 지능은 환경 혹은 환경의 변화 속에서 살아남는 능력을 가리키기 때문이다.

그런데 인지 과정과 행동 과정을 좌우하는 요인들이 다르다. 인지 과정에는 정보, 지식, 경험 등의 기억(memory), 기억의 선별적 복원(retrieval), 조합, 구분, 비교, 그리고 선택에 관련된 요인들이 관여된다. 행동 과정에는 공감, 의지, 용기, 반응 속도, 에너지, 선택과 집중, 결단 등이 관여될 것이다. 지능을 결정하는 데 있어 인지 능력이 단연 중요하기는 하지만 행동 능력의 중요성도 작지 않다. 예컨대 설령 사슴이 호랑이를 발견했다고 하더라도 공포에 사로 잡혀 움직이지 못한다면 그 사슴은 살아남지 못할 것이다.

여기서는 행동 능력에 대한 논의는 뒤로 미루고 먼저 인지 능력에 관해 살펴보자.  최근 심리학, 생물학, 그리고 신경과학이 크게 발전하였지만 아직 인지과정에 대한 이해가 높은 수준이라고 말하기는 곤란하다. 인간이나 동물의 인지가 두뇌에서 어떻게 일어나는지가 완전히 밝혀지려면 한참 더 많은 학술적 진전이 있어야 할 것이다. 아직 어떤 학문도 뛰어난 작곡, 페인팅, 작시, 작문, 학문적 추론 혹은 초인적인 상상이나 예견이 어떻게 가능한가를 설명하지 못한다. 그러나 인지 과정에 관해 현재까지 밝혀진 것만 해도 대단하기 때문에 그 정도 수준에서라도 논의할만한 가치가 충분하다.

옥스포드 영어사전에 따르면, 인지(cognition)란 사고(), 경험, 감각을 통해서 지식과 이해를 획득하는 정신적 과정을 총체적으로 가리키는 전문 용어이다. 그런데 지식과 이해를 얻는다는 말이 무슨 의미일까?

Image result for cognition

 

인지를 더 이상 해체할 수 없을 때까지 분해하면 마지막에 도달하는 작용은 아마도 구별(혹은 식별, distinguish)일 것이다. 구별이란 차이를 알아차리는 것이다. 차이(difference)를 알아차리려면 어떤 기준(criterion)을 가지고 대상들을 비교해 판단해야 한다. 대상들을 구별하면 그것들은 구분(혹은 분류, classify)된다. 분류(구별과 혼동되기 쉬운 구분이라는 말 대신 이 용어를 쓰겠다)란 어떤 기준을 가지고 대상들을 범주화하는 정신 작용이다. 대체로 범주(categories)의 수는 대상(objects)의 수보다 작다. 덕분에 우리는 대상들을 효율적으로 인식할 수 있다.

우리는 끊임없이 세상을 구별하고 분류한다. 그것은 생존을 위해서 필수적이다. 우리는 생물과 무생물, 동물과 식물, 여자와 남자, 덥다와 춥다, 뜨겁다와 차다, 적과 동료, 낮과 밤, 봄/여름/가을/겨울, 아름답다와 추하다, 좋아하는 것과 싫어하는 것, 죽은 것과 산 것, 선과 악, 진실과 거짓 등등, 구체적일 수도 있고 추상적일 수도 있는 대상들을 구별하여 분류한다. 구별-분류가 중단되는 순간 우리는 생존을 위협받게 될 것이다.

인지 능력이 발달한다는 말은 근본적으로 분류하는 능력이 강력해짐을 의미한다고 해도 과언이 아니다. 곤충보다는 포유동물이, 포유동물 중에서도 개나 고양이보다는 사람이, 아이보다는 어른이,  교육을 받지 않은 사람보다는 교육을 많이 받은 사람이 대상을 더욱 정교하게 혹은 더욱 복잡하게 분류할 수 있다.

Related image

인간은 언어를 사용하기 때문에 분류된 대상을 추상적인 개념(concept)으로 규정할 수 있다. 개념화(conceptualization)란 어떤 대상이 다른 존재들과 구분되어 인식될 수 있도록 일종의 이름을 부여하는 정신 활동이다.

정신적으로 성장한다는 것 혹은 교육을 받는다는 것은 무엇보다 분류 능력과 개념 작용(conception)의 향상을 의미한다.  지적으로 성장하면 이전에는 보지 못했던 대상이 눈에 들어오기도 하고 대상들 사이의 미세한 차이를 감지할 수 있으며, 나아가 그것을 정확하고 정교하게 표현할 수 있게 된다.

학문의 발달도 분류와 함께한다. 흔히 분류체계(taxanomy)와 함께 학문이 시작하고, 학문이 발달하면 분류체계도 정교해진다. 식물의 분류, 동물의 분류, 질병의 분류, 병원균의 분류, 집단의 분류, 사회의 분류, 인종의 분류, 직업의 분류, 문헌의 분류 등등 분류에 관해서는 끝을 찾기 어려울 정도로 긴 목록이 존재한다.

Journal of Classification

그런데, 분류는 어떻게 가능한 것일까? 그리고 왜 분류를 하는 것일까?

아마도 분류를 가능하게 해주는 것은 무엇보다도 기억(memory)일 것이다. 우리의 두뇌에는 살아오면서 학습된 개념, 이미지, 경험, 이론 등이 내장되어 있다. 그리고 그 때 그 때 일부 기억들이 복원(retrieve)되면서 대상들을 비교하고 판단하는 기준이 된다. 만약 우리가 기억할 수 없고, 혹은 기억을 적절히 복원할 수 없다면, 우리는 인식을 위한 비교 대상, 판단 기준을 가질 수 없고, 따라서 인지가 불가능하게 된다.

분류 자체가 목적일 수는 없을 것이다. 분류는 궁극적으로는 당연히 유전자의 자기복제, 즉, 생존을 위한 것이겠지만, 좀 더 직접적으로 우리는 무엇을 위해서 끊임없이 분류하는 것일까? 분류가 무엇을 가능하게 하여 생존에 기여하는 것일까?

분류는 예측(predictions), 판단(judgement),  또는 행동(action)을 위한 것이 아닐까 생각된다. 분류와 예측은 동어반복일 수도 있다. 분류는 예측의 한 형태이기도 하고, 예측은 분류의 한 형태일 수도 있기 때문이다. 일단 두 가지를 별개의 정신 과정으로 본다면, 분류는 예측을 가능하게 해주는 요건이라고 말할 수 있다. 예컨대 앞에 서 있는 사람이 위험 인물로 분류되면, 그가 육체적으로 공격하거나 속임수를 쓰지 않을까 우려된다(예측). 만약 그럴 것이라고 판단되면(판단) 그 사람을 피하거나 마음의 준비를 단단히 할 것이다(행동). 혹은 지금 걷고 있는 길이 막다른 골목이라고 간주되면(분류), 더 이상 갈 수 없게 될 것이라 예상하고(예측), 되돌아가기로 결정하며(판단), 실제로 발길을 돌릴 것이다(행동).

인지를 담당한 신체 부위는 두뇌(brain)이다. 인간의 신체 중 가장 중요한 부위는 두뇌이다. 법적으로도 두뇌가 사람의 정체(성)을 결정짓는다고 본다. 어떤 사람이 뇌사 판정이 나야 사망으로 간주된다. 최근에 두뇌 이식이 시도되고 있는데, 정확히 말하자면 두뇌 이식이 아니라 신체 이식이다. 두뇌에 다른 사람의 신체를 갖다 붙이는 것이다.

그런데 두뇌에서 인지 작용은 어떻게 진행되는 것일까?(윤영민, 2018-02-13).

지능이라는 이름의 게임(3): 새 패러다임

지난 20여년 사이에 집단지성(collective intelligence)은 수 억명의 인터넷 사용자들에게 일상의 일부가 되었고, 아주 최근까지도 겨우 영화적 상상 속에서나 존재감을 보여주던 인공지능(artificial intelligence, A.I.)은 단기간에 대중을 기대와 우려의 혼돈 속에 밀어넣고 있다. (집단지성보다는 집단지능이 collective intelligence의 더 적합한 역어이다.) 예컨대 아마존 닷컴, 옥션, G-마켓 등 온라인 상점에서 고객은 별점 정보와 댓글을 확인하며 판매자의 신뢰와 상품의 품질에 대해 판단하고, 거래가 끝나면 별점을 매기고 댓글을 올려서 판매자와 상품을 평가한다. 아마도 전세계적에서 매일 수천 만  혹은 수억 건의 온라인 거래가 그런 방식으로 이루어지고 있을 것이다. 그것은 다름 아닌 집단지능이 일상화된 예이다. SNS의 맞춤형 친구 추천, 검색 사이트의 개인화 서비스. 인터넷 쇼핑몰이나 인터넷 서점의 맞춤형 상품 추천 , 스마트폰의 음성 어시스턴트, A.I. 스피커의 음성 제어, 자율주행 자동차, 자동화 공장, 드론 등 인공지능의 목록은 이미 끝을 알 수 없을 정도이다.

Image result for ai examples in everyday life

이러한 현상을 지능(intelligence)의 관점에서 파악하려다 보면, 우리는 중대한 결정을 내려야 한다. 지능에 대한 20세기적 패러다임, 즉, IQ 패러다임을 포기하던지 아니면, 그러한 현상을 지능이 아니라 다른 개념으로 표현해야 한다. 지능 개념의 현실 부적합 정도가 심각하다는 의미이다. 아무 일도 없었던 것처럼 지능이라는 용어를 그대로 쓸 수는 없다. 필자는 지능에 관해 새로운 패러다임이 요구된다고 본다. 집단 지능이나 인공지능을 굳이 지능이 아닌 다른 용어로 표현할 필요가 없다는 말이다.

1) 그렇다면 지능을 어떻게 규정해야 할까? 앞 글에서 지적한 IQ 패러다임의 다섯 가지 특성을 재고하면서 논의해 보자. 지능은 정신적인 능력(mental capability)인가? 지능이 추론, 문제 풀이, 추상적 사고, 이해, 학습, 기억 등을 포괄하는 정신적 능력인가? 정신적인 능력으로만 지능을 정의하면 우리는 두 가지 문제에 봉착하게 된다. 첫째, 지능이 어디서 나왔는지, 그리고 왜 출현하였는지에 대해 설명할 수 없게 된다. 둘째, 정신(mind)이 없으면 지능이 없다는 함정에 빠지게 된다. 정신은 두뇌(brain)를 가진 존재만이 갖게 되는데, 두뇌가 없으면 지능이 없는 것으로 간주하게 된다. 예컨대 두뇌가 없는 식물이나 사물은 지능을 가질 수 없게 된다.

Image result for 지능의 탄생

지능에 대한 좀 포괄적인 정의를 보자. 신경과학자 이대열(2017: 26)은, 지능을 “다양한 환경에서 복잡한 의사결정의 문제를 해결하는 능력”이라고 정의한다. 환경에서 생존과 번영–그것을 이 교수는 유전자의 자기복제라고 한다–에 관련된 문제를 발견하고 그것을 해결하는 능력이라는 의미이다. 행동과 결과에 촛점을 맞춘 이 정의는 앞의 두 가지 문제를 피해갈 수 있게 해준다. 지능을 진화론적, 발생론적으로 접근할 수 있고 지능을 정신 혹은 두뇌와 분리해서 생각할 수 있다는 말이다.

2)  지능은 개인적인 능력인가? 만약 지능이 정신 능력이 아니라 생존을 위한 문제 해결 능력이라면, 더 이상 지능은 개인적인 속성으로만 간주될 수는 없다. 환경이나 주위로부터 도전은 개인적인 차원을 넘어서 집단적으로 접근해야 더 잘 대처할 수도 있기 때문이다. 적지 않은 생물학자들이 지적하듯이 개체들 사이의 경쟁이 아니라 개체들 간의 협력(collaboration)이 유전자의 자기복제, 즉, 생존과 번영에 효과적으로 도움이 될 수 있다(크로포트킨, 2005; 벤클러 2015;  이대열, 2017).

Image result for 초협력자

1990년대 인터넷이 대중적으로 보급되면서 인터넷을 통해서 나타나는 새로운 유형의 지능 현상에 주목하는 사회과학 저술이 등장하였다. 그것은 집단지능(collective intelligence: 레비, 1994/2002; 셔키, 2008; 리드비터, 2009)이라고 불리기도 하고, 군중의 지혜(wisdom of crowds: 서로위키, 2004)라고 불리기도 했으며, 군집지능(swarm intelligence: Gloor, 2006)이라고 불리기도 했지만, 모두 동일한 방향을 가리키고 있었다. 그것은, 인터넷 상에서는 중앙의 조정 없이도 많은 사람들이 생존에 관련해서 높은 수준의 지능, 즉, 상황 대처 능력, 문제해결 능력을 가질 수 있다는 사실이었다. 가장 최근에 등장한 블록체인(blockchain)도 집단지능의 일종이다. 그것은 P2P 기술을 이용하여 사람들의 협력을 유도하고 그것을 기반으로 교환(거래)에 요구되는 신뢰와 인증 문제를 해결하고 있다(Norman, 2017).

3) 지능은 선천적인 능력인가? 집단지능을 지능 혹은 지능 현상으로 인정하면, 지능이 선천적인 것이냐 양육될 수 있는 것이냐는 하는 논의는 무의미해진다.  집단 구성원의 상호작용, 특히, 협력을 통해서 창출되는 지능은 정의상 천부적일 수 없기 때문이다.

더구나 아직 충분히 실현되었다고는 말할 수 없지만, 화학적, 물리적 혹은 의학적 처치로 지능을 일시적으로 강화시키거나 무생물에게마저 인위적으로  지능을 부여할 수 있는 시대가 된다면, 지능은 더 이상 자연적인라고도, 양육을 통해서 얻어질 수 있는 것이라고도 말할 수 없는 하나의 기능(function)이 된다. 이미 신경 향상(neuro-enhansment) 기술의 초기 버전이라고 할 수 있는 모다피닐(Modafinil)은 기면증 치료제로 개발되었음에도, 대학생, 컨설턴트,  심지어 군인들이 집중력을 높이기 위한 두뇌 강화제로 사용하고 있으며(Battleday et. al., 2015), 인공지능-로봇은 안내, 문서처리, 회계 등과 같은 정부 업무를 수행하기 시작했다(Baart, 2016).

Related image

4) 지능은 IQ 테스트와 같이 동일한 척도로 측정되고 비교될 수 있을까? 알파고처럼 바둑을 두는 A.I., 전자제품을 자율적으로 제어하는 A.I., 전투를 수행하는 A.I. 로봇, 화성을 탐험하는 A.I.로봇, 자율주행차, 산업스파이용 A.I. 드론, IBM Watson 같은 암진단 전용 A.I.,  그리고 가사용 A.I. 로봇처럼 특정한 분야에서 특정한 기능을 수행하는 A.I.가 빠르게 증가하고 있는데, 그러한 A.I.들의 지능 수준이 어떻게 측정되고 상호 비교될 것인가. 또 서로 다른 분야, 서로 다른 기능을 수행하는 A.I.의 지능이 설령 비교될 수 있다고 하더라도 그것이 무슨 의미를 갖겠는가.

Image result for alphago zero vs human

5) 지구상에서 인간이 가장 높은 지능을 지니고 있을까?  인간은 생물 중 가장 복잡한 문제들에 관해 의사결정을 할 수 있는 존재이다. 이대열 교수(2017)는, A.I.가 스스로 자신을 복제하고, 그 복제를 위해 두뇌를 사용할 수 없는 한 A.I.의 지능이 높은 수준이라고 말할 수 없다고 주장한다. 그는 먼훗날 A.I.가 그렇게까지 진화할 수 있을지도 모르겠지만 가까운 시일 내에 그럴 가능성은 없다고 본다. 그리고 아무리 바둑을 잘 두고 암 진단을 잘 한다고 할 지라도 자율성이 없는 A.I.는 결코 인간의 지능을 넘어설 수 없다는 말이다.

Image result for intelligence genes

그러나 위에서도 지적했지만, 누가 누구보다 더 지능이 높다는 판단이 무슨 의미가 있을까? 지구상에서 인간이 가장 복잡하고 발전된 문명을 이룩했지만, 만약 바로 그 문명 때문에 핵전쟁이 일어나고 지구가 죽음의 행성으로 변해버린다면 과연 인간은 아메바나 식물보다 더 지능이 높다고 말할 수 있을까? 그렇게 되면 인간은 유전자의 자기 복제에 완전히 실패한 것이 될텐데.

이제 지능이라는 개념을 20세기적 IQ 패러다임에서 풀어주자. 그럴 때가 되었다. (윤영민, 2017-02-05).

참고문헌

레비, 피에르(권수경 역). 1994/2002. <집단지성: 사이버공간의 인류학을 위하여>. 문학과지성사.

리드비터, 찰스(이순희 역). 2009. <집단지성이란 무엇인가>. 21세기북스.

벤클러, 요차이(이현주 역). 2013. <펭귄과 리바이어던>. 반비 출판.

서로위키, 제임스(홍대운/이창근 역). 2004. <대중의 지혜: 시장과 사회를 움직이는 힘>. 랜덤하우스.

서키, 클레이(송연석 역). 2008. <끌리고쏠리고들끓다>. 갤리온.

이대열. 2017. <지능의 탄생>. 바다출판사.

크로포트킨, P. A.(김영범 역). <만물은 서로 돕는다>. 르네상스.

Baart, Ruben. 2016/09/07. “Robots Taking Government Jobs”. NNN. 

Gloor, Peter. 2006. Swarm Creativity. Oxford University Press.

Norman, Alan T. 2017. Block Chain Explained. Alan T. Norman. Kindle book.

지능이라는 이름의 게임(2): IQ 패러다임

오늘날의 관점에서 보면 참으로 어처구니 없게 느껴지지만 20세기초 사회적으로 가장 영향력 있는 학문 중 하나는 우생학(eugenics)이었다.  우생학이란 좋은 형질의 유전은 장려하고 나쁜 형질의 유전은 억제해서 인간의 유전체를 개선하겠다는 학문이다.

우생학은 인종주의와 결합되어 독일에서는 히틀러 정부의 유태인 학살, 미국에서는 반인종적 이민법, 일본에서는 조선인 학살과 식민 지배의 정당화를 낳았으며, 일부 국가들에서는 범죄자나 정신박약자는 물론이고 사회적 약자들을 없애는 거세법(단종법)과 같은  야만적, 범죄적, 반인도주의적 정책과 제도를 낳기도 했다.

Image result for eugenics

그런데 흥미있게도 우생학의 시조로 간주되는 프랜시스 갈톤(Francis Galton)–그는 진화론의 창시자인 찰스 다윈(Charles Darwin)의 사촌이다–은 현대 지능 연구의 창시자 중 1인이기도 하다. 그는 사람들이 지닌 지적 능력의 차이에 관심이 많았고, 지능을 측정하는 통계적 방법을 고안했다(Ritchie, 2015). 그에게 지능은 인간의 정신적 능력(mental capability)을 의미했으며, 지능은 기본적으로 유전적이나 양육에 의해서 일부 영향을 받을 수도 있다고 생각했다. 그는 지능과 관련해서 오늘날까지도 사용되는 “자연과 양육(nature and nulture)”이라는  유명한 표현을 남기기도 했다.

갈톤의 연구를 이어받아 20세기 전반 지능에 대한 연구를 끌어간 것은 영국, 독일, 프랑스, 미국의 심리학자들이었다. 그 중 미국 스탠포드 교육대학원의 심리학자 루이스 터먼(Lewis Terman)은 IQ(Intelligence Quotient)라는 용어를 고안했고 IQ의 측정 도구의 개발과 향상에 앞서 갔다. 흥미있게도 그는 심리학자이면서 갈톤과 마찬가지로 저명한 우생학자였다.

터먼이 제시한 공식에 의하면, 한 사람의 IQ는 그의 정신 연령을 생물학적 연령을 나눈값에 100을 곱한 값이다(아래 그림 참조). 만약 어떤 사람의 IQ가 100이라면, 그는 생물학적 나이와 정신 연령이 동일한, 즉, 동 세대의 평균적 지능을 갖고 있다고 추정된다.

Image result for intelligence quotient Lewis Terman

아주 흥미있는 공식이다. 이 공식에 따르면 피검자의 ‘정신 연령’이 결국 IQ를 좌우한다. 만약 아동에 대한 IQ 테스트라면, 아동이 조숙할수록(정신 연령이 높을수록), IQ가 높게 나오게 된다. 예컨대 IQ 점수가 아주 높아 ‘신동’으로 간주될 정도라면 그것은 그 아이가 이례적으로 조숙함을 의미하는 셈이다. 아동의 높은 IQ는, 그가 평생동안 뛰어난 지능을 지닐 것임을 함축하지는 않는 것이다. 특히 인간의 두뇌 능력이 대부분 선천적으로 결정된다는 우생학적 입장이 아니라, 만약 우리가, 지능이 교육과 같은 후천적인 노력에 의해 크게 영향을 받으며 평생 동안 변화될 수 있다는 입장에 선다면, 아동의 IQ는 그 아이의 조숙성의 정도를 가리키고 있을 뿐이라고 해석할 수 있다.

당시 IQ를 연구하던 심리학자들에게 지능이란 추론, 문제 풀이, 추상적 사고, 이해, 학습, 기억 등을 포괄하는 정신적 능력을 의미했으며, 그것은 상당부분 선천적으로, 다시말해 유전적으로 결정되는 속성이었다. 그들은, 특히, 뛰어난 정신적 능력, 즉, 천재(天才)는 문자 그대로, 하늘이 주는 재주, 타고나는 능력이라고 믿었다.

그런데, 초기 IQ 연구자들은 왜 굳이 인간의 지능을 측정하려고 했을까? 그것과 우생학과의 친화성을 생각해 보면 아마도 사람들을 선별하기 위해서였을 것이다. 아마 “머리가 아주 나쁜 사람들”을 골라내거나 반대로 “머리가 아주 좋은 사람들”을 골라내기 위해서였을 것이다. 역사적 기록을 보면 후자보다는 전자가 더 큰 이유였던 것으로 보인다. 20세기초 프랑스에서는 공립(초등)학교 입학 대상 아동들 중 수학 능력이 없는 학생들을 선별하여 입학에서 배제하는데 사용되었으며, 1차대전 때는 지능이 떨어지는 청년들을 징병에서 배제하는 데 사용되었다는 보고가 있다. IQ가 사회적 배제(social exclusion)의 도구였던 것이다.

iq and social exclusion에 대한 이미지 검색결과

필자의 생각에도 IQ 검사는 백해무익하다. IQ가 높게 나온 피검자는 평생 자신이 머리가 좋다는 착각 속에 빠져 살고, IQ가 낮게 나온 피검자는 평생 그 숫자를 낙인이나 저주처럼 안고 살아갈 가능성이 있다. 개인의 능력을 측정할 수 있는 다양한 방법들이 발달한 오늘날 IQ 검사의 유일한 용도는 사회적 배제 뿐이 아닌가 생각된다.

그럼에도 불구하고 IQ 중심의 지능 연구는 20세기 내내 지능에 대한 인류의 상상을 지배했다. 학자들에 따라서 지능이 다소 다르게 정의되고, 다르게 분류되거나 유형화되었지만 다음  다섯 가지 점에 있어서는 별로 다르지 않았다: 1) 지능은 정신적인 능력이다, 2) 지능은 개인적인 능력이다, 3) 지능은 상당부분 선천적이다, 4) 지능은 IQ 테스트와 같이 동일한 척도로 측정되고 비교될 수 있다, 5) 지구상에서 인간이 가장 높은 지능을 지니고 있다.

그런데 과연 지능은 IQ 패러다임 내에서 밖에 이해될 수 없는 것일까? 지능의 다섯 가지 특성은 21세기에도 여전히 유효한 것일까? 보다 최근의 연구와 현상을 가지고 그 특성들을 음미해 보자. (2018-02-02, 윤영민)

참고 문헌: Ritchie, Stuart. 2015. Intelligence: All That Matters. London: John Murray Learning.

Image result for Intelligence: All That Matters

지능이라는 이름의 게임(1): 배경

개인이나 집단의 생존과 번영을 결정하는 가장 중요한 요소는 무엇일까?

경제학에서 생산의 3요소로 토지, 노동, 자본을 드는 것을 보면 적어도 현대경제학의 토대가 마련된 18-19세기에는 그 세 가지가 핵심적인 요소가 아니었을까 생각된다. 자원이 넉넉하고(자연 자원), 열심히 일하며(노동), 돈이 충분히 투입되면(자본) 개인이든 기업이든 풍부한  가치를 생산할 수 있다는 인식이 널리 퍼져 있었던 추측된다. 물론 그러한 인식은 남의 자원을 강탈하거나 남의 노동을 착취하고 돈이 돈을 낳게 하면서 생존과 번영을 추구하는 모습으로 실현되기도 했다.

19세기말에서 20세기초에 중화학공업, 대기업, 대량생산 체제가 출현하고,  20세기 전반에는 1, 2차 세계대전을 겪으면서 과학과 기술(science and technology), 경영(management), 그리고 국가(state)가 생존과 번영을 좌우하는 요소로 추가되었다.  비행기, 잠수함, 원자폭탄 등과 같은 첨단 병기가 전쟁의 승패를 좌우하였으며, 교통통신의 발달로 시장이 전국화되고 국경을 넘어가면서 기업의 규모가 팽창하고 대량 생산, 대량 유통, 대량 판매가 실현되었으며, 덕분에 기업 경영의 중요성이 부상하고 경영학이 하나의 새로운 학문 분야가 되기도 했다.  또한 각 민족들이 앞다투어 독립적인 국가를 세우면서 다수의 민족-국가(nation-state)가 등장하고, 독일이나 일본 같은 소위 후발국들이 국가 주도의 경제발전에 성공하면서  민족-국가가 생존과 번영의 새로운 단위, 새로운 주체로 자리잡았다.

Related image

1950년대 이후 정보이론의 출현과 함께 계산과 제어 기술이 급속히 발전하였으며, 1960년대 후반에는 그 기술이 통신공학과 접합되면서 네트워크 기술이 추가되었다. 사실 그것은  국가간 첨단무기 경쟁과 민족국가 발전의 부산물이라고 말할 수 있다. 2차대전이 냉전으로 이어지면서 강대국 사이에는 미사일과 핵무기, 우주 탐험, 정보전 등을 둘러싸고 치열한 경쟁이 벌어졌으며, 경제, 금융, 교육, 연구, 복지, 주택 등 사회의 전 분야에 걸쳐 국가의 역할이 점차 확대되면서 정부의 정책 수립과 업무 수행은 인구 조사, 주택조사, 산업체 조사, 시장 조사, 여론 조사 등 온갖 유형의 대규모 조사를 토대로 이루어졌고, 그것은 계산, 제어, 네트워크, 암호 기술 등 정보통신기술의 발전을 수반하였다.

Related image

이차대전 이후 과학기술은 기업들 사이의 경쟁에서 뿐 아니라  국가간 경쟁에서도 가장 첨예한 전선을 형성하였다. 주요 선진국들에서는 기업은 물론이고 정부도 RND 투자에 팔을 걷어부쳤다. 이는 20세기 후반 정보기술(information technology)을 필두로 생명공학(bio-technology), 신경과학(neuro-sciecne) 등의 눈부신 발전을 가져왔다.

이러한 변화를 목격하면서 학자와 사회비평가들 사이에서는 가치의 원천에 대한 다양한 이론과 해석이 등장하였다. 1960년대 이후에 새로운 가치가 정보(information) 혹은 지식(knowledge)에서 나온다는 주장이 힘을 얻었으며, 데이터베이스, 인터넷, 스마트폰이 발달한 1990년대 이후에는 네트워크(network) 이론이 주목을 받았고, 2010년대에는 데이터(data)가 새로운 시대의 석유라는 주장이 대두하였다.

Image result for artificial intelligence

그리고 가장 최근에는 집단지성(collective intelligence)과 인공지능(Artificial Intelligence)에 대한 연구와 산업이 폭발적으로 성장하면서 지능(intelligence)이 가치의 원천으로 주목받고 있다.  특히 인공지능은 정보서비스 산업은 물론이고 로봇 산업을 위시한 각종 제조업에 도입되면서 인류의 미래를 규정할 테크놀로지로 사람들의 기대와 우려를 동시에 받고 있다.

이러한 맥락을 염두에 두고 이제 지능에 대해 생각해 보자. 지능의 본질은 무엇일까? 신경과학, 진화생물학, 컴퓨터 과학, 화학, 물리학등의 발달에 기반한 집단지성, 인간 강화 기술, 그리고 인공지능을 어떻게 이해해야할까? 지능은 과연 과학과 산업의 새로운 프런티어가 될 것인가? 앞으로 지능은 과연 어떤 모습으로 진화하게 될까? 그리고 지능의 진화는 인간사회를 어떻게 바꾸어 놓을까? 무척 무겁고 어려운 질문들이지만 가볍게 산책하는 마음으로 탐색해 보자.  (2018-02-01, 윤영민)

빅데이터, 상관관계, 예측….거품?

%eb%b9%85%eb%8d%b0%ec%9d%b4%ed%84%b0%eb%8a%94%ea%b1%b0%ed%92%88%ec%9d%b4%eb%8b%a4

결론부터 말하겠다. 우리나라에서 ‘빅데이터’는 시작부터 거품이었다. 그러나  ‘빅데이터’를 둘러싼 온갖 거품을 걷어내고 나더라도 기존의 계량적 사회과학 페러다임에 대해 ‘빅데이터’로 불리는 새로운 데이터 환경이 제기하는 도전은 여전히 유효하다.

아마존(amazon.com)을 가지고 이야기를 시작하자.  아마존은 추천 엔진(recommendation engine)이라는 기술-문화적 아이템을 세상에 내놓았다. 그렇다고 아마존이 사업 초기부터 추천 엔진을 사용하지는 않았다. 처음에 아마존 웹사이트는 전문가들이 작성한 서평(추천)을 게시했다. 그 서평은 인기가 있었고 책 판매에 상당한 효과를 가져왔다. 하지만 그 성과에 만족하지 않았던 아마존의 CEO 제프 베조스(Jeff Bezos)는 고객들 자신의 구매 선호를 기반으로 책을 추천하면 어떨까 상상했다. 그렇게 해서 아마존의 책 추천 엔진이 개발되었다. 오래지 않아 알고리즘에 의한 책 추천은 전문가에 의한 책 추천을 완전히 대체하였으며, 아마존의 성공에 자극을 받은 대형 인터넷 쇼핑 사이트들도 앞다투어 추천 시스템을 도입하였다.

아마존의 추천 엔진은 품목-대-품목 협업 필터링(Item-to-item collaborative filtering)이라는 알고리즘을 사용한다. 설명을 단순화하기 위해 아마존에 네 권의 책(A,B,C,D)만 있고 사용자가 두 명(User 1, 2)만 있다고 하자. 만약 새로운 사용자(User 3)가 A라는 책을 보았다면 그에게 어떤 다른 책을 추천하면 좋을까? 아마존의 추천 엔진은 기존 사용자들(User 1, 2)의 책 탐색 기록 정보를 이용해서 A와 가장 상관성이 높은 책들을 추천한다(아래 그림 참조).

recommendation_flow_i2i3
이 그림은 Software Programming blog의 How does the Amazon recommendation system work?에서 가져왔음. https://kunuk.wordpress.com/2012/03/04/how-does-the-amazon- recommendation-system-work-analyze-the-algorithm-and-make-a-prototype-that-visualizes-the-algorithm/

이 과정을 수학적으로 설명하면, <그림 1>에서 User 1은 [B, C, B] 순으로 검색했고, User 2는 [C, A, B] 순으로 검색했다. 이 정보를 가지고 품목-대-품목 행렬을 구하면 우측의 상단과 같다. 이 행렬을 가지고 두 벡터(vector) 끼리의 코사인 유사도(Cosine Similarity, CosSim)를 구한다. 아래 식(1)에서처럼 두 벡터의 내적(inner product)을 두 벡터의 노름(norm, 벡터의 크기)의 곱으로 나누어 코사인값을 구하면 된다.

이렇게 구한 유사도는 –1에서 1까지 값을 갖는다. 코사인 유사도 –1은 두 벡터가 서로 완전히 반대 방향인 경우, 코사인 유사도 1은 두 벡터가 완전히 방향이 같은 경우, 그리고 코사인 유사도 0은 두 벡터가 서로 독립적인 경우를 가리킨다. 정보나 책 검색에서 빈도가 음의 값을 가질 수 없으므로 코사인 유사도는 0에서 1까지의 값을 갖는다.

굳이 코사인 유사도를 구하는 공식을 가져온 이유는 그것이 상관성 척도임을 보여주기 위해서이다. 사회과학에서 사용하는 피어슨 상관(Pearson correlation)은 아래와 같은 식으로 구할 수 있다.

식(1)과 식(2) 를 비교해 보면 가 로, 는 로 대치되었을 뿐임을 알 수 있다. 결국, 이 된다. 각 벡터의 평균을 뺀 값으로 계산된 유사도가 피어슨 상관이다(O’Conner, 2012).

아마존 추천엔진의 사례는 다섯 가지를 시사한다.

첫째, 인과성의 발견이 더 이상 사회과학의 금과옥조가 될 수 없다. 당연히 세상을 이해하려면 인과성의 발견이 계속되어야 한다. 그것은 사회과학자에 주어진 사명이다.  그러나 오직 인과성이라는 창을 통해서만 세상을 이해하고 사회현상(심지어 자연현상)을 예측할 수 있다는 주장은 사회과학자들의 아집과 환상에 불과하다.

아마존이 인터넷 비즈니스 초기에 도입한 전문가 서평(추천)은 인과관계에 근거한 비즈니스 모형이라고 할 수 있다.  만약 책 추천을 위한 인과 모형을 만든다면, 그것은 고객의 개인 속성(나이, 학력, 전공 분야, 직업, 성별, 혼인상태, 취미 등)과 외부 요인(전문가 서평, 광고 등)으로 구성되었을 것이다.  아마존은 상관 모형을 택해서 전혀 다른 길을 갔다.  그리고 상관관계 기반의 추천 시스템은 아마존의 사업 성공에 크게 기여하였다.

둘째, 아마존의 추천 엔진은 ‘빅데이터'(양, 속도, 형태의 어느 기준으로도 봐도 빅데이터임에 틀림없다)에 의존하고 있다. 위에 든 예는 4권의 책과 3명의 고객만을 가정했지만, 현실에서는  4백만권의 책과 3천만명의 고객일지도 모른다. 그렇게 되면 품목-대-품목 행렬이 얼마나 크겠는가. 그리고 요즘 아마존은 심지어 고객들의 클릭 데이터까지 실시간으로 책 추천에 반영하려고 하고 있다. 아마존에게 있어 ‘빅데이터’는 거품이 아니라 가장 중대한 사업 문제를 해결하는 열쇠이다.

셋째, ‘빅데이터’는 대단히 실용적인 동기에서 출발했다. 아마존은 개별 사용자의 관심이나 선호에 대해 예측함으로써 서비스 사용자가 안게 되는 정보과잉(information overloading)의 문제를 풀려고 했다. 아마존은 사용자가 책을 찾는데 시간과 노력을 많이 투입할 수 없다는 가정 아래 데이터 분석을 통해서 사용자에게 가장 적합한 책을 선별해서 제시하려고 했다. 한 마디로 ‘빅데이터’에서는 과학적 발견(설명)보다는 실용성(예측)이 우선적인 목표가 되어왔다. 아마존의 사례는 상관관계 기반의 추천 모형이 사업 목적에 매우 잘 부합되도록 작동하고 있음을 보여준다.

넷째, 사람이 아니라 컴퓨터 알고리즘이 고객에게 상품을 추천한다. 빅데이터 덕분에(혹은 빅데이터 때문에) 데이터의 수집, 처리, 분석을 이제 사람 뿐만 아니라 컴퓨터가 수행하는 시대가 되었다. ‘빅데이터’의 진화 방향은 분명하다. 언젠가 데이터의 수집, 처리, 분석, 대응이 거의 모두 자동화될 것이다. 이미 상품 추천, 검색, 번역 등의 온라인 서비스 뿐 아니라 무인자동차 같은 오프라인 제품까지 모두 ‘빅데이터’를 활용하고 있지 않는가.

다섯째, ‘빅데이터’에서는 ‘예측(prediction)’이라는 개념이 상당히 다른 의미로 사용된다. 전통적으로 예측은 대체로 거시적 현상에 대한 전망(forecasting)이나 시나리오를 의미했다. 빅데이터 시대에 예측은 아주 미시적인 개인(individuals) 단위까지 행해진다.  즉, 선거, 스포츠 경기, 도박, 증권시장 등에 대해 전망할 뿐 아니라 고객 개인의 선호, 욕망, 태도, 행동 등에 대해서도 예견한다. ‘예측’은 그렇게 넒은 의미를 지니고 있으며, 예측이 이루어지는 기반도 인과관계를 넘어서 시계열 패턴, 상관관계, 베이즈(Bayes) 추론 등으로 확대되고 있다.   

우리 사회에서 ‘빅데이터’는 상당부분 거품이었음에 분명하다(그점에 관해서는 내가 다른 곳에서 논의하였다. ‘유행의 함정’ 참조). 그러나 그럼에도 불구하고 거품을 걷어내고 나면 거기에는 놀라운 진실이 발견된다. 그것은 전통적인 사회과학자들을 무척 불편하게 만들 진실이다. 현재 진행되고 있는 데이터 환경의 변화는 사회과학에게는 대지진 격이다. <빅데이터는 거품이다>라는 섣부른 비판으로 비껴갈 수 없는 흐름이다. 신중하게 대처하지 않으면 실증 사회과학은 존재 기반의 대부분을 잃게 될 지도 모른다. (윤영민, 2016/10/21)

<참고문헌>

O’Conner, Brendan. 2012. “Cosine Similarity, Pearson Correlation, and OLS Coefficients.” AI and Social Science (blog).  https://brenocon.com/blog/2012/03/cosine-similarity-pearson-correlation-and-ols-coefficients/