베이즈 통계(12): 모수추정과 신용구간

빈도주의 통계에서 표본 통계(sample statistics, 대개의 경우 표본평균)에 신뢰구간(confidence interval)을 붙여 수행하는 구간추정(interval estimate)이 있듯이 베이즈 통계에도 모수를 구간으로 추정하는 구간추정이 있다. 그런데 베이즈 추정에서는 모수의 점추정값(parameter point estimate)을 중심으로 신용구간(credible interval)을 잡아서 구간추정을 수행한다.

베이즈 추론을 통해서 추정된 퍼라미터를 얼마나 신뢰할 수 있을까? 베이즈 추론의 신용구간을 사용하면 95% 확신을 갖고 퍼라미터가 특정 구간 안에 있다고 주장할 수 있다.

예컨대 어떤 도시에 신생아의 몸무게 분포에 관해 실험을 실시하고 있다고 하자. 신생아의 몸무게 β가 2.8kg부터 3.5kg 사이 어딘가일 주관적 확률이 90%라고 한다면, 는 하나의 90% 신용구간이라고 말할 수 있다. 또한 어떤 사람의 통계학 기말 성적에 대한 95% 신용구간이 70~80점이라는 말은, 그 사람의 성적이 70~80점 사이에 있을 확률이 95%라는 의미이다.

빈도주의 통계에서는 신뢰구간(confidence interval)이 그 역할을 한다. 신뢰구간은, 우리가 100번 표집을 뽑아서 100개의 신뢰구간을 구하면, 그 중 95개가 그 안에 퍼라미터를 포함하고 있음을 의미한다. 퍼라미터는 고정되고 변하는 것은 신뢰구간이니 그런 결과가 나온다.

베이즈 추론에서 신용구간(credibile interval)은 빈도주의 통계의 신뢰구간과 달리 직접적으로 우리가 추정한 특정한 퍼라미터가 신용구간 내에 있을 가능성이 95%라고 주장할 수 있게 된다.

데이터 가 주어졌을 때,  관찰되지 않은 확률변수 의 값을 추정하려고 한다고 하자. 추정된 사후분포에서 다음 조건을 만족하는 구간 를 구할 수 있. 는 유의수준이다.

이 구간이 확률변수 X에 대한 신용구간(credible interval)이다.

베이즈 신용구간은 다음과 같이 정의된다. 관찰값 가 주어졌을 때, 만약 관찰되지 않은 확률변수 X의 사후확률이 구간  안에 존재할 확률이 이라면, 구간 을 확률변수 X에 대한 신용구간(credible interval)이라고 부른다.

그런데, 동일한 신뢰수준의 신용구간은 하나가 아니다. 그래서 최고사후밀도구간(Highest Posterior Density Interval, HPDI)–간략히 최고밀도구간(Highest Density Interval, HDI)라고도 함–을 사용한다.

가 확률변수 X의 밀도함수라고 하자. 그렇다면 HDI(다차원의 경우 HDR, Highest Density Region)는 다음을 만족하는 X의 표본공간의 부분집합 이다.

여기서 는 아래를 만족하는 최대의 상수이다.

예컨대 아래 그림의 각 분포는 95% HDI를 보여주고 있다. 이므로 인 수평선을, 양쪽 그래프의 아래와 위의 면적을 합한 값이 그래프 전체 면적의 95%가 될 때까지 끌어올리면 그 선이  이다. 분포곡선의 양쪽 경계에 해당되는 X 값의 범위, 아래 그림에서  (첫 번째 분포), (두 번째 분포), (세 번째 분포)가 각 분포의 95% HDI이고, 그 구간을 표시하는 양화살표선이 에 해당되는 선이다. 예컨대 첫 번째 그래프에서 양화살표선의 화살표 끝과 분포 곡선이 만나는 점이 이다.

HDI는 정의상 두 가지 특성을 갖는다.

첫째, 단봉분포(unimodal distribution)의 경우 HDI 구간 안에 있는 모든 점들의 사후분포함수 값들은 그 구간 밖에 있는 모든 점들의 사후분포함수값들보다 항상 크다.

둘째, HDI는 가장 짧은 길이의 신용구간이다.

신용구간은 모수 추정에 사용되지만 앞 포스팅에서 소개한 베이즈 인자(Bayes fractor)처럼 가설검정에도 적용된다. 어떤 학자는 베이즈 인자보다 신용구간이 모집단 혹은 모수에 관해 훨씬 풍부한 정보를 준다고 주장한다(Kruschke, 2013).

그런데 신용구간은 베이즈 인자보다 구하기가 어렵다. 베이즈 인자와 달리 사후분포가 구해져야 하기 때문이다. 사후분포가 특정됐다는 것은 사후분포의 퍼라미터들이 구해졌음을 함축한다. 신용구간은 사후분포에서, 주어진(혹은 선택한) 가능성(혹은 그럴듯함, plausibility: 빈도주의 통계에서 신뢰수준에 해당됨) 수준을 대표하는 값들의 범위이다. 주어진 가능성 수준은 모수가 그 범위 안에 들어갈 확률을 가리킨다.

예컨대 95% 가능성(plausibility)을 선택하면 95% 신용구간, 90% 가능성을 선택하면 90% 신용구간을 구한다. 신용구간은 사후분포를 구성하는 값들 중 가장 가능성이 높은(그럴듯한, plausible) 값들만 포함한다. 가능성이 높다는 말은 가장 높은 확률(혹은 확률밀도)을 갖는다는 의미이다. 예를 들어 90% 가능성이란 확률(혹은 확률밀도)가 확률이 높은 순으로 상위 90%에 해당되는 범위가 신용구간이다. 그리고 진짜 모수가 그 범위 안에 들어갈 확률은 90%이다.

신용구간을 좀 다르게 정의해 사용하기도 한다. 빈도주의 통계의 신뢰구간처럼 좌우 꼬리 부분이 동일 확률( equal probability) 를 갖게 하는 방법도 있다. 등꼬리 신용구간(equal-tailed credible interval)이다.

이 등꼬리 신용구간은 HDI에 비해 계산하기 쉽다는 장점을 가지고 있다. 그러나 좌우대칭의 단봉분포가 아닌 비대칭적 단봉분포나 쌍봉분포의 경우에는 신용구간을 가지고 한 분포에서 신뢰할만한 값들을 보여주겠다는 의도에 잘 맞지 않은 속성을 나타내는 약점이 있다(Kruschke, 2015).

신용구간이나 HDI는 먼저 사후분포를 특정해야 계산이 가능하기 때문에 컴퓨터 프로그램을 사용하지 않고는 추정이 거의 불가능하다. 예를 들어 우리나라에서 밤에 8시간 이상 자는 대학생들의 비율(θ)에 관심이 있다고 하자. 한양대학교로부터 27명의 학생을 무작위로 추출하여 물어보았더니 그 중 11명의 학생들이 밤에 8시간 이상 잔다고 응답했다. 이 확률변수는 다음과 같은 이항분포를 따른다.

θ에 대한 사전확률분포가 라면, 공액을 이용해서 사후분포를 구하면 다음과 같다.

이제 θ에 대한 90% 신용구간을 구해보자. 우리는 그것을 폐쇄 형식(closed form)으로 계산할 수 없다. Beta 분포에 대한 확률 계산은 아래와 같이 복잡한 적분을 포함하고 있기 때문이다.

그런데, Beta 함수의 확률밀도함수는 아래와 같으므로,

는 다음과 같은 함수이다.

대학생들의 야간 수면 시간에 관한 간단한 의문을 푸는데 이렇게 복잡한 함수를 계산해야 한다! 실질적으로 계산이 불가능한 것이다. 그래서 우리는 MCMC라는 방법을 가지고 신용구간을 근사적으로 추정한다(approximate). 소프트웨어를 사용하면 신용구간을 쉽게 구할 수 있다. 통계패키지인 STATA를 이용해서 추정한 θ의 90% 신용구간 HDI는 (0.249, 0.503)이다. 아래 그림은 STATA로 위 사례를 분석한 결과이다. 이제 MCMC를 소프트웨어로 구현할 시간이다.

참고 문헌

Kruschke, John K. 2013. “Bayesian Estimation Supersedes the Test.” Journal of Experimental Psychology, General, vol.142, no.2: 573-603.

——. 2015. Doing Bayesian Data Analysis. Academic Press.

삶에서 시간이란?

여행을 나가면 누구나 시간의 소중함을 느낀다. 여행 기간이 제한되어 있을 뿐 아니라 시간이 곧 비용이기 때문이다. 여행 시간을 변경하거나 확장하는 것이 누구에게나 쉽지 않지 않는가. 시간 밖에 없다고 여겨지는 은퇴자에게도 그것은 마찬가지이다.

우리는 누구나 지구 행성에 여행자로 왔다간다. 모든 여행이 그렇듯이 ‘지구 여행’, 즉, 우리의 삶도 시작이 있고 끝이 있다. 인간은 본질적으로 유한한 시간을 가진 여행자이다.   

일상 여행과 지구 여행(인생)은 공통점과 차이점을 가지고 있다.  두 여행의 공통점은 시간적으로 유한하고 여행의 끝이 다가오면 여행에 대한 아쉬움이 커진다는 사실일 것이다. 두 여행의 차이점은, 일상 여행에서는 여행자가 여행 중 내내 여행 전체를 시간적으로 실감하는 반면, 지구 여행에서 여행자는 거의 여행의 종착점에 이를 때까지 여행 전체를 시간적으로 체감하지 못한다는 사실일 것이다.

통상적으로 인간의 시간 체감의 범위는 며칠, 몇 주일, 길어봐야 1년을 넘지 못한다. 1년을 넘어가면 시간에 대한 분별이 희미해진다. 사람들은 1년과 2년, 1년과 5년, 1년과 100년, 심지어 1년과 무한대 사이의 차이를 선명하게 구분하지 못한다.

그러한 시간 인식의 한계 때문에 우리는 한 백년, 아니 영원히 살 것처럼 행동하고 있는 지도 모른다. 우리가 지구여행의 시간적 종착점을 알 수 있다면 무엇이 중요한지에 대한 우선순위가 바뀌고 세상에 대해 훨씬 너그러워질 지도 모른다. 사실 암 같은 질병으로 인해 의사로부터 남은 시간을 ‘선고’받은 사람들이 적지 않다. 그들의 생각과 행동이 일반 사람들과 다르지 않는가.

은퇴자가 가진 것은 시간 뿐이지만 그 시간이 많지는 않다. 그러나 대부분의 은퇴자는 자신에게 시간이라는 자산이 많이 남아 있지 않다는 사실을 인지하지 못하는 것 같다. 그들에게 시간이란 하릴없이 메꾸어야 하는 구덩이이다. 아침이 되면 그 구덩이는 다시 생겨나고 은퇴자는 매일 그 구덩이를 메꿔야 한다. 지구 여행이 끝나는 날까지 말이다.

그런데, 만약 우리가 오늘, 이 순간이 수많은 사람들이 가지고자 소망했던 축복이며 선물이라는 사실을 깨닫는다면, 여행의 끝에 다다르지 않더라도 우리는 지구 여행 전체를 조망하면서 살 수 있을 지도 모른다. 그렇게 되면 우리는 더 의미있고 가치있게 여생을 보내고자 할 것이다.

사실 시간에서는 길이보다 밀도가 중요하고, 양보다 질이 중요하다. 그런 점에서 시간은 객관적이기보다 주관적이다. 어떤 사람의 하루가 다른 사람의 1년만큼 가치가 있을 수 있으며, 오늘 하루가 지난 생애의 전부 혹은 남은 생애의 전부 만큼 가치가 있을 수 있다.

현재(present)라는 이 소중한 선물(present)을 어떻게 사용할 것인가. 은퇴자에게도 그것이 문제이다. 만약 시간에 대한 인식을 바꿀 수 있다면 그것이 구덩이를 메꾸는 문제가 아니라 새로운 여행을 설계하는 문제가 될 것이다. 얼마나 신나는 일인가.

시간에 대한 관념만 바꾸어도 은퇴자의 삶은 한층 풍요로워질 수 있다. (2020-10-08)

삶에서 집이란 공간은?

지난 달 사랑채를 완성하고 살림을 그곳으로 옭겨간 후에 안채는 온전한 작업 공간이 되었다. 필암문화원 간판을 달기는 했지만 팬데믹 때문에 아직 그것을 실체화하지 못하고 있으니 나만의 공간이라고 해도 과언이 아니다.

돌이켜 보면 고등학교를 졸업한 이후 마흔 둘에 교수직을 얻을 때까지 20년 이상 동안 나만의 공간을 가져본 적이 없었다. 얼마나 간절히 소망했던 환경이었던가. 그래서 주중에는 늦은 밤까지, 그리고 주말에도 연구실에 나와 있었다. 누구한테도 방해받지 않고 마음껏 연구하고 쉴 수 있는 공간을 마흔이 넘어서야 가질 수 있었으니 얼마나 좋았겠는가.

그러나 교수 연구실은 내 마음대로 꾸미거나 무엇이든 할 수 있는 공간은 아니었다. 눈에 보이지 않지만 여러가지 제약이 있었다. 예컨대 크게 음악을 들을 수 없고 복장도 맘대로 하고 있을 수도 없었다.

얘들이 많은 탓에 집은 컸지만 나만의 서재가 없었다. 그래서 나는 오랫동안 거실을 서재로 사용했다. 10여년 전 아이들이 미국으로 떠나고 나서야 비로소 집에 나만의 공간을 갖는 여유가 생겼다. 50대 중반이 되어서야 집에 ‘서재’라고 부를 만한 공간이 생긴 것이었다.

‘서재’도 온전히 자유로운 공간은 아니다. 집에 아내가 함께 있으니 음악을 크게 틀 수 없고 큰 소리를 지를 수도 없다. 강의 녹음이나 녹화도 자유롭지 않다. 그리고 아내의 눈치 때문에 마음껏 게으름을 피울 수도 없다.

그런데 지난 달부터 온전한 집 한 채가 생긴 것이었다. 태어나서 65년만에 내가 정말로 누구한테도 방해받지 않고 무엇이든 할 수 있는 공간이 주어졌다. 아무리 크게 음악을 틀어도, 아무리 게으름을 피워도, 또 아무리 밤늦게까지 연구를 해도 신경 쓸 일이 없다.

공간은 내게 자유와 책임을 동시에 가져왔다. 한 마디로 완전히 자율적인 삶을 안긴 것이다. 과연 나는 이 자율이라는 선물을 갖고 무엇을 할 것인가? 그것부터 자율적으로 결정해야 할 것이다.

공간이란 삶의 모습을 결정짓는 구조적 요인 중 하나임에 분명하다. 집은 공간 중 개인적인 수준의 영역이다. 마을이나 지역사회, 나아가 국가와 같이 공적인 수준의 영역도 존재한다. 사생활(privacy)이 존재하기 위해서는 개인적인 공간이 반드시 필요하다. 타인의 시선으로부터, 타인의 간섭으로부터 자유로운 공간 없이 온전한 사생활도 자율적인 삶도 존재할 수 없다. 집은 단순히 재생산을 위한 공간이 아니라 근본적으로 인간의 자유와 자율을 위한 최후의 버팀목이다.

그런데 우리 사회에서는 언제부터인가 집이 투자와 투기의 대상으로 전락했다. 집이 본원적 가치가 아닌 교환적 가치로만 인식되고 있는 것이다. 집이 자율적인 삶의 조건 대신 가치 증식의 수단으로 여겨지고 있다. 참으로 안타까운 현상이 아닐 수 없다. (2020-10-07).

삶에서 음식이란?

우리 집은 먹기 위해서 산다고 말할 정도로 먹는 것에 목숨을 걸지는 않지만 그래도 음식과 식사를 참으로 중시한다. 나의 부모님이 그랬고, 아내와 내가 그랬으며, 내 아이들이 그렇다. 아니 부모님보다는 내가, 나보다는 아이들이 더 그런 것 같다. 대충 먹는 경우가 흔치 않다.

요즘 나는 가급적 이러한 집안의 전통을 지켜가려고 노력한다. 식사 준비와 마무리가 주부와 같은 누군가만의 고통이 되지 않는 한 나는 그러한 전통이 좋다고 생각한다.

나는 의식주 중에서도 특히 ‘식’이 중요하다고 생각한다. 잘 사는 것이 부유하게 살거나 권력을 누리며 사는 것이 아니듯이 잘 먹는 것은 화려하고 값비싼 음식을 섭취함을 의미하지 않는다.

잘 먹으려면 몇 가지를 갖추어야 한다. 음식에 좋은 식자재를 사용해야 하고, 식단이 건강상의 요구에 잘 맞아야 하며 물론 음식의 맛도 있어야 한다. 그리고 음식은 적절한 시간에, 적절한 공간에서, 적절한 양을, 적절한 예법을 갖추고 먹어야 한다.

일생을 살아오면서 때로는 너무 가난해서 굶거나 겨우 허기를 면하면서 지내기도 했고, 때로는 너무 바빠서 식사를 소홀히 하는 경우도 적지 않았지만, 지금이라도 잘 먹으며 지내려 노력하고 있다.

다행히 시골에서 지내다보니 잘 먹고 지내기가 어렵지 않다. 계절에 맞는 좋은 식재료를 저렴하게 혹은 거의 돈들이지 않고 구할 수 있으며 식사를 즐길 수 있는 시간적 여유도 있다.

반찬 가짓수도 적고 식사 양도 많지 않지만 꼼꼼하게 준비된 음식을 프로토콜에 맞추어 감사한 마음으로 먹을 수 있으면 행복하다. 게다가 식후에 커피나 차를 정성스럽게 끓여서 디저트와 함께 먹을 수 있으면 금상첨화이다. 이러한 일상을 얻기 위해 우리는 열심히 일하며 일생을 보내는 것이 아닌가.

때로는 우리가 삶이 무엇인지, 무엇을 위해 사는 건 지, 무엇이 중요한 지를 잊고 살아가는 것이 아닐까 하는 생각이 들곤 한다. 어쩌면 일상의 작은 행복, 그것이야말로 수많은 사람들이 갖고자 했고, 가지려고 하고, 또 가졌으면 하고 소망하는 것이 아닐까. 음식과 식사는 바로 그 일상을 채우는 가장 중요한 부분일 것이다. (2020-10-05)

일급의 학자가 되는 비결

공부하는 사람은 사는 게 그저 단순해야 한다. 학자는 머리로 일하는 사람이지 몸으로 일하는 사람이 아니기 때문이다.

인간의 정신력에는 한계가 있다. 집중하지 않으면 성취할 수 있는 게 많지 않다. 생각을 깊이 있게 전개하려면 오랜 시간 성찰 대상에 정신을 집중해야 한다. 체계적이고 깊이 있는 생각없이 학문적 성취는 애시당초 불가능하다.

조각난 사고작용으로는 배움과 깨달음을 얻을 수 없다. 공사다망할수록 정신 활동은 파편화된다. 마음이 어지러운 사람은 결코 높은 학문적 경지에 도달할 수 없다.

젊은 날 이 원리를 깨달았지만 나는 그것을 제대로 실천에 옮기지 못했다. 온갖 세상 유혹을 이기지 못했기 때문이다.

학자는, 마음은 어린이 같고 생활은 수도승과 같아야 한다. 맑은 마음으로 세상을 바라보고 주어진 화두에 집중할 수 있어야 한다는 말이다.  한 마디로 simple  life. 거기에 유능한 학자가 되는 비결이 있다.

나는 이제야 그것이 가능하게 되었다. 은퇴하고 60대 중반이 되어서야 말이다.  

학자는 지혜를 사랑하는 사람이다. Philosopher(철학자)이다. Philosopher는 그리스어로 philo(love)와 sophia(wisdom)이 결합되어 생성된 말이다. 학문이 아직 분화하지 못했던 고대 그리스에서는 철학자가 곧 학자였다.

지금도 서양 학문에는 고대 그리스의 영향이 남아있다. 나는 사회학 박사이지만 공식 학위명은  Ph.D. (Doctor of Philosophy) in Sociology이다.

“돈을 사랑하는 사람”들 눈에는 “지혜를 사랑하는 사람”이 박물관에나 가 있어야 할 존재로 보이겠지만, 오늘날에도 학자는 여전히 지혜를 사랑하는 사람, 다시 말해 공부를 좋아하는 사람이어야 한다.

머리에 흰 서리가 내린 지 오랜 지금에야 “지혜를 사랑하는 사람”의 대열에 합류했다는 사실이 못내 아쉽지만, 어쩌겠는가. 지금이라도 학자의 흉내를 내면서 여생을 보내야 이 행성을 떠나면서 미련이 덜 남을 것 같다. (2020-09-29)

DIKW 모형

데이터, 정보, 지식 사이의 관계를 이해하는 데 있어 아마도 가장 오래, 가장 널리 가이드 역할을 해온 개념적 틀은 DIKW 모형이다. DIKW는 Data(데이터), Information(정보), Knowledge(지식), Wisdom(지혜)의 머릿글자로 구성된 이름이다. 이 모형에 따르면, 데이터사물이나 사건에 대한 묘사(description)이며, 가공되지 않은 상태의 사실(facts)이다. 그리고 특정한 목적을 위해 데이터가 처리되면(혹은 추상되면) 그 목적에 유용한 정보가 된다. 나아가 정보가 체계화되면 지식이 되며, 지식이 고도로 추상화되면 지혜가 된다.

     

데이터-정보-지식-지혜는 위 그림과 같은  피라미드 구조를 가졌다고 해서 DIKW 피라미드 혹은 지식 피라미드라고 불리며, 데이터에서 지혜로 올라갈수록 가치가 올라간다고 해서 가치 위계 모형(value hierarchy model) 혹은 가치사슬모형(value chain model)이라고도 불린다. 이 모형은 데이터, 정보, 지식 사이의 관계에 대한 개괄적인 모습을 보여주는데 자주 사용되었다. 

위 그림에서처럼 이 모형은 데이터보다는 정보의 가치가 높고, 정보보다는 지식, 그리고 지식보다는 지혜의 가치가 높으며, 데이터에서 지혜로 올라갈수록 의미(meaning)도 크다고 규정한다. 

이 모형은 MIS(경영정보학), 컴퓨터과학, 문헌정보학, 교육학 등 여러 학문 분야에서 폭넓게 이용된다. 네 가지 요소 중 그 지위가 애매한 ‘지혜’를 제쳐 놓고 본다면, 이 피라미드 모형은 나름대로 유용하다. 그것은 우리에게, 지식, 정보, 데이터 중 어떤 것을 다루더라도 다른 두 가지와의 관계를 고려해야 하며, 앎(knowing)에 관한 어떤 모형도 이 세 가지 사이의 관계에 대해 명쾌한 해석 혹은 입장을 포함하고 있어야 함을 알려주고 있다.

그러나, 이 모형이 지니는 가치는 그 수준에서 그치는 것 같다.  무엇보다 데이터, 정보, 지식 사이의 관계, 특히 데이터와 정보, 정보와 지식 사이의 관계가 애매하기 때문이다. 데이터가 “처리되어” 혹은 “추상되어” 정보가 된다고 하지만, 데이터의 ‘처리’ 혹은 ‘추상’이 정확히 어떤 원리에 따라서 어떻게 이루어지는가가 불분명하다.

더구나 빅데이터의 시대에 있어 정말로 정보나 지식이 데이터보다 가치가 높은 지도 의문이다.  데이터 마이닝이나 데이터과학을 통해서 빅데이터는 특정한 정보나 지식보다 더 큰 가치 혹은 더 다양한 가치를 창출해 낼 수 있다. 즉, 가치 생성의 측면에서 데이터가 정보나 지식보다 더 큰 잠재성을 가질 수도 있다. 때문에 데이터에서 추상화된 정보나 지식보다 데이터 자체가 더 큰 값에 거래되곤 한다. (2020-01-23)

어떤 사회학자의 죽음

새벽에 눈을 뜨고 갑자기 한신갑의 근황이 궁금했다. 정말 뜬금없는 일이었다. 안지는 오래되었지만 단 한번도 친근한 관계가 아니었기 때문이다. 내가 그를 마지막 본 것은 몇년 전 공항 대합실에서 둘째의 귀국을 기다릴 때였다. 그는  악수조차 건네지 않고 알 수 없는 미소를 지으며 사라졌다. 우리는 그 정도로 대면대면한 사이였다. 그런데 꼭두 새벽에 그의 안부가 궁금해 진 것이다.

네이버에서 검색하니 “2019년 9월 12일자로 한신갑(서울대교수)씨 별세”라는 부고 기사가 떴다. 그 부고를 믿을 수 없어 구글에서도 검색을 했다. 서울대 사회학과 홈페이지에 “고 한신갑 교수”라고 뜨는 걸 보니 그가 세상을 떠난 게 분명했다. 나보다 여섯 살이나 아래인데….그의 사인이 궁금했지만 어디서도 찾을 수 없었다.

1986년 미국 South Carolina 주 Columbia에 있는 USC에 유학을 가니 사회학과에 나보다 1년 먼저 유학을 와 있었다. 그와 나는 그곳의 석사과정에 1년을 함께 재학했다. 함께 강의를 수강한 적은 없고 유학생들이 모여서 식사를 할 때 자리를 같이 하는 정도였다. 이유를 알 수 없었지만 우리는 거리가 멀었다.

나중에 그가 코넬대 교수로 가 있다가 귀국해 서울대학교에 부임했다는 소식을 들었다. 그 후 언젠가 학회 세미나에서 한 번 같은 발표장에 자리한 적이 있었지만, 악수를 하고 몇 마디 인삿말을 주고받은 다음 바로 헤어졌다.

그런데 몇 년 전 그에 관한 뉴스가 나오기 시작했다. 대학원생 성희롱, 갑질, 연구비 횡령에 관한 기사였다. 서울대 사회학과 대학원생들이 단체로 들고 일어나서 그의 해임을 촉구한다는 것이었다.

한번은 대학원생들이 그의 잘못에 대해 상세하게 적은 글을 읽었다. 정확히 기억할 수는 없지만 적어도 스무 가지가 넘는 죄상이 깨알 같이 적혀 있었다. 그가 학생들에게 정말 못되게 굴었구나 하는 생각이 들었다. 과거 함께 대학원에 다닐 때를 떠올려 보니 놀라운 일은 아니었다. 그래도 20여 년의 세월이 못된 성질을 바꿀 수도 있었을텐데하는 안타까움도 들었다.

그러나 나는 대자보에 학생들이 써서 올린 그의 죄상에 대해 절반은 공감할 수 없었다. 학생들의 비난이 많이 지나치다는 느낌이 들었다. 그의 성격이 좀 못되기는 하지만 그가 그 정도로 형편없는 인간이라고 생각되지는 않았기 때문이다.

그는 대학으로부터 정직 3개월의 징계를 받았다. 그리고 그가 복직하려고 할 때 학생들은 물론이고 동료 교수들마저 반대 성명을 발표했다는 소식을 들었다. 그 때 나는 나 같으면 그냥 학교를 그만 둘텐데 하는 생각을 했다.

그리고 오늘 아침 때늦게 그의 부고 기사를 본 것이었다. 사망 원인은 알 수 없지만 자살이거나 스트레스로 인한 돌연사가 아닐까 추측된다. 그 정도의 스트레스에 시달린다면 나 같아도 죽었을 것이다.

그는 대학원에서 수리사회학을 공부하고 사회연결망분석의 전문가가 되었다. 사회연결망분석은 당시 똘똘한 미국 사회학 대학원생들에게 인기 있는 분야였다. (나도 잠시 그 분야를 탐색하다가 지나치게 비이론적이고 데이터 의존적이라서 손을 뗐다. 전혀 흥미가 나지 않았다.) 지난 10여 년 사이 빅데이터 시대가 되고나고 그 분야는 온갖 학문 전공에서 크게 부상하였다. 그는 자신의 시대가 왔다고 도래했다고 착각했을 수도 있다.

한 사람이 일생 동안 이룰 수 있는 일은 별로 많지 않은 것 같다. 그가 다소 요란스럽게 보낸 학자로서의 일생 동안 성취한 것이 무엇인가. 긴 인류 역사에서 한 톨의 모래만큼이나 될까. 기껏해야 한번의 파도만으로도 흔적 없이 쓸려가버리는 모래성에 불과할 것이다.

나라고 다를까? 누구라고 다를까? 어쩌면 인간의 삶이 본질적으로 그토록 허무한 것인지도 모른다.

사이가 가깝지는 않았지만 늦게나마 그의 명복을 빈다. (2019-12-16)

지능이라는 이름의 게임(7): 지능기계 설계자의 해석

앞 포스팅에서 소개한 이대열 교수의 저서가 진화생물학과 행동심리학의 관점에서 지능에 접근한 사례이라면, 이 포스팅에서 소개할 제프 호킨스(Jeff Hawkins)의 저서 <On Intelligence>(2004)는 컴퓨터과학 배경의 소프트웨어-하드웨어 개발자가 두뇌와 지능 연구자들에게 던지는 대담한 도전장이다.

Image result for on intelligence Image result for 생각하는 뇌 생각하는 기계

Hawkins가 지능과 두뇌에 관심을 갖기 시작할 때 던졌던 질문은 아주 명쾌하다. 지능(intelligence)이 무엇인가 이다. 이 의문은 인간의 두뇌가 근본적으로 어떤 점에서 지능적인가라는 질문과 바로 이어진다. 인간의 두뇌는 지상에서 가장 진화된 지능을 지니고 있기 때문이다. 그는 진정으로 지능적인 기계를 만들려면 먼저 인간의 두뇌를 제대로 이해해야 한다고 믿었다. 그는 기존의 연구들에서 자신의 의문에 대한 시원한 답을 찾을 수 없었고, 그래서 스스로 답을 제시하게 되었다. <On Intelligence>에는 Hawkins의 해답이 담겨 있다.

지능을 탐구하면서 그는 지금까지의 컴퓨터과학이 인간 지능(human intelligence)을 모사하는데 실패한 이유가 인간의 지능과 두뇌를 이해하지 못했기 때문이라는 결론에 도달했다. 그에 의하면, 인간의 두뇌는, 투입(input)이 들어가면 산출(ouput)을 내놓는 논리 기계나 정보처리 시스템이 아니며, 지능은, 튜링 테스트(Turing test)처럼 행동(behavior)을 측정하는 방식으로는 결코 이해될 수 없다. 지능이 무엇인지는, 간접적이거나 우회적인 방식이 아니라 두뇌의 내부 작용을 가지고 직접 규정해야 한다는 것이다.

Hawkins에 의하면, 인간 두뇌는 몇 가지 점에서 컴퓨터와 크게 다르다. 첫째, 두뇌는  S/WH/W의 구분이 없다. 지능을 주로 담당하는 대뇌 신피질은 신경세포와 시냅스로 구성된 네트워크인데, 그것은 전기-화학적 신호에 의해 작동하는 구조이지 그것들을 제어하는 별도의 S/W(혹은 그것과 유사한 무엇)가 존재하지 않는다. 

둘째, 컴퓨터와 달리 두뇌는 유전적 영향을 받기도 하지만 태생 후 성인이 될 때까지 발달하고  성인이 된 후에도 외부 자극과 경험에 의해 변화된다. 발달 단계로 보면 인간의 두뇌는 두 살 무렵에 뉴런-시냅스 조합이 폭발적으로 늘어나고, 그 다음 몇 년 동안 불필요한 뉴런-시냅스 조합은 점차 제거되며, 청소년기에 다시 한번 뉴런-시냅스 조합이 폭발적으로 증가한 후 성인이 될 때까지 불필요한 뉴런-시냅스 조합의 제거가 이루어지고 25-6세경 안정 단계에 도달한다. 그러나 성인이 된 후에도 뉴런-시냅스 조합은 계속 변화된다. 두뇌의 구조가 변하는 현상을 신경(혹은 두뇌) 가소성(neuroplasticity)이라고 부른다. Hawkins는 이러한 인식을 수용한다. 

셋째, 컴퓨터와 달리 두뇌는 대단히 유연하다. 두뇌의 특정 영역이 특정 기능만을 담당하지 않는다. 때문에 만약 어떤 부위가 손상을 받으면 그 부위가 맡던 기능을 다른 부위가 대신 수행하곤 한다. 이는 컴퓨터에서 상상하기 어려운 현상이다.  

이러한 차이를 인정하면서 Hawkins는 지능과 두뇌의 관계에 대해 기억예측 모형(memory-prediction model)이라는 가설을 제시한다. 그 모형을 요약하면 다음과 같다.

Image result for memory prediction model hawkins

지능은 인간의 두뇌에서 일어나는 정신적인 작용이다. 외부로부터 감각기관을 통해서 경험하는 자극(감각 정보)이 두뇌에 전달되면 신피질에서 그것은 전기-화학 신호로 전환되고 뉴런과 시냅스가 연결된 조합이 생성된다. 신피질에는 그렇게 해서 생성된 수많은 조합이 존재하며, 그것이 기억(memory)이다

가장 추상적인 수준에서 기억은 공간적시간적 패턴(spatial-temporal patterns)인데, 그것은 입력되는 감각 정보의 유형과 관계없이 항상 범주(category)와 순서(sequence)라는 요소로만 구성되어 있기 때문에 Hawkins는 그것을 불변표상(invariant representations)이라고 부른다(아래 그림 참조).

그에 의하면인간 두뇌는 ‘논리 기계라기보다는 ‘기억 기계이다두뇌는 끊임없이 분류하여 기억하고기억을 복원해서 예측/확인하고비교/판단한다신피질은 여섯 층(layers)의 구조를 지니고 있는데자주 반복적으로 입력되는 정보의 불변표상은 낮은 층으로 내려보내 외부 자극에 신속하게 반응하게 하고낯선 정보들은 상부 층으로 보내서 불변표상을 생성하며최 상위 층(Layer I)에서도 파악되지 않은 정보는 해마(hippocampus)로 보내 기억한다. 층2나 층3도 부분적으로 그렇지만 층1은 여러 영역으로부터 받은 정보를 결합(association)하는 역할을 수행한다(아래 그림 참조). 

Hawkins는, 신피질이 계층적 구조를 지닌 이유는 바로 현실세계가 그러한 계층적 구조를 지니고 있기 때문이라고 지적한다. 예컨대 문어(written language)를 보면, 글자가 모여서 음절이 되고, 음절이 모여 단어가 되며, 단어가 모여서 문장이 된다. 또한 세상의 모든 객체(object)는 작은 객체들의 집합이며, 대부분의 객체들은 보다 큰 객체들의 일부이다. 신피질의 계층 구조는 이러한 현실세계의 계층구조에 조응하고 있다는 것이다.

일단 기억들이 생성된 후에는, 감각 기관을 통해서 자극이 전달되면 그에 관련된다고 추정되는 불변표상이 호출되고, 그것을 이용해서 시간적으로 뒤따라 오는 정보를 예상한다(아래 그림 참조). 만약 새로 들어온 감각 정보가 불변표상을 가지고 예측한 모습과 일치하면 기존 뉴런시냅스의 조합이 유지되고, 만약 불일치하는 부분이 나타나면 그에 대해 새로운 판단이 내릴 수 있도록 조치한다. 만약 그러한 불일치가 반복되면 기존의 뉴런시냅스 조합이 갱신된다. 그러한 분류, 패턴 생성, 기억, 예측, 강화, 갱신 등의 과정이 바로 학습이며, 과거(기억)에 대한 유추를 통하여 미래를 예측하는 두뇌의 능력이 바로 지능이다.

진화적으로 보면, 신피질이 확대되고, 언어를 사용함으로써 인간의 지능은 다른 포유동물에 비해 획기적으로 향상되었으며, 고도의 상상, 창조, 논리적 추론 등이 가능해졌다. Hawkins에 의하면, 그럼에도 불구하고 인간 지능은 기억-예측 모형을 벗어나지 않는다. 

Image result for memory prediction model hawkins

Hawkins는 단순히 두뇌-지능을 연구만 할 뿐 아니라 직접 Numenta 라는 기업을 창업해서 연구와 기술 개발을 결합하고 있으며, 실제로 HTM (Hierarchical Temporal Memory)이라는 테크놀로지를 개발하였다(위 그림 참조). 그는 HTM을 이용하여 아직 상업화하지는 않았지만 여러 분야의 이상 탐지(anomaly detection)에 활용될 수 있는 애플리케이션들을 내놓고 있다.  (윤영민, 2018-02-25)