조건부 확률, 곱셈법칙, 베이즈 정리(4)

(예제 3) 사십 대 여성이 정기 건강 검진의 일환으로 유방 엑스레이를 찍었다. 일주일 뒤 그녀는 유방암 검사 결과가 양성으로 나왔다는 통보를 받았다. 유방암에 관한 가족력도 없고 또 징후도 없는 그녀가 진짜로 유방암에 걸렸을 확률은 얼마일까? 

미국에서 사십 대 여성 1만명 가운데 대략 40명이 유방암을 가지고 있다(유방암 발병 확률은 40/10,000이다). 그리고 유방암 환자가 유방 엑스레이 검사에서 양성 반응이 나올 확률은 80%이다. 그러면 그 40명 가운데 32명이 양성 판정을 받는다(그 확률은 32/40이다). 또한 유방 엑스레이 검사에서 양성 반응이 나올 확률은 10%이다(그 확률은 1,000/10,000이다).

(풀이)

사건의 정의: B = 유방암 발병, P = 유방암 엑스레이 양성 결과

주변 확률:

조건부 확률: 

문제는  로 표시할 수 있다.

식 (1)의 우변에 있는 확률들의 값이 모두 있으므로 식 (1)에 대입한다.

이 결과를 말로 풀어 보면, 유방암 엑스레이 검사 결과가 양성이 나온 40대 여성이 실제로 유방암에 걸렸을 확률은 0.032, 즉, 3.2%밖에 되지 않는다.

 

(예제 4) 이메일의 스팸을 걸러내는 소프트웨어에는 베이즈 이론이 적용된다. 영어로 된 스팸메일에서 가장 많이 나타나는 단어가 shipping!이다. 스팸 메일 중 shipping!을 포함하는 메일의 비율은 0.051이고, 스팸이 아닌 메일에서 shipping!을 포함하는 메일의 비율은 0.0015이다. 그리고 많은 메일 중에서 10%가 스팸 메일이다. 만일 메일이 shipping!을 포함하고 있다면 스팸일 확률은? 만일 메일이 shipping!을 포함하고 있음에도 불구하고 스팸이 아닐 확률은? 만일 메일이 shipping!을 포함하고 있다면 스팸이라고 판명해야할까?

(풀이)

사건의 정의: Shipping = 메일에 shipping!이라는 단어가 포함됨, Spam = 스팸 메일

이 문제를 푸는 데 있어 첫번째 관문은, 여기서 “스팸 메일 중 shipping!을 포함하는 메일의 비율”이라는 표현을 확률적으로 정확히 번역해 내는 일이다. “그것은 “어떤 메일이 스팸일 때, 그 메일이 shipping!을 포함할 확률”로 번역된다. 아래와 같은 조건부 확률인 것이다.

조건부 확률: 

주변확률: 

원래의 문제는 다음과 같이 표시될 수 있다.

문제 풀이의 두 번째 관건은, 분모가 되는 shipping의 주변확률을 구하는 것이다. 주변확률은 관련된 결합확률들의 합이다. P(shipping)과 관련된 결합확률은 아래처럼 두 가지이다.

우변의 결합확률 각각을 곱셈법칙을  이용해서 주변확률과 조건부 확률의 곱으로 바꾼다.

이제 주변확률 을 구할 준비가 되었다.

위 식 (1)의 좌변에 해당 확률 값을 대입한다.

이 결과를 말로 풀어보면, 어떤 메일에 shipping!이라는 단어가 들어 있을 때 그 메일이 스팸일 확률은 0.7907이고, 스팸이 아닐 확률은 0.2093이다. 따라서 만약 어떤 메일에 shipping!이라는 단어가 들어 있다면 스팸이라고 분류하는 것이 좋을 듯하다. 그런 메일 중 약 80%가 스팸이기 때문이다. (윤영민, 2018-05-25)

조건부 확률, 곱셈법칙, 베이즈 정리(3)

(예제 2) 서로 다른 두 납품업체(공급자 1과 공급자 2)로부터 원자재를 공급받는 제조회사가 있다. 현재 공급자 1로부터 65%의 원자재를 구매하고, 공급자 2로부터는 35%를 구매한다. 한편 그 동안 두 업체로부터 납품 받은 원자재의 품질은 아래와 같다.

 좋은 품질 비율(%)나쁜 품질 비율(%)
공급자 1982
공급자 2955

그런데, 제품 생산 과정에서 어떤 원자재가 불량으로 나타났다. 그 원자재가 공급자 1로부터 왔을 확률은 얼마이고, 공급자 2로부터 왔을 확률은 얼마인가?

(풀이)

사건의 정의: A1 = 공급자 1로부터 납품 받음, A2 = 공급자 2로부터 납품 받음, B = 나쁜 품질의 원자재, G = 좋은 품질의 원자재

이 문제는 데이터(정보)가 주변확률과 조건 사건의 조건부 확률(즉, 우도)로 제한되어 있기 때문에 결합확률표와 조건부 확률 공식을 사용하지 못하고 베이즈 정리를 이용해서 풀어야 한다.

이 문제 풀이의 첫 번째 관건은  표에 있는 데이터를 어떻게 해석할 것인가이다. 예컨대 공급자 1이 좋은 품질의 원자재를 납품할 확률은 98%이다. 이 진술은, 공급자가  1일 때(조건), 좋은 품질의 원자재일 확률(조건부 확률)이 0.98임을 말한다. [공급자가 1이면서 좋은 품질의 원자재를 납품할 확률(즉, 결합확률)을 의미하는 것이 아님에 유의. 실제로 결합확률이 그렇게 높이 나올 가능성은 거의 없음. 결합확률은 주변확률의 곱이기 때문이다.] 즉,

이 문제 풀이의 두 번째 관건은 주변확률, 를 구할 수 있느냐이다. 사실 베이즈 응용 문제에서, 분모에 들어가는 조건 사건의 주변확률을 구하는 것이 자주 풀이의 관건이 되곤 한다.

문제를 베이즈 정리 형식으로 표현해 보자. 어떤 원자재가 불량(나쁜 품질)일 때, 그 원자재가 공급자 1로부터 왔을 확률은 다음과 같이 표시할 수 있다.

우변에서 우리는, 임을 알고 있으니,  분모에 있는 B의 주변 확률을 구하면 된다. 주변 확률은 해당되는 결합확률을 모두 더한 값이다. 즉,

이다.

그런데 곱셈법칙에 의하면,

이 값을 식 (2)에 대입하면,

우리는 식 (2)의 우변에 확률값을 모두 알고 있다. 그 값들을 대입해서 를 구하자.

다시 식 (1)로 돌아가서 확률값들을 대입한다.

즉, 원자재가 불량일 때, 그것이 공급자 1로부터 왔을 확률은 0.426이다. 그렇다면 공급자 2로부터 왔을 확률은 1-0.426 = 0.574가 될 것이다. (윤영민, 2018-05-25)

조건부 확률, 곱셈법칙, 베이즈 정리(2)

(예제 1) 다음은 미국에 있는 어떤 도시의 경찰관들이 2년 동안 승진한 경험을 남녀 비율로 나타낸 자료이다.

 남자여자
승진28836324
승진 탈락672204876
9602401,200

1. 임의로 뽑힌 어떤 경찰관이 여성이다. 그가 승진할 확률은? 만약 그가 남성이라면 승진할 확률은?

2. 경찰관의 성별이 경찰관의 승진에 영향을 미친다고 생각되는가? 근거를 제시하시오.

(풀이)

사건의 정의: 여성 = F, 남성 = M, 승진 = P,  승진탈락 = N

이 문제의 경우 확률을 추정하는 데 필요한 데이터가 풍부하다. 때문에 조건부 확률 정리를 이용하여 문제를 풀 수도 있고, 베이즈 정리를 이용하여 문제를 풀 수도 있다. 두 가지 방법을 이용해서 풀고 결과를 비교해 보자.

먼저 주어진 데이터를 가지고 결합확률표를 구해 놓으면 효율적으로 문제를 풀 수 있다. 각 칸의 빈도를 경찰관 총수인 1,200으로 나누어 주면 다음과 같은 결합확률표를 얻는다.

 남자여자주변 확률
승진0.240.030.27
승진 탈락0.560.170.73
주변 확률0.800.201.00

결합확률

주변확률

이제 이 정보를 가지고 문제를 푸는 데 필요한 조건부 확률을 구할 수 있다.

1. 어떤 경찰관이 여성일 때 승진할 확률, 남성일 때 승진할 확률은 각각 아래와 같이 계산된다.

이 문제를 베이즈 정리를 이용해서 풀면 다음과 같다.

여기서 분자에 있는 를 모르기 때문에 조건부 확률 정리를 이용해서 그것을 먼저 계산한다.

이제 에 관해 풀 수 있다. (남성일 경우도 동일한 방법으로 계산할 수 있음)

(1)과 (2)를 보면 0.15로 같은 값임을 확인할 수 있다. 조건부 확률로 계산하면 간단한 것을, 베이즈 정리로 풀었더니 복잡하기만 하다. 만약 결합확률표를 구할 수 있으면, 이런 문제는 조건부 확률 공식만으로도 충분히 풀 수 있다. 그러나 만약 결합확률을 모르고 조건 사건의 조건부 확률[이것을 공산 혹은 우도(likelihood)라고 함]과 주변 확률을 아는 경우에는 베이즈 정리를 이용해서 계산한다.

2. 남성일 때 승진할 확률은 0.3이고, 여성일 때 승진할 확률은 0.15이니, 남성의 승진확률이 여성의 승진확률의 두 배이다. 경찰관의 성별이 승진에 영향을 주는 것으로 판단된다. 이 결론을 독립사건의 정리를 이용해서 도출할 수도 있다.

만약 경찰관의 성별이 승진에 영향을 미치지 않는다면, 승진의 주변확률(사전확률), 이 승진의 조건부 확률(사후확률),  혹은 과 같아야 한다. 즉,

그런데 곱셈법칙에 의하면,

여기서 이므로,

이다.

그리고 당연히 일 것이다.

두 사건이 상호 독립적일 때(mutually independent), 두 사건의 결합확률은 두 사건의 주변확률을 곱한 값이다. 경찰관 승진 자료를 가지고, 성별과 승진이 관련이 없다는 가정 아래 가상적인 결합확률표를 만들면 다음과 같다.

 남성여성주변확률
승진0.22(=0.8*0.27)0.05(=0.2*0.27)0.27
승진탈락0.58(=0.8*0.73)0.15(=0.2*0.73)0.73
주변확률0.800.201.00

표 2와 표 3에서 의 값을 비교해 보면, 표 2의 값은 0.24이고, 표 3의 값은 0.22이다. 실제로 남자이면서 승진한 결합확률의 값이 성별과 승진이 상호 독립적이라는 가정 아래 도출한 결합확률의 값보다 크다. 표 2와 표 3에서 의 값을 비교해 보면, 표 2의 값은 0.03이고, 표 3의 값은 0.05이다. 즉, 실제로 남자이면서 승진한 결합확률의 값이 성별과 승진이 상호 독립적이라는 가정 아래 도출한 결합확률의 값보다 작다.

남성의 승진 확률은, 성차별이 없다는 가정 아래 예측된 승진 확률보다 높은 반면, 여성의 승진 확률은, 성차별이 없다는 가정 아래 예측된 승진 확률보다 낮다. 따라서 데이터는 경찰관의 승진에 성차별이 존재함을 시사하고 있다고 결론지을 수 있다. (윤영민, 2018-05-25)

조건부 확률, 곱셈법칙, 베이즈 정리(1)

상호 관련된(혹은 관련된 것으로 추정되는) 두 사건이 있을 때, 그 중 하나의 사건(사건 A라고 하자)이 발생하면 다른 하나의 사건(사건 B라고 하자)이 발생할 확률에 대해 이전(사건 A가 발생하기 전)보다 좀 더 잘 예측할 수 있을 것이다. 그러한 예측을 수학적으로 가능하게 해주는 지식이 조건부 확률, 곱셈법칙 그리고 베이즈 정리(Bayes’ Theorem)이다. 그 세 가지 법칙(혹은 정리)은 논리적으로 깊이 연관되어 있다.

다음과 같이 사건을 정의한다.

A: 사건 A의 발생, B: 사건 B의 발생

(조건부 확률) 사건 A의 발생 확률이 사건 B의 발생에 의해 영향을 받는다면, 두 사건의 발생확률 사이의 관계를 다음과 같이 나타낼 수 있을 것이다.

말로 풀어보면, 사건 B가 발생했을 때 사건 A가 발생할 확률–사건 A의 조건부 확률–은 사건 A와 사건 B가 동시에 발생할 확률–사건 A 와 사건 B의 결합확률–을 사건 B의 발생 확률–조건이 되는 사건 B의 주변확률–로 나눈 값이다.

(곱셈 법칙) 정리(1)에서 양변에 를 곱하고, 좌변과 우변을 이항하면 다음 결과를 얻는다.

말로 풀어보면, 사건 A와 사건 B가 동시에 발생할 확률–사건 A와 사건 B의 결합 확률–은 조건이 되는 사건 B가 발생할 확률과 사건 A의 조건부 확률의 곱이다.

(베이즈 정리) 확률의 교환법칙에 따르면,

그리고 우변에 곱셈법칙을 적용하면,

결합확률을 조건부 확률과 조건의 주변확률로 표현하기 위해 식(2)와 식(4)를 식(3)에 대입하면,

이 식의 양변을 로 나누면,

이 식이 베이즈 정리(Bayes’ Theorem)이다. 말로 표현하면, 사건 A의 조건부 확률은 사건 A의 발생 확률에 사건 B의 조건부 확률을 곱한 값을 조건 사건 B의 주변확률로 나눈 값이다.

이 정리는, 조건이 되는 사건 B의 발생을 기준으로 다르게 해석될 수 있다. 즉, 는 사전 확률(prior probability 혹은 간단히 prior)이며, 는 사후 확률(posterior probability 혹은 간단히 posterior)이다. 그리고 와 는 예측을 위한 데이터(혹은 정보)이다.

베이즈 정리는, 어떤 사건(여기서는 사건 A)과 관련된 사건(여기서는 사건 B)에 관한 데이터(혹은 정보)를 얻었을 때 그 사건(사건 A)에 대한 향상된 예측을 할 수 있게 해준다. 그 과정은  로 표현할 수 있다.

논의가 추상적이니 몇 개의 응용 사례를 가지고 조건부 확률, 곱셈 법칙, 베이즈 정리를 보다 구체적으로 살펴보자. (윤영민, 2018-05-25)

손, 펜, 그리고 글

너무 오래 컴퓨터로 글을 쓰다보니 손글을 잃어버렸다.  그 변화는 단지 필기구만 달라진 것이 아니라 생각을 정리하고 표현하는 방식이 달라진 것이었다.

돌이켜보면 예전에는 깊이 생각한 후에 글을 썼다. 평소에 메모는 해두었지만 그것을 엮어서 글로 만드는 것은 전혀 다른 작업이었다. 더 이상 크게 손질할 필요가 없을 정도로 생각이 잘 정리된 후에 원고지나 노트에 글을 적기 시작했다.

그런데 워드로 글을 쓰면서부터는 키보드를 두드리며 비로소 본격적으로 생각하고 생각을 정리한다.  그리고 긴 편집 시간을 갖는다.

이유는 알 수 없지만(머지않아 커리어를 마무리해야 한다는 부담이 작용했는지 모르겠다) 최근 문득 문득 다시 손으로 글을 쓰고싶다는 충동이 일곤 했다. 그러다 엊그제는 맘을 크게 먹고 수성펜 세 자루를 샀다.

그런데, 어제 우연치고는 상당히 놀라운 일이 벌어졌다. 오래 전 석사 학위 지도 학생이었던 제자로부터 몽블랑 펜을 선물받은 것이었다. 그것은 25년이 넘는 커리어에서 한번도 가져보지 못한, 기품있는 필기구였다.

과연 과분한 선물을 받아야 하는가를 고민하다가 그 제자에게 전화를 걸었다. 오랜 전부터 내게 만년필을 선물하고 싶었다는 그에게 차마 돌려준다는 말을 할 수 없었다.

그래서 약속했다. 앞으로 그 펜으로 글을 쓰겠노라고.

행복한 우연이다. (윤영민, 2018-05-24)

Marshall McLuhan과의 가상적 대화(4)

만리거사: 이제 선생님과의 대화가 종착역에 가까워졌습니다. 선생님과 저와의 대화에서 다른 분들은 무엇을 느꼈는지 잘 모르겠습니다만, 저는 큰 깨달음을 얻었습니다. 선생님과 제가 공감한 점은 새로운 시대가 대화의 시대, 참여의 시대라는 인식입니다. 선생님을 그것을 쿨미디어의 시대라고 규정하셨고, 저는 인간메시지의 시대라고 규정하였습니다. 다시 말해, 선생님은 참여를 강조하였고, 저는 의미를 강조했습니다. 그러나, 참여와 의미의 공통점이 바로 인간이라는 점에서 선생님과 제가 도달한 지점이 같다고 봅니다.

많은 사람들은 social media의 네트워크성에 주목합니다. 그래서 SNS라는 용어가 뜨고, 인맥이라는 말이 유행하고 있습니다. 그러나 네트워크는 손가락일 뿐입니다. 정작 그 손가락이 가리키는 것은 인간과 의미입니다. 네트워크를 쫓는 것은 잘해야 꽁무니를 쫓는 일이고 대개는 헛다리를 짚는 일입니다. 네트워킹은 수단일 뿐이지요.

아무튼 이 점이 이번 선생님과의 대화에서 제가 얻은 가장 큰 성과입니다. 이번 대화 덕분에 최근 Mark Zuckerberg의 행보에서 network에서 meaning으로의 이동이라는 변화를 읽어냈습니다. 지적 돌파구를 열 때는 항상 선생님 같은 대가와 붙는 것이 최곱니다. 바로 아이디어를 얻든 지, 아니면 비판 속에서 아이디어가 파생적으로 얻어질 수도 있거든요. 죄송합니다. 선생님의 지적 세계를 너무 거칠게 다루어서요. 이해해 주시길 부탁 드립니다. 제가 워낙 훈고학을 싫어해서요.

끝으로 한 가지만 더 말씀을 나누지요. 문화적 갈등에 관한 것입니다. 선생님은 문화적 갈등을 어떤 뜻으로 사용하셨나요?

McLuhan: 세상의 변화는 그냥 오지 않습니다. 항상 치열한 갈등을 수반하지요. 문화적 변화도 마찬가지입니다. 시각 문화(visual culture)에서 구두 문화(oral culture)로의 변화도 그렇습니다. 예컨대 학교는 죽어가는 인쇄문화인 선형적 사고와 시각적 가치에 포박되어 새로운 사고방식과 가치를 핍박하고, 새로운 세대들에게 “담벼락 없는 감옥”이 됩니다. 탈중앙화, 분산화 경향은 기존의 관료제도와 충돌합니다. 1960~70년대 저항문화와 지배문화의 충돌은 바로 그러한 문화적 갈등의 표출이지요.

만리거사: 좋은 말씀이십니다. 요즈음 저는 우리 사회에서 비슷한 문화적 갈등을 많이 봅니다. 참여적, 수평적 대화가 핵심인 새로운 문화와, 일방적, 수직적 커뮤니케이션이 근간이 된 기존 문화 사이에 치열한 갈등이 시작되었습니다. 아직도 우리 사회에는 일방적, 수직적 커뮤니케이션이 지배적입니다. 참여적, 수평적 대화가 차츰 확산되고는 있지만 아직 걸음마에 불과합니다. 지난 몇 년간 과거의 권위주의 문화가 다시 회귀하는 듯한 느낌입니다. 선생님이 말씀하신 “과거 문화의 복수”일 수도 있지요.
제가 마지막에 문화적 갈등을 들고나온 이유는, 기업이나 기관 조직 내부에서도 그렇고, 사회 전체적으로 보아도 문화적 전환이 심각한 갈등을 수반하지 않고 일어나지 않는다는 사실을 강조하기 위해서입니다.

이제 선생님과의 대화를 마치려고 합니다. 선생님께 충분한 발언 기회를 드리지 않고 거의 일방적으로 공격만 한 점, 진심으로 죄송하단 말씀 드립니다. 제 능력이 거기까지입니다. 선생님이 저의 무례를 기꺼이 용서해 주시리라 믿습니다. 선생님께서 이렇게 말씀하신 적이 있지요.

“내 책들은 발견의 완성된 산물이 아니라 발견의 과정을 구성한다”. 언제든 까 부셔도 좋다고요.

다시 영면하시길 빌면서 이만 줄입니다. <끝> (윤영민, 2018-05-17)

Marshall McLuhan과의 가상적 대화(3)

Tetrad
Tetrad

만리거사: 선생님, 아마도 지구촌(global village)과 재부족화(retribalization)는 선생님께서 고안하신 개념들 중 가장 널리 애용되고 있을 겁니다. ‘지구촌’은 선생님 생전 때부터 현재까지 대중적으로 사용되고 있고, ‘재부족화’는 지난 10여 년 사이에 학문적으로 부활하고 있다고 말씀드릴 수 있습니다. 특히 노마디즘(nomadism), 부족주의(tribalism)에 관심을 가진 프랑스 학자들이 선생님의 영향을 많이 받은 것 같아요.

그런데 애초에 그 개념들을 어떤 의미로 사용하였는지에 대해 말씀해 주시겠습니까? 제가 보기에는 그 개념들이 원래의 의미를 많이 잃어버린 게 아닌가 하는 생각도 들거든요.

McLuhan: 한 명의 학자로서 사후에도 자신의 학문적 성과가 널리 애용되는 것은 커다란 행운이고 영광이지요. 그런 점에서 나는 축복받은 사람입니다. 하지만 그 개념들이 대중화되면서 제 원래 의도가 다소 왜곡되고 있는 것 같아요. 물론 이미 그 개념들이 제 손을 떠나 사회적 자산이 되었기 때문에 어떤 의미로 사용되든 사실 제가 관여할 일은 아닙니다만 원 뜻이 존중된다면 저로서는 더욱 만족스럽겠지요.

제가 하늘에서 내려다 보니까, ‘지구촌’에 대한 가장 심각한 오해는 그것을 사랑과 조화가 충만 된 곳으로 인식한다는 것입니다. 사실 저는 그런 의미로 사용한 적이 없는데. Playboy지 인터뷰에서도 분명히 밝혔듯이 “일치(uniformity)와 평온(tranquility)이 지구촌의 특징은 아닙니다.” 부족화되면 사랑과 조화만큼 갈등과 불일치도 잦아집니다. 부족이란 게 원래 공동의 목표를 달성하기 위해 서로 협력하기도 하지만 헤게모니를 두고 치열하게 다투기도 하고 뭐 그런 것 아닌가요?

사려 깊은 독자라면 “지구촌”과 “미국의 발칸화”라는 두 현상이 서로 별개이거나 상충되는 경향이 아니라는 내 입장을 정확히 파악했을 텐데, “미국의 발칸화”는 무시하고 “지구촌”만 살려 놓는 탓에 그런 오해가 있지 않나 하는 생각입니다.

만리거사: 선생님이 글을 너무 재미 없게 써서 독자들이 선생님의 책을 제대로 읽지 않은 때문도 있겠지요. 그건 선생님 자신의 책임이 큰 것 같네요. 그리고 미국의 발칸화로 표현한 소국(ministates)의 번성이라는 예상이 빗나갔기 때문에 사람들이 그 명제를 무시하거나 잊어버린 게 아닐까요? 결국 “지구촌”만 살아남은 것이지요.

McLuhan: 뭐 틀린 해석으로 보이지는 않군요. 근데 내가 서로 대비해 지적했듯이, 인쇄미디어는 사회적으로 중앙집중화(centralizing)시키고, 심리적으로는 파편화(fragmenting)시킵니다. 반면에 전자미디어는 사회적으로 탈중앙화(decentralizing)시키고, 심리적으로는 통합(integrating)시킵니다. 인쇄미디어는 개인주의를 촉진시키며, 거기에서 자유(freedom)는 기껏해야 소외되고 파편화되기 위한 권리일 뿐입니다. 반면에 전자미디어는 부족주의를 촉진시키고, 통합된 개인을 출현시킵니다. 그래서 나는 그 결과 수많은 소국들(ministates)이 출현하리라 예상했습니다. 나는 그런 맥락에서 미국의 발칸화(balkanization of the United States)를 예견했던 것입니다.

만리거사: 제가 보기에는 미국의 발칸화라는 예측이 맞지 않았다는 사실이 선생님의 인쇄미디어와 전자미디어의 구분에 문제가 있음을 시사합니다. 선생님은 TV를 전자미디어라는 이유로 신문과 다른 사회적 영향을 줄 것이라고 단정했는데, 거기에 문제가 있었을 수 있습니다. 요즘 인터넷을 공부하는 젊은 연구자들은 신문과 TV를 한 묶음으로 간주합니다. 뭐 선생님도 기억하실 위르겐 하버마스 같은 좀 오래 된 연구자들도 그렇게 봅니다. 세 가지 의미에서이지요. 하나는 일방향적 매체라는 점, 둘은 중앙집중적 매체라는 점, 셋은 사회통합적 매체라는 점입니다. 신문이나 TV같은 대중매체가 일방향적이라거나 중앙집중적이라는 점은 요즘은 상식적인 얘기이고, 사회통합적 매체라는 주장은 좀 논란 중입니다.

위르겐 하버마스, 베네딕트 엔더슨(Benedict Anderson), 그리고 최근에는 카스 선스타인(Cass Sunstein) 같은 학자들이 대중매체의 사회통합적 기능에 주목합니다. 선생님과는 다르지요? 이 중 하버마스와 선스타인은 인터넷에 대해 비판적입니다. 사회를 파편화시킨다는 겁니다. 소위 반향실(eco-chamber) 효과라는 가설인데, 뭐 인터넷이 사용자들에게 고도의 정보선별(filtering) 기능을 제공하기 때문에 유사한 생각, 유사한 취미, 유사한 정치적 성향을 가진 사람들끼리만 뭉치는 경향이 강화된다는 그런 얘기입니다. 그리고 그것이 민주주의와 사회통합을 위협한다고 주장합니다. 반 앨스타인과 브린졸퍼슨(Van Alstyne and Brynjolfsson)은 그것을 사이버발칸화(cyber-balkanization)라고 불렀는데, 선스타인은 사이버발칸화를 넘어 사회 전체에 집단 극화(group polarization)를 초래하고, 인터넷은 테리리스트나 KKK같은 극단적 집단의 온상이 되고 있다는 주장합니다.

반면에 요차이 벤클러(Yochai Benkler)나 클레이 셔키(Clay Shirky), 그리고 저도 그렇습니다만, 대중매체는 상당히 엘리트 중심적이고, 억압적인 측면을 많이 가지고 있다고 봅니다. 대중매체는, 통합은 통합인데, 불평등한(비대칭적 정보) 계층질서 위의 통합을 촉진하는 것으로 보고 있습니다. 진정한 의미의 사회통합이 아니라는 거지요.

저는 인터넷이 바로 그 지점에 도전하고 있다고 생각합니다. 저는 그 도전을 “엘리트주의의 종말”, “지식인의 죽음”이라고 해석합니다. 지식을 사랑하는 사람이라는 의미의 지식인이 아니라, 비대칭적 지식 분배 위에 권력을 향유하는지식권력으로서의 지식인이 더 이상 존재할 수 없게 된다는 말씀입니다. 그것을 가능하게 해주었던 일방향적 매체, 선생님 표현으로 하자면 hot media가 사라짐에 따라 나타나는 현상이지요.

사실 쿨미디어(cool media) 시대가 온다는 선생님의 예측은 놀랍게 들어맞았습니다. 인터넷 세상이 바로 그것이고, Social media야말로 쿨미디어가 아니겠습니까? 지난번에 제가 선생님의 쿨미디어 주장을 비판한 것은 이제 모든 매체가 쿨미디어가 되었기 때문에 핫미디어니 쿨미디어니 하는 구분이 불필요하다는 지적이었습니다.

선생님의 “미국의 발칸화” 예측이 틀린 또 다른 이유는 선생님이 민족주의(nationalism)의 자기 재생산 능력을 과소 평가한 때문이라고 생각합니다. 뭐 부족을 강조하다 보면 당연히 민족주의를 가볍게 보게 되겠지요. 그러나 제가 보기에 민족주의는 죽은 개가 아닙니다. 아직도 한참 동안 민족주의는 사람들의 정체성(identity)을 구성하는데 있어서, 그리고 세계의 정치적 지형을 형성하는데 있어 거대한 힘을 행사할 것입니다. 민족, 민족주의, 민족국가와 같은 논쟁은 별도로 해야 하겠지만, 간단히 말씀 들이자면, 그것들을 기능적으로만 접근하는 학자들은 쉽게 민족국가의 종말을 얘기하지만, 근본적으로 민족이 지닌 역사적, 그리고 권력적 측면을 무시했기 때문에 나온 섣부른 결론이지요. 선생님도 그런 학자들 중 한 분이고요.

그렇다고 “부족”의 개념이 무용하다는 말씀은 아닙니다. 프랑스의 사회학자 마페졸리(Michel Maffesoli)가 말하는 라이프스타일을 공유하는 집단으로서의 “부족주의”는 민족주의와 충분히 공존할 수 있다고 봅니다. 선생님이 말씀하신 “부족주의”와는 좀 다르지요? 마페졸리는 선생님한테 큐를 받아서 “신부족주의”를 제기했는데, 선생님만큼 그렇게 all-encompassing(모든 것을 포함하는) 컨셉을 제시한 것은 아닌 것 같습니다. 인터넷상에 마페졸리적 의미의 “부족”과 “부족주의”는 넘쳐나고 있습니다.

선생님도 아시다시피, 페이스북이 전세계 사용자 5억 명을 넘어 질주하고 있습니다. 매일매일 지구적 규모로 돌아가는 페이스북이 갖고 있는 정치적, 경제적, 사회적, 혹은 문화적 함축성이 무엇일까는 많은 사람들의 관심사입니다.

일단 선생님의 시각을 원용하면, 페이스북에 등장한 실시간 지구촌에는 한편으로 “사랑(love)과 조화(harmony)”가 넘치고, 다른 한편으로 “단절(discontinuity), 다양성(diversity), 분리(division), 갈등(conflict), 불일치(discord)”가 끊임 없이 발생하리라 예상되는 군요. 뭐 크게 인상적인 예측은 아닌데요. 좀 더 구체적인 전망이 필요합니다. 그런데, 그것은 선생님이 주실 수 있는 건 아닌 것 같습니다. (윤영민, 2018-05-17)

Marshall McLuhan과의 가상적 대화(2)

Herbert Blumer, Berkeley 연구실
Herbert Blumer, UC Berkeley의 사회학과 연구실에서

만리거사: 어제 제가 말씀들이다 중단한 부분부터 다시 시작하지요. “미디어는 메시지다”라는 명제를 폐기처분 하자고 제안했었습니다. 아마도 선생님은 이렇게 되물으시겠지요? “미디어가 메시지가 아니면 뭔데?”

인류에게 미디어의 중요성을 일깨우기 위해서 일부러 그런 것이라고 이해합니다만, 선생님은 극단적인 형태의 기술결정론적 입장을 취하셨지요. “미디어가 인간(혹은 인간 감각)의 확장”이라는 문구가 선생님의 관점을 정확히 드러내줍니다.

미디어를 미디어라고 놓고 보아야 무슨 얘기가 되지요. 기술결정론이든, 사회결정론이든, 아니면 사회구성주의든 말입니다. 선생님처럼 미디어를 인간의 확장이라고 정의해 버리면, 그 때부터는 동어반복(tautology)의 세계로 들어갑니다. 미디어가 뭐냐고 물으면, “인간의 확장”이라고 대답하고, “인간의 확장”이 뭐냐고 물으면 “미디어”라고 대답해야 하는 세계 말입니다. 미디어 만능주의 혹은 미디어 신비주의에 귀결되는 것이지요. 한 마디로 ‘오버’하신 것이라고 생각합니다.

뭐 “사이보그 인권선언’의 입장에 서 있는 학자들에게는 미디어와 인간의 이원론을 부정하는 선생님의 철학이 예언자의 목소리로 들리겠지요. 그러나 저 같은 사회학자에게 미디어와 인간 사이에는 넘을 수 없는 경계가 분명히 존재한다고 가정되어야 합니다. 저는 미디어를 도구 혹은 환경으로 봅니다. 그 이상도 그 이하도 아니라고 생각합니다. 그렇다고 선생님의 혜안을 통째로 거부하지는 않으니 너무 실망하시지는 마십시오.

일단 미디어와 인간 사이의 관계를 그렇게 정리해 놓아야, 메시지의 주체가 인간임을 선언할 수 있습니다. 즉, “미디어가 메시지이다”가 아니고 “인간이 메시지이다”라는 제 입장을 제시할 수 있습니다. 뭐 그것이 제 독창적인 생각은 아닙니다. 선생님과 비슷한 시대를 살았던 허버트 블루머(Herbert Blumer) 선생님한테 받은 영향이지요. 끝없이 의미를 생산하고 해독하는 존재로서의 인간이라는 관점 말입니다. 메시지는 의미이고, 메시지의 시작과 끝은 인간(발신자, 수신자)입니다.

Claud Shannon과 그 후예인 정보학자들이 이 말을 들으면 뒤집어 지겠지요. 메시지에서 의미를 탈각시킴으로써 디지털 정보혁명이 가능해졌는데 뭔 잠꼬대 같은 소리냐고. 예, 맞습니다. 그러나 바로 그 디지털 정보혁명이 성공하면서 스스로를 넘어서는 형국이 된 것이지요. “의미의 귀환”이라고 해둡시다.

혹자들은 컨텐츠(contents)를 강조합니다만, 짧은 생각입니다. 컨텐츠보다 인간이 우선이지요. 선생님도 아시다시피 Google이 컨텐츠를 중심에 두고 있고, Facebook이 인간을 중심에 두고 있습니다. 누가 이길 것 같습니까? 모르시겠다고요? 그렇겠지요. “미디어가 메시지다”라는 인식을 갖고는 답이 안 나올 겁니다.

저는 fb이 이길 것으로 봅니다. “인간이 메시지”이기 때문입니다. 컨텐츠는 인간과 결합될 때 의미가 부여됩니다. 사람들이 진정으로 원하는 것은 “의미(meaning)”이지 “컨텐츠”는 아닙니다. Google이 그것을 깨닫지 못한 것은 아니었는데, Facebook이 한 수 위이더군요.

이 정도면 “미디어가 메시지”가 아니면 뭐냐는 선생님의 도발적 질문에 대한 제 답변이 되었으리라 생각됩니다.

그런데, 나중에 선생님이 “미디어가 마사지(massage)”라는 말씀도 하셨는데, 미디어의 영향을 강조하는데 그 정도면 충분하다고 생각합니다. 저는 선생님의 그 문구를 참 좋아합니다. 요즘 fb를 사용하노라면 두뇌가 참 많이 마사지를 받는다는 느낌입니다. Fb 친구들은 굳어진 제 머리를 마구 두들겨 주거든요. 정말 선생님의 그 말씀은 지금도 살아있어야 할 명언입니다. 좀 위안이 되시지요. 그런데 사람들은 그 문구를 잊어버리고, 시대에 맞지 않는 “미디어가 인간 감각의 확장”이라든가 “미디어가 메시지”라는 문구만 기억해요.

다음에는 “재부족화”와 “지구촌”에 대해 말씀을 나누어 볼까요? 선생님이 고안한 그 개념들도 요즘 사람들이 즐겨 사용하고 있습니다. 저도 잘 사용합니다만 또 따져봐야 할 점들이 있어요. (윤영민, 2018-05-17)

Marshall McLuhan과의 가상적 대화(1)

Marshall McLuhan, Playboy (March, 1969)

McLuhan이 살아 돌아온다면 인터넷, SNS, 집단지성 등에 대해 무어라고 말할까요? web 2.0시대에 McLuhan의 미디어 이론은 어떻게 하면 좋을까요? 마음 편하게 좀 따져보고, 건질 것은 건지고, 버릴 것은 버렸으면 합니다.

만리거사: McLuhan 선생님, 선생님께서 세상을 떠나신 지도 벌써 30년이 흘렀군요. 그 동안 세상 참 많이 변했습니다. 어떤 부분은 선생님께서 예상하신 대로 되어가고 있고, 어떤 부분은 선생님의 예상과 많이 다르게 전개되고 있어요. 선생님 자신이 보시는 오늘날의 세상을 커뮤니케이션 미디어를 중심으로 말씀해 주시지요.

McLuhan: 만리거사님, 기억하실 지 모르겠지만, 내가 41년 전에 Playboy지와의 인터뷰 에서 압축적으로 예측했던 세상이 대체로 그대로 이루어진 것 같습니다. 그렇지 않나요? 전보로 시작되어 라디오, TV, 컴퓨터 등으로 발전된 전자미디어(electronic media)가 인터넷, 멀티미디어, 모바일로까지 발전했고, 내가 지적했던 실시간-구두문화로의 회귀(시각적 공간에서 청각적 공간으로의 전화), 재부족화, 지구촌화, 실시간 참여정치, (시각적 문화와 청각적 문화 사이의) 문화적 갈등, 미국사회의 발칸화, 학교의 창살 없는 감옥화, 프라이버시의 몰락(?), 쿨 미디어의 발달 등이 대체로 모두 실현되지 않았나요? 기술 자체는 내 생전에 비해 많이 발전했지만 기술의 성격에 본질적인 변화가 있다고 생각되지 않네요.

만리거사: 예. 1969년 Playboy지 인터뷰 기억합니다. 이제야 드리는 말씀이지만 참 길었어요. 50페이지가 넘었으니까요. 선생님이 당시 대중문화의 icon으로 떠오르기는 했지만 뭐 Playboy같은 야한 잡지에는 별로 어울리지 않는 인터뷰였지요. 지금 다시 읽어보니 소름이 끼칠 정도로 정확히 예측하셨더군요. 진짜 미래를 엿보신 것 아니었던가요? 그렇지 않고 어떻게 그렇게 생생하게 4-50년 후의 세계를 그릴 수 있는 지 도무지….그렇다고 뭐 예측이 다 맞았다는 말씀은 아닙니다.

요즈음 인터넷은 좀 둘러보셨나요? 선생님께서는 Web 2.0, SNS 등의 현상에 대해선 어떻게 생각하시나요?

McLuhan: 나는 인류문명의 발달을 청각문화와 시각문화로 나누어 생각합니다. 음소문자가 발명되기 이전에는 구두문화(oral culture)가 존재했고, 그것은 인간의 감각 중 청각을 중심으로 시각, 촉각 등 여러 감각기관이 균형을 이루고 있었던 시대였습니다. 사회적인 측면에서 보자면 부족(tribal) 사회였지요. 소규모의 부족이 한 마을에서 공동체를 이루고 사는 식이지요. 부족 구성원들끼리는 서로 잘 알고 있었으며, 부족의 문제는 늘 부족 구성원들의 대화를 통해 해결하였습니다.

그런데 알파벳이나 한글 같은 음소문자가 출현하고, 금속활자, 활판 인쇄가 발명되면서 인간의 감각 기관 중 시각에 크게 의존하는 문명으로 바꾸었습니다. 사회적인 측면에서는 탈부족화하고, 국가, 관료제, 대의민주주의, 산업화, 민족주의 등이 발달하였지요. 하지만 1800년대 중엽 전보(telegraph)가 발명되고, 20세기 들어와 라디오, TV, 컴퓨터와 같은 전자 미디어가 속속 등장하면서 인간의 문명은 다시 구두문화로 회귀하고 재부족화 현상이 나타나고 있습니다.

만리거사: 선생님, 죄송합니다만, 요즘 사람들은 긴 글을 참지 못합니다. 40년 전하고는 달라요. 좀 짧게 말씀해 주시지요.

McLuhan: 알겠습니다. 긴 글을 참지 못하는 건 놀라운 일이 아니지요. 그것은 구두문화의 특징이니까요. 문자문화에서 구두문화로의 회귀라는 제 주장에 대한 강력한 반증입니다. 한 마디로 인터넷, SNS, Web 2.0은 전자적 미디어에 의해 실시간(instant, real-time)으로 이루어지는 텔리커뮤니케이션 세상을 보여줍니다. 그것은 내가 ‘지구촌(global village)’이라고 부른, 지구적 규모에서의 재부족화(retribalization)가 실현되고 있음을 의미합니다. 페이스북의 사용자가 5억 명을 넘어섰다는데, 그것은 ‘지구촌’이 실현되는데 강력한 인프라가 되겠군요.

만리거사: 글쎄요. 저는 선생님의 그러한 해석에 동의하기 어렵습니다. 저는 미디어의 발전을 인터넷 이전과 이후로 나누어 보는 게 더 적절하다고 생각합니다. 저는 신문, TV, 라디오, 잡지 등과 같은 대중매체(mass media)와 인터넷과 같은 공중매체(public media)로 나눕니다. 선생님과는 대중과 공중이라는 용어를 반대로 사용하고 있습니다. John Dewey, C. Wright Mills나 Jurgen Habermas와 같은 비판적 학자들의 용례를 따라 대중과 공중을 구분합니다. 뭐 그건 그렇게 중요한 차이라고 할 수는 없지만요.

선생님께서는 수용자의 참여를 중심으로 cool media와 hot media로 나누셨는데, 그것으로 참 여러 사람 헷갈리게 만드셨지요. 지금 와서 드리는 말씀이지만 TV에 대한 선생님의 과장된 해석은 문제가 많았습니다. 그런데 선생님이 TV에 대해 말씀하신 내용에서 TV라는 단어를 빼고 인터넷을 바꾸어 넣으니 놀랍게도 참 자연스럽게 들립니다.

만약 굳이 선생님의 그 용어를 적용한다면 인터넷 이전의 대중매체는 모두 hot media로 보아야 할 것입니다. 사용자의 참여랄 게 거의 없었으니까요. 그러나 오늘날과 같은 멀티미디어 시대에 그것은 사실 무의미한 분류입니다. 선생님이 hot media로 분류한 라디오, 책, 사진 등이, 디지털화되고 인터넷과 결합되면서 실질적으로 cool media로 변신해 버렸지 않습니까? 멀티미디어 인터넷 시대에 모든 매체는 cool media가 되었습니다. 이제 그 용어들은 폐기처분 하면 어떨까요? 선생님도 반대하지 않으시리라 생각합니다만.

저는 인터넷을 기반으로 매체 융합이 발생하면서 매체의 구분이 무의미해졌다는 입장입니다. 모두 공중매체가 됩니다. 공중매체는 사용자 중심의 참여적 매체(participatory media)입니다. 저자와 독자, 생산자와 소비자 사이의 구분이 없어지고, 공중매체의 key가 되는 대화(dialogue)는 모두의 발화(utterance)를 통해 완성됩니다. 완성이라는 표현이 좀 께름칙합니다. 공중매체에는 완성 혹은 종료가 없기 때문입니다. 흐름만이 존재할 뿐입니다. 새로운 발화에 의해 언제든 개정될 수 있는 일시적인 정지만이 있을 뿐입니다.

SNS를 보세요. 타임라인에 한번 들어오면 어떤 발화도 무시되지 않습니다. 게시될 자리에 게시된다는 의미에서 말입니다. 그러나, 아무리 위대한 발언도 아주 허무하게 금새 흘러가 버립니다. 또한 누군가가 올린 posting은 댓글(comment, reply)과 묶이면서 하나의 메시지가 형성됩니다. 설령 posting의 내용이 아무리 위대할 지라도 댓글은 그것을 순식간에 해체시켜 버립니다. 반대로 하찮게 보이는 posting일지라도 댓글에 의해 훌륭한 글로 격상되기도 합니다. 인터넷이 지닌 실시간 대응이라는 특성이 누구에게도 저자(author)의 특권을 부여하는 걸 거부합니다.

매체 융합(media convergence)은 선생님 이론의 핵심적인 명제인 “미디어는 메시지다”를 무색하게 해버렸습니다. 미디어의 구분이 불가능한데 상황에서 미디어가 메시지가 될 수는 없지요. 미디어가 지닌 특성이 분명히 구분될 수 있어야 미디어 자체가 메시지를 발할 겁니다. 이제 그 명제도 폐기처분 했으면 합니다. 너무 시간이 늦었습니다. 이 점에 대해서는 내일 계속 말씀드리기로 하지요. (윤영민, 2018-05-17: Facebook 정보사회학 페이지, 2010/08/04에 게시했던 글을 약간 수정 전재함. 연결된 포스팅들도 동일함)

지능이라는 이름의 게임(18): 집단지능과 블록체인(10)

관련 이미지

블록체인은 분산원장(distributed ledger)이다. 즉, 블록체인이라는 원장을 구성원 모두에게 공유토록 하는 시스템이다.

그런데, 블록 체인의 거래가 크게 증가하고 참여자가 아주 많아지면 블록과 블록체인에 담긴 데이터의 양–대부분 거래 기록(transaction list)이겠지만–이 폭발적으로 증가할 것이다. 그러면 데이터의 유효성이나 무결성 검증에 있어 효율성 확보가 심각한 문제로 대두될 수 있다.

더구나 구성원들의 블록체인 참여는 인터넷에 연결된 단말기를 통해서 이루어지는데 단말기의 성능이 제각각일 것이다. 어떤 참여자들은 스마트폰 앱을 사용하기도 할 것이다. 거래 원장의 공유라는 원칙을, 그런 참여자들까지 포함해서 블록체인 참여자 모두가 과연 어떻게 따르게 할 수 있을까?

그러한 문제를 해결하는 요소 기술이 머클 루트(Merkle root)–루트 해시(root hash)라고도 부름–이다. 머클 루트는 해싱을 이용하여 누적된 거래 기록을 최대한 가볍게, 그러면서도 신뢰를 창출하는 원래 기능을 유지하게 해주는 데이터 축소 방법이다. 아래 그림은 모의 블록체인이고, 각 블록의 헤더(block header)는 머클 루트를 가지고 있다.

관련 이미지

머클 루트는 다음과 같은 방식으로 생성된다. 아래 그림을 가지고 설명한다.

나무–이 나무를 Merkle tree라고 부른다–의 가장 바닥에 있는 각 거래(Transaction A, B, C, D)는 해싱되어 Hash A, B, C, D가 된다. 그런 다음 그 해시들은 두 개씩 짝을 지어 다시 해싱된다. Hash A와 B는 Hash AB로 해싱되고, Hash C와 D는 Hash CD로 해싱된다. 그리고 그 두 해시는 다시 결합, 해싱되어 머클 루트(Merkle Root/Root Hash)를 형성하게 된다. 머클 루트에는 나무의 바닥에 있는 거래 기록 자체는 포함되지 않고 해시들만 포함되어 있다. 이렇게 사다리 타기 하듯이 연쇄적으로 해싱하면 아무리 많은 데이터라도 매우 가벼운 머클 루트로 변환될 수 있다.

이 머클 루트가 블록 헤더(header)에 포함되어 있으면 블록 바디(body)에 있는 거래 기록을 빼고 블록 헤더만 포함시켜 해싱을 해도 데이터의 무결성과 유효성이 충분히 검증될 수 있다. 그리고 블록 헤더에 담긴 머클 루트는, 그 블록에 포함된 거래 기록들의 머클 루트를 계산해서 비교해 보면, 그것의 유효성을 확인할 수 있다.

머클 루트는, 많은 거래 기록을 효율적으로 해싱하는 기술이며 다수의 참여자들이 많은 거래 기록을 손쉽게 공유할 수 있게 해주는 기술이기도 하다. 머클 루트는 블록체인에서 해시함수가 참으로 중요한 요소 기술임을 다시 한번 확인시켜 준다.

이상으로 블록체인이라는 집단지능을 구현하는 요소 기술들을 살펴보았다. 아마도 블록체인에 대해 낯설었던 독자들도 이제 그 기술과 조금은 친숙해 지지 않았을까 생각된다.  다음에는 블록체인의 다양한 구현체–아직은 주로 암호화폐들이지만–와 그것이 지닌 사회적 잠재성에 관해 성찰해 보기로 하자. (윤영민, 2015-05-14)