‘교수’에서 ‘명예교수’가 되다

총장_이사장의 감사패, 집 아이들의 감사패, 학생들의 감사 인사

오늘(2020-03-01)자로 한양대학교 정보사회미디어학과의 명예교수에 임용되었다. 아마도 한양대에서 받는 마지막 인사 발령이리라.

우리 사회에서 명예교수는 여러가지 의미를 함축한다. 첫째, 더 이상 전임교원이 아니라는 의미이다. 전임교원이 갖는 모든 권한과 의무로부터 자유로워진 신분이다. 한 마디로 퇴임 교원이다. 둘째, 적어도 20년 이상 교수직을 대과없이 수행하고 퇴임했다는 의미이다. 교수직을 수행했다고 모두가 명예교수가 되는 것은 아니다. 셋째, 비정규직 교수라는 의미이다. 특별한 문제가 없는 한 70세까지는 학교에서 강의를 주지만, 본인이 원하지 않으면 하지 않아도 된다. 일하지 않으면 급여가 없다.

건강상의 이유로 정년보다 일찍 퇴임한 나는 남보다 이른 시기에 명예교수가 되었다. 이번 학기부터는 오프라인 강의는 하지 않고 온라인 강의만 한다. 현재의 건강 상태로 볼 때 만약 오프라인 강의를 지속했다면 교단에서 쓰러졌을 지도 모른다. 적시에 퇴직을 했다고 생각된다.

이로서 한양대로부터의 명예 퇴직 절차가 마무리되었다. 거의 내가 예상하고 원하던 대로 되었다. 무언가 ‘완성되었다’는 느낌이다. (2020-03-01)

신작로….떠남과 귀환의 길

강홍구 화백. 하동  대로변 풍경.

학교 연구실에 오랫동안 걸어두었던 친구 강홍구 화백의 사진 작품을 집 거실에 걸었다. 3미터가 넘는 벽에 거느라 땀을 뻘뻘 흘렸다. 사진 길이도 2미터 30센티 쯤이나 된다.

강홍구 화백 작품.

거실 중문을 열고 들어오면 정면에 바라보이는 자리이다. 거실 벽 상부에 거는 첫번째 작품이다. 그곳에는 일년 열두달 해가 비치지 않기 때문에 작품 걸기에 딱 좋은데, 너무 높아서 걸기가 쉽지 않은 게 함정이다. 그래도 강 화백의 작품은 비교적 가벼워서 아내와 함께 걸 수 있었다.

촌놈인 나에게 ‘신작로’는 특별한 의미가 있었다. 심지어 1960년대 신작로는 포장조차 되지 않았지만 내게는 큰 세상으로 나아가는 출구였다. 언젠가 신작로를 따라서 멀리 떠나리라 상상하곤 했는데 실제 60여년 가까이 세상을 떠돌았다.

지금은 마치 오랜 여행을 마치고 돌아온 느낌이다. 이제 저 사진의 신작로는 떠남이 아니라 귀환으로 다가오고 있다.

돌이켜보면 우리 삶 자체가 여행인 것을. (2020-02-21)

정보에 관한 지식기반 이론

2010년에 발표된 정보에 관한 지식기반 이론(Konwledge-Based Theory of Information, 이하 KBI)은 DIKW 모형을 개념적으로 계승하면서 한 단계 더 나이가 데이터, 정보, 지식 사이의 관계를 정교하게 규정하고 있다. KBI는 지식과 데이터가 상호작용하여 정보를 생성한다는 의미에서 상호작용적 모형(interactive model)이라고도 불린다.

KBI는 정보가 지식과 데이터로부터 생성된다는 인식에서 출발한다. 데이터는 상황에 관한 선결조건(pre-conditions) 혹은 투입값(input values)이며, 그것을 기반으로 정보가 생산된다. 정보는 주어진 상황에서 행위자가 의사결정 혹은 행동의 선택을 가능하게 하는 요소이다.  지식은 데이터로부터 정보가 생산되는 과정 혹은 프레임워크이다(아래 그림 참조).

KBI에서, 데이터는 “객체나 사건에 관한 서술 혹은 측정 결과”이다.  예컨대 “A형 부품이 17개 남아 있다” 혹은 “비가 내리고 있다”가 데이터이다. 이 데이터만으로서는 의사결정이나 행동을 선택하는데 필요한 정보가 생성될 수 없다. 거기에는 반드시 지식이 필요하다.

지식은 “구성물 사이의 관계에 대한 정당화된 진실된 믿음이다(is justified true belief of the relationship between constructs).” 이 정의를 풀어보면, 지식은 믿음의 한 유형인데, 그것은 진실이거나 진실에 접근하는 것이어야 하며,  전문가나 권위자에 의해 인정된 것이어야 한다. 다시 말해, 지식은 객관적으로 검증된 믿음, 권위있는 전문가들에 의해 인정된(혹은 합의된) 믿음이다.

그리고 지식은 구성물 사이의 관계에 대한 믿음이다. 지식의 가장 흔한 형식은 If-Then 짝이다. 예컨대 어떤 새가 백조라면, 그 새는 하얄 것이다라는 명제는 지식이다. 

정보는 지식 프레임워크(framework)를 토대로 데이터로부터 생산된 의미(meaning)이다. 의미란 어떤 경험에 부여된 해석을 말한다. 정보에 의해 선택, 판단, 혹은 불확실성의 감소가 일어난다.

아래 사례들을 보면, 지식, 데이터, 정보에 대한 KBI의 핵심적인 주장이 이해될 것이다.

(사례 1)

지식: 만약 A형의 부품의 재고가 20개 이하이면, 부품 부족을 예방하기 위해 A형의 부품을 주문해야 한다.

데이터: A형의 부품이 17개 남아 있다.

위의 지식과 데이터가 결합되면, A형 부품을 3개 이상 주문해야 한다는 정보가 생성된다. 

(사례 2)

지식: 만약 비가 내리고, 당신이 비를 맞기 싫어한다면, 외출하기 전에 우산을 챙겨야 한다.

데이터: 비가 내리고 있다.

정보: 위 지식과 데이터가 결합되면, 우산을 챙기라는 정보가 생산된다.

 KBI를 자율주행 자동차에 적용해 보면, 우선 자동차는 교통데이터, 도로데이터, 기후데이터, 사건데이터 등을 처리할 수 있는 데이터분석 모형이 필요할 것이다. 그리고 도로 상황, 교통 상황, 기후 상황, 사건 상황에 관한 데이터를 실시간으로 받을 수 있는 센서(sensor)나 네트워크이 필요할 것이다. 데이터 분석 모형은 지식 프레임워크에 해당되고, 센서에서 입력되는 신호는 데이터이다. 데이터 분석 모형이 센서 데이터를 받으면 실시간으로 액츄에이터(actuator)가 행동할 수 있는 정보를 생산할 것이다. 그 기능을 모두 갖춘 AI가 자동차에 내장되면 자율주행 자동차가 만들어 질 것이다.   

참고문헌: Kettinger, William J and Yuan Li (2010). “The infological equation extended: towards conceptual clarity in the relationship between data, information and knowledge,” European Journal of Information Systems, 19(4): 409-421.

사회제도

사회제도(social institution)처럼 다양한 의미를 갖는 용어도 드물 것이다. 사회제도는 법제도, 경제제도, 정치제도, 군사제도 등에 대응하는 개념으로 사용되기도 하고 그것들을 모두 포함하는 포괄적 개념으로 사용되기도 한다.

institutions and organizations 이미지 검색결과"

제도에 대한 다양한 관점과 인식을 반영하여 리차드 스콧(W. Richard Scott)은 매우 포괄적인 정의를 제시한다.

제도는 규제적, 규범적, 그리고 문화-인지적 요소들로 구성되며, 그것들과 관련된 활동 및 자원과 함께 사회생활에 안정과 의미를 제공한다(Institutions comprise regulative, normative, and cultural-cognitive elements that, together with associated activities and resources, provide stability and meaning to sical life)(Scott, 2014: 56).

이 정의에 따르면, 제도는 여러가지 측면을 지니고 있으며, 내구성을 지닌 사회구조이다. 무엇보다는 제도는 그것이 지향하는 가치 체계와 규범 질서를 갖고 있어, 구성원–사람도 되고 조직도 될 것이다–의 의사결정과 행동에 있어 방향과 의미를 부여해준다.  그리고 그러한 상징체계들이 작동하기 위해서는 인력과 물적 자원이 필요하다.  정의상 제도는 안정적이지만, 그렇다고 변화되지 않은 것은 아니다. 내적 동인이 제도에 변화를 가져오기도 하고 외부 충격이나 환경 변화에 의해 변화가 일어나기도 한다.

국가, 정부, 민주주의, 관료제, 결혼, 가족, 가부장제, 시장, 기업, 자본주의, 학교, 대학, 마을, 사회학, 정치학, 물리학, 생물학, 언론, 공영방송, 신문, 도서관, 우체국, 교회, 정시, 수시, 징병제, 모병제, 상비군 등이 모두 제도 혹은 사회제도이다. 정치제도, 경제제도, 언론제도, 우편제도, 교육제도, 공동체 제도, 학문제도, 입시제도, 군사제도 등이 모두 제도 혹은 사회제도의 유형이 될 수 있다. 제도는 그 안에 제도(들)를 가질 수도 있으며, 다수의 조직들이 포함될 수 있다.

참고로 우리말로 ‘제도’에 해당되는 영어 단어는 institution이지만, institution은 ‘제도’말고도 ‘기관'(예: 행정기관), ‘시설'(예: 복지시설) 이라는 의미로도 사용된다.

참고: Scott, W. Richard. 2014. Institutions and Organizations (4th Edition). Sage Publications, Inc. (2020-01-25)

작별의 꽃

김종량 이사장이 란을 보내주었다. 작별의 꽃이다. 사립대에서 교수에 대한 인사권은 재단 이사장에게 있다. 그래서 김 이사장이 란을 보냈을 것이다.

23년 전 한양대학교에 교수로 임용될 때 김 이사장은 총장이었다. 면접 때 그가 내게 했던 질문이 기억난다. 내 이력서에 적힌 신문 컬럼 리스트를 보고 그가 내게 물었다.

“이 컬럼들은 윤 박사가 모두 직접 쓴 것인가요?”

나는 그 질문에 적잖이 당혹했지만 짧지만 확고하게 대답했다.

“예.”

그렇게 그와의 인연, 그리고 한양대와의 인연이 시작되었다.

임용된 지 2년 반쯤 되었을 때 그는 나를 불러서 한양대의 인터넷 서비스를 획기적으로 바꿔달라고 요구했다. 그래서 나는 ‘인터넷 한양’이라는 부서를 부총장 직속기구로 만들고 그 조직의 장이 되었다.

나는 안산 캠퍼스에서 학생들을 가르치고 인터넷 한양 업무는 서울캠퍼스에서 수행해야했기 때문에 육체적으로 너무 힘들었다. 김 총장은 내게 잠실에 있는 학교 아파트 한 채를 내주었다.  4년 동안 내가 한양대 인터넷을 업그레이드 시키는데 있어 김 총장은 아낌없이 지원해주었다.

그러나 그 동안 학과 운영과 수업이 뒷전에 되어버린 탓에 나는 학생들에게 무척 미안했다. 심리적인 압박을 견디지 못했던 나는 총장의 간곡한 요청을 뿌리치고 보직을 그만 두었다. 건강 문제도 있기는 했지만 무엇보다 학생들을 제대로 가르치기 위해서였다.

그렇게 나는 총장의 ‘애정’을 ‘배신’했고 그와의 ‘각별’했던 인연이 끝이 났다. 그 후 지금까지 나는 한양의 1천5백명의 교수 중 평범한 1인이 되었다.

돌이켜보니 한양을 위해 내가 좀 더 기여할 수도 있었을텐데 하는 아쉬움이 든다.  인터넷을 변신시킨 것말고 나는 어떤 점에서도 그의 기대에 부응하지 못했다. 이사장께는 진심으로 죄송한 마음이다.

그래서 저 작별의 난은 내게 다소 각별한 느낌이 든다. 이사장은 그저 이번에 퇴직하는 교수들에게 자신의 이름으로 난을 보내도록 지시했을 뿐이겠지만 말이다. (2020-01-24)

DIKW 모형

데이터, 정보, 지식 사이의 관계를 이해하는 데 있어 아마도 가장 오래, 가장 널리 가이드 역할을 해온 개념적 틀은 DIKW 모형이다. DIKW는 Data(데이터), Information(정보), Knowledge(지식), Wisdom(지혜)의 머릿글자로 구성된 이름이다. 이 모형에 따르면, 데이터사물이나 사건에 대한 묘사(description)이며, 가공되지 않은 상태의 사실(facts)이다. 그리고 특정한 목적을 위해 데이터가 처리되면(혹은 추상되면) 그 목적에 유용한 정보가 된다. 나아가 정보가 체계화되면 지식이 되며, 지식이 고도로 추상화되면 지혜가 된다.

     

데이터-정보-지식-지혜는 위 그림과 같은  피라미드 구조를 가졌다고 해서 DIKW 피라미드 혹은 지식 피라미드라고 불리며, 데이터에서 지혜로 올라갈수록 가치가 올라간다고 해서 가치 위계 모형(value hierarchy model) 혹은 가치사슬모형(value chain model)이라고도 불린다. 이 모형은 데이터, 정보, 지식 사이의 관계에 대한 개괄적인 모습을 보여주는데 자주 사용되었다. 

위 그림에서처럼 이 모형은 데이터보다는 정보의 가치가 높고, 정보보다는 지식, 그리고 지식보다는 지혜의 가치가 높으며, 데이터에서 지혜로 올라갈수록 의미(meaning)도 크다고 규정한다. 

이 모형은 MIS(경영정보학), 컴퓨터과학, 문헌정보학, 교육학 등 여러 학문 분야에서 폭넓게 이용된다. 네 가지 요소 중 그 지위가 애매한 ‘지혜’를 제쳐 놓고 본다면, 이 피라미드 모형은 나름대로 유용하다. 그것은 우리에게, 지식, 정보, 데이터 중 어떤 것을 다루더라도 다른 두 가지와의 관계를 고려해야 하며, 앎(knowing)에 관한 어떤 모형도 이 세 가지 사이의 관계에 대해 명쾌한 해석 혹은 입장을 포함하고 있어야 함을 알려주고 있다.

그러나, 이 모형이 지니는 가치는 그 수준에서 그치는 것 같다.  무엇보다 데이터, 정보, 지식 사이의 관계, 특히 데이터와 정보, 정보와 지식 사이의 관계가 애매하기 때문이다. 데이터가 “처리되어” 혹은 “추상되어” 정보가 된다고 하지만, 데이터의 ‘처리’ 혹은 ‘추상’이 정확히 어떤 원리에 따라서 어떻게 이루어지는가가 불분명하다.

더구나 빅데이터의 시대에 있어 정말로 정보나 지식이 데이터보다 가치가 높은 지도 의문이다.  데이터 마이닝이나 데이터과학을 통해서 빅데이터는 특정한 정보나 지식보다 더 큰 가치 혹은 더 다양한 가치를 창출해 낼 수 있다. 즉, 가치 생성의 측면에서 데이터가 정보나 지식보다 더 큰 잠재성을 가질 수도 있다. 때문에 데이터에서 추상화된 정보나 지식보다 데이터 자체가 더 큰 값에 거래되곤 한다. (2020-01-23)

정보와 데이터, 그리고 정보사회학(2)

개념들 사이에 ‘정보(information)’와 ‘데이터(data)’만큼 헷갈리는 관계도 드물 것이다. 그 둘은 서로 뗄 수 없이 의존적이기도 하고, 마치 시대를 두고 헤게모니 쟁탈전을 하듯 서로 경쟁적이기도 하며, 때로는 서로 넘나들며 사용되는 유사어처럼 보이기도 한다. 무엇이 진실일까?

information data 이미지 검색결과"

데이터와 정보의 관계에서 가장 널리 인용되는 DIKW 모형(Data-Information-Knowledge-Wisdom model)에 따르면, 데이터가 추상되어 유용성을 획득하면 정보가 된다. 데이터는 객체나 사건에 관한 묘사이다. 데이터가 어떻게 추상되는지는 확실치 않지만 데이터와 정보가 구분되는 것만은 분명하다. 비교적 최근에 등장한 지식기반의 정보이론(knowlege-based theory of information)에 따르면, 지식 프레임에 데이터가 주어지면 의사결정이나 행동에 도움이 되는 정보가 생산된다. 다시 말해 데이터는 지식에 의해 수집되거나 생성되며, 지식에 의해 해석되어 의사결정이나 행동에 사용될 수 있는 정보가 생산된다. 여기서도 데이터는 정보와 분명히 구분된다.

그런데 수학적 정보이론에 따르면, 특정한 목적을 위해 송신자에서 수신자로 전달되는 내용이 정보이고, 정보는 그것이 지닌 불확실성의 양으로 측정될 수 있다. 이 때 ‘정보’를 ‘데이터’라는 용어로 대체해도 별로 문제될 것이 없다. 정보라고 불리던 데이터라고 불리던 측정 단위는 비트(bit)이다.

mathmatical theory of information 이미지 검색결과"

과거에 데이터는 객관성이 강조되었다. 자연과학이든 사회과학이든 데이터는 주로 과학실험이나 사회조사와 같은 과학적 방법에 의해 생산되었고, 과학적 방법의 핵심은 비개입적, 비관여적, 이상적으로 말하자면 무작위적(random)이어야 했다. 객관적이지 않은 데이터–예컨대 행정 데이터, 고객 데이터–는 그것의 가치를 인정받지 못했다.

그러나 빅데이터 시대가 데이터에 대한 사람들의 인식을 바꾸어 놓았다. 행정 기록, 교통 데이터, 거래 정보, 고객 정보 등과 같은 빅데이터를 다루는 데이터마이닝과 데이터과학은 객관성에 더 이상 집착하지 않는다. 현실 문제를 푸는데 도움이 된다면, 수익을 올리는 데 도움이 된다면 어떤 데이터든 마다 하지 않는다.

그래서 데이터에 관한 새로운 개념이 요구된다. 빅데이터 시대에 있어 데이터는 최소한 세 가지 속성을 갖는 것으로 생각된다.

첫째, 의도성이다. 데이터는 묘사(description)이다. 객체나 사건은 목적이나 의도 없이 존재할 수 있지만, 그것에 대한 묘사는 결코 그럴 수 없다. 묘사는 관찰의 결과이고, 객체나 사건에 대한 관찰은 반드시 누군가의 의도에 따라 이루어 지기 때문이다.

둘째, 고비용이다. 데이터가 생성되기 위해서는 누군가가 데이터의 수집을 기획하고 설계해야 하며, 그런 다음 사람이나 기계에 의해 데이터가 수집되고, 그 데이터는 정제된 후 데이터셋 혹은 데이터베이스로 구축된다. 데이터의 규모가 커지만 그것의 수집, 저장, 처리, 분석에 막대한 비용이 소요된다.

셋째, 기계 의존성이다. 데이터의 규모가 크면, 사람에 의해 수집되거나 처리되지 않는다. 빅데이터의 수집, 전송, 저장, 그리고 심지어 분석마저도 예외 없이 기계적으로 이루어진다. 그 과정에서 인간이 끼어들 여지가 별로 없다.

big data 이미지 검색결과"

그런데 위 세 가지를 데이터가 아니라 정보의 속성이라고 주장한들 무슨 문제가 있겠는가. 어쩌면 그것은 유용성을 가지고 데이터와 정보를 구분짓던 DIKW 모형이나 지식기반의 정보이론이 빅데이터 환경에 적합하지 않음을 의미할 수 있다.

만약 정보와 데이터가 서로 넘나들 수 있는 유사 개념으로 간주된다면, 그것을 연구하는 학문 분야를 정보사회학이라고 부르던 데이터사회학이라고 부르던 무슨 차이가 있겠는가. 그런 경우 새로운 학문 분야를 만들기 보다는 이미 제도화 과정에 있는 정보사회학의 영역을 확장하는 것이 낫지 않을까? (2020-01-20)