인터넷 조사의 기초(강의 노트)

우리는 수시로 인터넷에서 무언가를 찾는다. 심심풀이로 하면 검색(search)이고, 과제나 업무로 하면 조사(research)이다. 인터넷 검색과 조사는 우리의 일상이 되었다.

search-vsresearch-pptx-1-638

검색을 할 줄 모르는 인터넷 사용자는 없다. 그러나 조사를 제대로 하는 인터넷 사용자는 생각보다 드물다. 인터넷이 지닌 영향력을 고려할 때 초등학교 고학년이면 마땅히 인터넷 조사 능력을 갖추어야 한다. 그런데 우리나라에 인터넷 조사를 제대로 할 줄 아는 대학생이 얼마나 될까? 그 동안 대학생들을 가르친 경험으로 미루어 볼 때 아주 소수만이 ‘네트워크 리터리시(network literacy)’를 갖추고 있다. 인터넷 조사에서 기초적이면서 중요하다고 생각되는 몇 가지 지혜를 공유한다.

1. 조사 문제의 정의(definition)

무엇보다 먼저 무엇을 찾을 것인지를 잘 정해야 한다. 무턱대고 검색창부터 들어가지 말자.

bigstockphoto_Finding_Information_3385641

검색 엔진은 답을 주지 않는다. 오직 사용자 자신만이 답을 발견할 수 있다. 검색 엔진은 정보찾기 도우미일 뿐이다. 검색 결과를 답으로 오인하면 안된다.

검색 엔진은 사용자의 능력을 넘어서지 못한다. 검색 엔진은 미숙한 사용자가 찾으면 엉터리 정보를 내놓고, 능숙한 사용자가 찾으면 알짜 정보를 내놓는다. 미숙한 사용자와 능숙한 사용자의 차이는 조사 문제(research question)의 규정에 있다. 현명한 사람은 자기가 말하고자 하는 것이 무엇인지를 분명하게 알고 있다. 그래서 자신이 구하고자 하는 것이 무엇인지를 정확히 규정한다.

인터넷에서 무엇을 얻고 싶은가? 이에 관해 한 가지만 언급한다. 아이디어, 의견, 이론, 데이터 중 무엇을 원하는지 우선 그 점을 분명히 해야한다. 데이터가 필요한데 의견을 찾아서 인용하면 재앙이 된다. 이점에 관해서는 아래에서 다시 언급하겠다.

잊지 말자. 인터넷 시대에 현자(賢者, wise person)는 잘 대답하는 사람이 아니라 잘 묻는 사람이다.

2. 의심(doubt)

의심하고, 의심하고, 또 의심한다. 개인적으로 필자는 사람을 쉽게 믿는다(덕분에 자주 속고 산다). 그렇지만 인터넷 정보는 결코 믿지 않는다. 인터넷이, 아는 사람들 사이의 통신에서 다수의 모르는 사람들을 포함한 통신으로 바뀌면서 신뢰(trust)의 기초가 사라졌다.

Multiple question marks on paper

인터넷의 정신은 개방(openness)과 공유(sharing)이다. 인터넷은 누구나 자유롭게 말하고 정보를 공유하는 세상이다. 그러나 그 개방과 공유는 공짜로 얻어지지 않는다. 그것을 위해 신뢰(trust)–진실(truth)이라고 불러도 좋다–가 댓가로 지불되었다. 인터넷에서 인류는 국지적인 신뢰(parochial trust) 대신에 지구적인 개방과 공유(global openness and sharing)를 선택했다.

검색엔진을 통해서든 지인의 추천을 통해서든 인터넷에서 얻은 정보에 대해서는 무조건 의문을 제기하자. 통신공학적으로 표현하면, 걸러지지 않은 인터넷 정보는 잡음(noise)이다. 직설적으로 말하자면 쓰레기이다. 아무리 보물이 섞여 있어도 쓰레기는 쓰레기이다. 인터넷은 홍보(publicity), 선전(propaganda), 과장(overstatement), 오보(misinformation), 허위정보(false information), 역정보(disinformation), 농담, 헛소리 등으로 가득하다. 조사를 위해 인터넷 정보를 사용하려면 그러한 쓰레기 속에서 진실을 찾아내야 한다.

손에 쥔 정보가 누구에 의해, 어떤 목적으로, 어떻게 생성된 것인지, 누구의 손을 거쳐서 온건지, 그 과정에서 왜곡은 없었는지, 정보의 생산자는 신뢰할만한 사람(혹은 기업이나 기관)인지, 정보의 전달자는 신뢰할만한 사람(혹은 기관, 기업)인지, 어떤 의도가 숨어있는 자료는 아닌지, 데이터는 충분히 신뢰할만한 과정을 통해서 생성된 것인지 등을 따져야 한다. 인터넷에서 무료로 얻을 수 있는 정보는 많지만 비용없이 생성된 정보는 없다. 개인이든, 기업이든, 기관이든 비용을 투입할 때는 반드시 목적이나 이유가 있다. 목적이나 이유가 좋은 경우도 많지만 그 때문에 진실이 비틀릴 가능성이 있음에 유념해야 한다.

2. 거르기(Filter)

인터넷 조사에서는 효과적인 filtering이 핵심이다. 인터넷에서 진실을 찾고 싶은가? 그러면 걸러야 한다(filter). 우리가 찾는 진실–정보와 지식–은 신호(signal)라고 표현할 수 있인데, 그 신호는 반드시 수많은 잡음이 filtering이라는 절차를 거치고 난 후에야 정체를 드러낸다. 예외가 없다.

8431542191_cffc5fba27_z

정보를 거르는 방법이 많다. 정성적인 방법도 있고, 정량적인 방법도 있으며, 사회적인 방법도 있다.

정성적인 방법을 사용하기 위해서는 정보를 판별해야 한다. 정보 하나 하나에 대해 꼼꼼하게 진위를 따져야 한다는 말이다. 여기에 정도는 없다. 필자는 구글 검색 결과를 얻으면 적어도 상위 두 페이지의 목록에 든 웹사이트나 문건을 하나씩 신중하게 검토한다. 특정 검색엔진을 거론해서 그렇기는 하지만 필자는 네이버 검색을 사회 조사 용도로는 거의 사용하지 않는다. 유용한 신호가 적을 뿐 아니라 잡음 대 신호비가 너무 낮다.

정보를 엄선하는 또 하나의 방법은 관계를 통해서이다. 신뢰할 수 있는 사람, 기관, 단체 혹은 기업과 관계를 맺고 그들의 선택에 도움을 받는다. 신뢰할만한 개인 혹은 집단과 정보를 나눌 수 있으면 filtering이 우수하고 빨라진다.

관계 중 최상위에는 대학도서관이 있다. 대학도서관의 교외접속을 이용해서 온라인 데이터베이스를 검색한다(국가전자도서관을 통해서도 유사한 서비스를 받을 수 있다). 대학이 유료로 구독하는 전문 저널, 잡지, 책, 웹사이트는 1차로 전문가들에 의해 걸러진 자료이다.

스크린샷 2016-05-23 15.41.35

유용하며 신뢰할 수 있는 정보를 제공해주는 블로그도 적지 않다. 다만 블로그는 워낙 그 수준과 목적이 다양하니 잘 선별해서 활용해야 한다. 다행히 각 분야에는 신뢰할만한 블로그들의 널리 알려져 있어 비교적 쉽게 찾을 수 있다. 개인 뿐 아니라 기관, 단체, 혹은 기업의 블로그에서도 유용한 정보를 얻을 수 있다. Filtering의 부담이 크다는 것이 약점이다.

빅데이터 시대가 되면서 정량적인 방법도 filtering에서 효과적이다. 다만 아직까지 비전문적인 개인이 빅데이터 분석 방법을 사용하기는 쉽지 않다. 빅데이터 분석 서비스를 제공하는 웹사이트를 이용하면 트렌드를 파악하는 정도의 정보는 간편하게 얻을 수 있다.

대학생들에게 조사를 시켜보면 가장 흔히 활용하는 것이 언론 보도이다. 때문에 그에 대해 특별한 언급이 필요하다. 학생들이 검색 사이트의 ‘지식인’에 의존하지 않는 것만 해도 어찌보면 다행이다. 그런데 인터넷상에서 얻어지는 언론 보도는 그야말로 지뢰밭이다.

종이신문 시대에는 언론사가 filtering의 수고를 대신해주었다. 그것이 종종 세상이 왜곡되어 비쳐지는 과정이기도 했지만 일반인들이 효율적으로 정보를 얻는 방법이었다. 그 때는 한 마디로 언론사를 선택하면 되었다. 그런데 안타깝게도 오늘날 그러한 방법은 더 이상 통하지 않는다. 과연 우리가 믿을 수 있는 언론사가 몇 개나 될런지 모르겠다.

언론 보도는 홍보자료(press release), 보도 기사(news article), 피처 기사(feature article), 심층 기사(investigative report), 광고, 홍보성 기획기사(special feature article), 의견 기고(opinion column), 사설(editorial) 등 매우 다양한 유형의 기사를 포함하고 있다. 이 중 사회조사에 활용될만한 가치가 있는 것은 보도 기사와 심층 기사 정도이다. 사실 그것마저도 근래에는 기업이나 기관의 홍보와 섭외를 통해서 작성되거나 왜곡되는 일이 빈번하기 때문에 부주의하게 인용해서는 안된다.

홍보성 기사를 판별할 때 필자가 쓰는 체크 리스트는 아래와 같다. 참고하기 바란다.

1) 신뢰할만한 언론사의 보도인가? 그것은 아직 유효한 판단 기준이다. 그러나 그것은 하나의 기준일 뿐이다.

2) 한 기업이나 기관에 관해서만 작성된 기사인가? 그런 경우 정말 대단한 뉴스 가치가 있는 내용이 아니라면 홍보성 기사로 간주한다.

3) 기업이나 기관이 내놓은 보도자료를 찾아보거나 2-3개의 언론사의 보도를 비교해 보면 홍보성 기사 여부를 판단할 수 있다. 보도자료에 의존한 기사인 경우 작성자는 달라도 기사의 내용과 형식이 거의 일치한다.

4) 동일한 주제에 관해 전문 저널 검색을 한다. 그 검색 결과와 해당 신문 기사를 비교해 보면 홍보성이 드러난다.

필자가 가르치는 수업의 보고서나 발제에는 언론 보도의 인용을 전혀 허용하고 싶지 않다. 하지만 몇 가지 현실적인 이유 때문에 언론보도의 인용을 눈감아 주고 있다. 조사 자료로 사용하려면 학생들이 최소한 홍보성 기사는 걸러내야 할 것이다.

기관이나 기업의 홍보 자체가 잘못된 것은 아니다. 다만 홍보를 위해서 진실을 희생시키는 경우가 아주 많기 때문에 세심한 filtering이 요구된다. 조사의 실마리를 얻는 정도에서는 홍보성 기사를 써도 무방할 것이다. 그러나 그 경우 그것은 조사의 출발점이어야 하지 조사의 종착점이어서는 결코 안된다.

언론에서 흔히 사용되는 전문가 인터뷰는 매체에서는 기사의 주장을 뒷받침하는 방법으로 인정받지만, 학문의 세계에서는 과학적으로 수집된 자료에 의해 뒷받침되지 않은 전문가의 발언은 검증되지 않은 가설에 지나지 않는다. 보고서 작성이나 발제에 있어 신문 사설이나 전문가의 컬럼 혹은 인터뷰의 인용을 삼가하자. 그것들은 대체로 주장만을 담고 있지 과학적 근거를 제시하지 않는다. 대개의 경우 증거라고 해봐야 자의적으로 선정된 사례 몇 개일 뿐이다. 가설(자신의 주장)을 가설(전문가의 주장)로 입증할 수는 없다.

how-to-keep-up-with-almost-everything-13-728

몇몇 학생들은 보고서나 발제에 저널 논문을 인용하고 있다. 아주 고무적이고 칭찬할만한 행동이다. 사실 대학도서관의 온라인 저널 데이터베이스를 검색하는 것은 인터넷에서 언론보도를 filtering할 때의 수고를 없애준다. 그런데 저널 논문이라고 할 지라도 인용하기 위해서는 언론 기사 못지 않게 꼼꼼하고 정확하게 읽어야 한다. 학생들의 인용 내용을 보면 인용한 논문을 진짜 읽었는지 의심스러울 때가 많다. 논문의 내용을 잘못 인용하는 경우가 적지 않고 심지어 원저자의 주장에 반하는 방향으로 인용하는 경우도 있다.

저널 논문에 포함된 자료(data)에는 가공 자료, 분석  결과, 그리고 인용 자료가 있다. 원시 자료(raw data)가 논문에 제시되는 경우는 아주 드물다. 논문의 표나 그림은 가공 자료인데, 그것을 인용할 때는 원 연구의 맥락을 충분히 존중해야 한다. 그리고 논문에 인용된 자료를 재인용할 때는 더욱 주의해야 한다. 재인용은 하지 않는 것이 바람직하지만 꼭 재인용해야 한다면 반드시 원 자료를 찾아서 확인하고 해야 한다.

학생들이 늘 시간에 쫓긴다는 점은 이해하지만 그렇다고 대충 얼기설기 메꾸는 식의 보고서 작성이나 발제가 결코 용인될 수 없다. 그것은 대학에 와서 자신을 성장시킬 기회를 스스로 포기하는 행위이다. 교육에 있어 컨텐츠의 전달보다 중요한 측면은 학생의 정신적 성장이다. 대학을 다니거나 졸업했는데 자신의 주장 하나 변변하게 못하는 사람이 어떤 일을 할 수 있겠는가? 전공을 불문하고 말이다.

대학에서든 일상에서든 좋은 주장은 발상이 신선하고 관점이 좋아야 하지만 그 이상으로 그것은 논리적이고 실증적이어야 한다. 즉, 주장이 논리적으로 앞뒤가 맞아야 하고, 객관적인 자료(data)에 의해 잘 뒷받침되어야 한다는 의미이다.

바쁜데 꼭 그렇게까지 꼼꼼하게 조사를 해야하나 라는 의구심을 갖는 사람이 있을 것이다. 그러나 인터넷 덕분에 사회조사가 얼마나 편해졌는지를 생각하기 바란다. 만약 인터넷이 없었다면, 엄청난 발품을 팔아야 자료를 얻을 수 있었을 것이다. 자료를 찾기 위해서는 도서관을 전전하고, 기관, 단체, 기업, 심지어는 개인을 찾아가서 사정해야 했을 것이다. 인터넷 시대 이전에는 간단한 자료를 얻기 위해서 다른 도시는 말할 것도 없고, 외국에 출장을 가야하는 경우도 흔했다.

지금은 기껏해야 클릭 몇 번이면 원하는 자료를 손에 넣지 않는가. 그러니 불평말고 filtering을 꼼꼼하게 하자. 그것은 인터넷으로 사회조사를 할 때 우리가 반드시 지불해야 하는 일종의 자료수집 비용이다. 그렇지 않으면 우리는 결코 ‘자료’를 구할 수 없다. ‘쓰레기’만 손에 넣을 뿐이다.

답글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다