사회통계(5): 변수, 분석단위, 그리고 측정

[문제 1]  직업, 성별, 종교, 댓글(수), 좋아요(수), 회원탈퇴 고객(수), 투자액 등의 공통점은 무엇일까?

[문제 2] 데이터 수집 단위(unit of data collection)와 분석 단위(unit of an alysis)는 어떻게 다른가?

[문제 3] 남녀간의 사랑은 측정될 수 있을까?

[문제 1]에 대한 답은 변수(variable)이다. 우리가 주목하는 현상 혹은 사건을 변수라고 한다. 그 현상이나 사건이 변하기 때문이다. 변하지 않는 현상(상수, constant)는 우리의 관심 대상이 아니다. 우리는 현상이나 사건이 어떻게 변하는가를 탐구한다. 그것의 패턴을 찾아내고, 그것이 다른 변수(들)와 갖는 관계를 발견하려고 한다.

사회분석을 하려면 데이터가 있어야 한다. 데이터는, 설문조사 데이터처럼 연구자에 의해 수집되기도 하고 POS나 센서 데이터처럼 기계적으로 수집되기도 한다. 설문조사의 경우 데이터 수집 단위(대상)가 개인(들)일 수도 있고 기업처럼 사회조직(들)일 수도 있다. 소매점의 경우 POS 데이터는 데이터 수집 단위가 개인(고객)이다.

수집된 데이터가 분석될 때는 먼저 분석 단위가 결정되어야 한다. 분석 단위란 연구자가 분석하려는 대상을 말한다. 세상에는 연구자의 관심만큼이나 다양한 종류의 분석 단위가 존재한다. 그것은 개인일 수도 있고, 조직이나 커뮤니티일 수도 있으며, 국가(나라) 혹은 지역일 수도 있다. 뿐만 아니라 웹페이지의 클릭 스트림(click stream), SNS의 친구관계, 판매된 상품, 신문의 사설 혹은 기사 등도 분석 단위가 될 수 있다.

위 사진은 치맥집이다. 치맥집에 대해 사회조사를 한다면 치맥집(들)이 분석 단위가 될 수도 있고 고객(들)이 분석 단위가 될 수도 있다. 만약 연구자의 관심사가 고객들의 소득, 나이, 직업, 성별, 주량, 안주 선호, 친구 어울림 방식(혼술, 집단 크기 등), 지출 등이라면 분석 단위는 개인(고객)이 될 것이고, 만약 연구자의 관심사가 손님 수, 남녀 고객 비율, 총매출, 병맥주 판매량, 생맥주 판매량, 치킨 판매량, 수익, 위치, 규모 등이라면 분석 단위는 레스토랑이 될 것이다. 고객의 지출과 레스토랑의 매출은 분석 단위가 다르지만 둘 다 POS 데이터를 사용할 것이다.

연구자는 먼저 자신의 연구 관심에 따라 분석 단위를 먼저 분명하게 파악하고, 그에 맞추어 데이터를 수집하거나 조정해야 한다. 때로는 수집된 데이터를 분석 단위에 맞게 조정하기가 불가능한 경우도 있다.

특히 사회 집단 단위에서 수집된 데이터는 개인 단위 분석에 사용될 수 없다. 만약 그렇게 사용될 경우 소위 생태학적 오류(ecololgical fallacy)에 빠지게 된다. 예컨대 치맥집 단위로 수집된 데이터를 볼 때 고객 중 남성 비율이 높은 치맥집들에서 병맥주 판매 비중이 크다고 해서 그 데이터로부터 남성은 생맥주보다 병맥주를 선호한다고 추론할 수는 없다. 남성 고객의 비중이 큰 치맥집에 온 여성 고객들이 병맥주를 많이 마셨기 때문에 병맥주 판매량이 많을 수도 있지 않겠는가.

[문제 3]에 대답은 그렇다이다. 남녀간의 사랑은 측정될 수 있다는 말이다. 실제로 연인이나 부부는 애인의 사랑, 배우자의 사랑을 측정하는 나름의 척도를 가지고 있다. 사랑한다는 말을 얼마나 자주 하는 지, 스킨쉽을 얼마나 자주 하는 지, 사랑스런 눈길을 얼마나 자주 보내는 지, 문자를 얼마나 자주 보내는 지, 문자 메시지에 얼마나 신속하게 답변 하는 지, 전화를 얼마나 자주 하는 지 등등 다양한 척도나 지표를 가지고 상대방의 사랑의 강도를 판단한다.

측정(measurement)이란 현상이나 대상의 변화에 수치를 부여하는 작업이다. 무게, 높이, 길이, 부피, 밀도 등 물리적 측정도 있고, 폭동, 혁명, 범죄, 불평등 같은 사회적 측정도 있으며, 분노, 사랑, 무관심, 자존감 같은 심리적 측정도 있지만, 측정은 공통적으로 현상을 수치화(quantify)한다.

계량적 사회연구가 가능하려면 연구자가 관심을 갖는 사회 혹은 사회심리 현상, 즉, 변수를 측정한 데이터가 있어야 한다. 사회통계학은, 연구자가 변수(들)을 측정한 데이터로부터 사회적(혹은 사회학적)으로 의미 있는 패턴을 찾거나 관계(그것을 사회적 규칙성, social regularities라고 부른다)를 발견하는 도구이다. (윤영민, 2017-08-15)

답글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다