조재목 에이스리서치 대표·선관위 선거여론조사 공정심의위원
여론조사를 올바르게 이해하려면 조사의 오차 요인, 혹은 표본의 크기에 대한 이해가 있어야 한다. 여론조사에서 쓰는 표본은 모집단을 잘 섞어서 무작위로 뽑아낸 것일 뿐이다.
따라서 표본오차는 항상 존재한다는 사실을 알아야 한다. 최근 선관위가 문제시한 집 전화 착신 전환 사건은 표본의 특성을 왜곡하는 것이고, 이는 여론의 왜곡을 의미하는 것이기 때문에 심각성이 크다.
예컨대 어떤 여론조사 기관이 서울시장선거 여론조사에서 1000명을 조사한 결과 A 후보가 30%, B 후보가 26%, C 후보가 20%의 지지율이고 표본오차는 95% 신뢰수준에 ± 3.10% 포인트로 나타났다고 가정하자. 이는 조사를 100번 했을 때, 오차범위 내(6.2% 범위)의 확률이 95번이고 5번 정도는 우연히 그 이외의 결과가 나올 수 있다는 뜻이다.
다시 말해 A 후보의 경우 30%를 기준으로 26.9 ~ 33.1%의 지지율을 얻을 가능성이 95%라는 뜻이고 B 후보는 26%를 기준으로 22.9 ~29.1% 내에 있다는 의미다. 결국 A 후보와 B 후보는 오차범위 내에 있기 때문에 A 후보가 B 후보보다 4% ‘높다’라는 것은 잘못된 표현이며 이 경우 ‘오차범위 내 접전’으로 봐야 한다.
따라서 유권자들은 표본의 크기와 오차, 조사방법 등을 감안해 여론조사 결과를 읽어야 한다. 또 후보 입장에서는 여론조사를 볼 때 표본의 크기와 조사방법은 물론이고, 조사 일시와 세부 질문 내용 등을 고려해 자신의 객관적 위치 점검과 현 상황 파악에 집중해야 한다.
조사 방식의 정확성에도 유념해야 한다. 최근 편리하고 비용이 저렴하다는 이유로 자동응답시스템(ARS) 조사 방식이 많이 사용된다. ARS 방식은 기본적인 모집단의 인구통계학적 특성을 제대로 반영하지 못하기 때문에 응답한 샘플의 인구특성에 가중치를 부여해 그 단점을 보완한다. 젊은 층의 응답률이 낮을 경우 젊은 층 응답자 1명의 응답을 3명의 응답과 같은 값(300%)으로 반영하고, 상대적으로 응답률이 높은 60대 이상의 경우 1명의 응답을 2분의1명 응답과 같은 값(50%)으로 반영하는 식이다. 하지만 이는 모집단 속성의 왜곡을 낳을 가능성이 있어 정확도가 훼손될 수 있다.
최근엔 이런 단점들을 보완할 수 있는 발전된 방식으로 ‘CATI’(Computer Assisted Telephone Interviewing)가 대두했다. 모집단의 특성을 제대로 반영하면서 소수 표본을 통해 여론을 측정하는 방식으로 주목받고 있다.
면접원이 직접 컴퓨터 시스템을 통해 전화를 걸고 여론조사 대화 내용을 직접 키보드를 통해 입력함으로써 정확도를 최대화하는 것이다. 즉 컴퓨터 시스템으로 설문방법을 표준화함으로써 면접원 간 설문방식의 오차를 최소화하는 것이다. 조사와 동시에 녹취가 이루어짐으로써 의혹의 범위를 줄이고 검증의 기회를 확대함으로써 공정성이 한층 보장됐다. 향후 선거 여론조사는 이처럼 오류를 많이 포함하고 있는 ARS 방식보다 정밀한 조사방식이 많이 도입돼야 한다.
2014-04-18 31면