이와 같은 여론조사의 실패는 우리나라에서도 예외가 아니다. 지난 4·13 총선에서 여론조사기관들은 새누리당이 제1당을 차지할 것으로 예측했다. 그러나 결과는 야당의 압승으로 여소 야대의 국회가 구성되었다.
이처럼 최근 들어 여론조사의 예측이 매우 빈번하게 빗나가고 있다. 특히 전 세계인의 시선이 쏠렸던 미국 대선과 브렉시트 찬반 투표에서 예측에 실패하면서, 일부 전문가들은 ‘고전적인 여론조사가 종말을 맞았다’고 평하기도 했다. 이는 일부 언론 및 여론조사 기관의 실수가 아니라 복잡해진 사회와 피조사자들의 인식 변화가 여론조사의 기반을 근본적으로 흔들고 있다는 것이다.
이러한 실패의 공통적인 원인 중 하나로 ‘숨은 표’의 문제가 있다. 자신의 이익을 위해 투표한 것을 부끄럽게 여겨 여론조사에는 제대로 응답하지 않는 숨은 표들이 있는 것이다. 미국 대선에서는 ‘샤이 트럼프(Shy Trump)’, 영국의 브렉시트 찬반 투표에서는 ‘샤이 토리(Shy Tory)’로 불리는 이러한 집단은 ‘정치적 올바름’으로 표현되는 사회 미디어의 전반적인 의견과 자신의 의견이 다를 경우 침묵하는 경향이 있다. 이러한 경향에 의해 여론조사의 응답률이 낮아지거나 무당층(아무 정당도 지지하지 않는 층)이 실제보다 많게 집계될 수 있다. 그러나 이러한 표들은 투표 당일에 자신의 실제 지지 후보에 대한 강한 결집력을 보였다. 특히 세계 경제가 전반적인 침체기에 빠지다 보니, 여론조사와 달리 실제 투표에서는 사회적 평판보다 자신의 경제적 이익을 1순위로 두는 경향이 많아진 것으로 보인다.
이외에도 우리나라의 여론조사 경우에는 해외와는 다른 특수한 문제들이 많다. 먼저, 집 전화에서 휴대전화로의 주요 통신수단 변화가 여론조사를 어렵게 하고 있다. 기존의 여론조사 방식은 집 전화를 주로 이용했다. 그러나 최근에는 집 전화 없이 휴대전화만 사용하는 가정이 늘어나고 있고, 여론조사가 주로 진행되는 시간대에 집에서 전화를 받을 수 있는 집단과 그렇지 못한 집단의 차이도 벌어지고 있다. 이에 국내에서도 휴대전화 여론조사 방식을 도입했으나, 개인 정보 보호, 응답률 저하, 지역 및 연령 등에 대한 보정의 어려움과 같은 문제점이 아직 많다.
응답률의 문제도 심각하다. 응답률이 낮다는 것이 표본이 작다는 것은 아니다. 2,000명 조사에 응답률이 5%라면 100명만이 응답했다는 것이 아니라 2,000명을 조사하기 위해 40,000명에게 전화를 건 것이다. 그러나 응답률이 어떠한 이유로 특정한 집단에서만 낮아진 것이라면 이는 문제가 될 수 있다. 여론조사의 적극적 응답층과 소극적 응답층의 특정 후보에 대한 지지 정도가 다르다면, 여론조사의 결과는 적극적 응답층의 응답을 따를 확률이 높다. 표본의 크기가 아닌 표본의 편향성의 문제가 생기는 것이다.
“무작위로 추출한 표본은 모집단을 따를 확률이 높다”라는 대수의 법칙은 현재에도 유효한 법칙이다. 그러나 매체의 다양화, 정치적 소극성, 투표율 감소 등과 같은 현대사회의 변화는 표본의 크기가 아닌 표본의 무작위성을 위협하고 있다.
이에 이러한 문제점을 해결할 수 있을 것으로 예상되는 대안들이 여럿 시도되고 있다. 인공지능을 통해 SNS의 빅데이터를 분석하는 방법으로 트럼프의 당선을 예측하기도 했고, 특정 기간 구글에서의 검색어 인기도를 분석하는 방식인 ‘구글 트렌드’가 브렉시트 결과를 맞히는 데 성공하기도 했다. 이러한 신기술들이 현재의 여론조사를 대체할 것이라고 주장하는 의견도 있었다. 그러나 이들은 아직 검증되지 않았고, 수집된 데이터의 호감과 비호감, 지지와 반대를 어떠한 기준으로 나눌 것인지에 대한 문제가 아직 남아있다. 이러한 점에서 많은 전문가들이 빅데이터 및 인공지능 등과 여론조사가 서로 상호보완적으로 발전해 나가야 할 것이라고 주장하고 있다.
저작권자 © 포항공대신문 무단전재 및 재배포 금지