[기자수첩] 여론조사가 틀리는 이유 ⑤

최근 대두되고 있는 ‘빅데이터 기반 여론조사’ 구글 트렌드, 여론조사 대체재로 적절한가? 데이터 과학자들, “1차원적 단순 총합은 무의미”

최근 기존 여론조사의 부정확성으로 인해 ‘빅데이터 기반 여론조사’가 대두되고 있다. 2016년 미국 대선에서 모든 미디어가 민주당 힐러리 클린턴 후보의 당선을 예측했으나, 구글 트렌드만은 공화당 도널드 트럼프 후보의 당선을 예측했다는 이유로 각광받기 시작한 것이다. 그러다 지난 2020년 치러진 미 대선에서는 트럼프 당시 대통령의 구글 검색량이 더 많았음에도 불구하고 반대의 결과가 나오면서 ‘빅데이터도 별수 없다’는 평이 나왔다.

2020년 9월30일~10월29일, Trump, Biden 검색량/출처=구글 트렌드

구글 트렌드를 이용한 여론조사의 한계

지난 2020년 10월 구글 트렌드 기준 ‘Trump’와 ‘Biden’ 검색 쿼리 숫자를 보면 트럼프 전 대통령에 대한 검색량이 월등하게 많았음을 확인할 수 있다. 만약 구글 트렌드가 적절한 여론조사 대체재라면 박빙 수준의 지지율을 그래프로도 확인할 수 있어야하지만, 위의 그래프만 놓고 보면 트럼프 전 대통령의 재선이 확실해 보인다.

사실 검색량은 대표성이 매우 낮은 정보다. 1924년부터 1932년까지 여론조사로 3번 연속 당선자를 예측했지만, 1936년 1,000만 명에게 여론조사 엽서를 보낸 이후부터는 예측 실패를 경험했던 ‘리터러리 다이제스트’ 사례와 동일한 맥락에서, 적절한 표본을 추출하지 못한 상태에서는 수백만 명에게서 설문을 받아도 실제 선거 결과와 일치할 가능성은 낮다.

위의 검색 총량 정보도 마찬가지다. 투표처럼 1명이 1번씩만 검색한다면 적절한 표본이 될 수 있을지 몰라도 1명이 수십번, 수백번을 매우 짧은 시간 안에 검색할 수 있는 가능성을 따져볼 때, 또 구글 검색 이외에 다른 채널로 정보를 얻어가는 비율이 적지 않음을 감안할 때, 대표성이 떨어지는 만큼 최소한 여론조사 대체재로는 부적절한 정보라 할 수 있다.

2020년 9월30일~10월29일, Trump, Biden 검색량/출처=구글 트렌드

위의 구글 트렌드 정보에 따르면 같은 기간 검색 쿼리량 기준으로 ‘Trump’ 키워드 검색량이 가장 많았던 곳은 미 서부 지역이다. ‘반(反)트럼프’ 정서가 강한 탓에 트럼프 대통령이 아예 선거 유세도 가지 않은 지역들에서 이렇게 압도적인 키워드 검색량이 나온다는 이유로 선거 승리를 예측할 수 있을까?

이처럼 검색 버즈량이 많다는 이유로 무조건 지지율이 높다고 이야기할 수도 없는 노릇이다. 특정 정당, 특정 후보에 대한 검색량이 많다고 해도 그 검색의 이유가 부정적인 여론에 대한 확인, 혹은 성적인 논란과 같은 강하게 사람들을 끌어들이는 이슈였다면 유의미한 지지율 정보로 볼 수 없을 것이다.

2020년 9월30일~10월29일, Trump, Biden 검색량/출처=구글 트렌드

빅데이터 분석, 여론 조사 대체할 수 있을까?

위의 구글 트렌드는 선거 기간 중 ‘Biden’의 연관 검색 키워드 목록을 뽑은 것이다. 우측의 연관 키워드 목록을 보면 바이든의 자녀인 헌터 바이든의 노트북 하드디스크에 담겨있던 각종 사진들이 매우 지저분한 성 추문과 연관되어 있었음이 그대로 드러나 있다. 즉 연관 키워드를 통해 단순히 검색량의 많고 적음뿐만 아니라 검색의 원인까지 확인할 수 있는 것이다.

검색량 그 자체도 대표성이 없는 정보인 데다 연관 키워드를 함께 분석해도 지지율에 대한 합리적인 추론이 불가능한 정보인 만큼 구글 트렌드가 여론조사를 대체할 수 있다는 논리에는 비약이 많다.

이에 따라 데이터 과학자들은 1차원적인 단순 총합을 보는 것은 더 이상 무의미하다는 지적을 내놓는다. 최호용 카이스트 기술경영대학원 교수는 “여론조사뿐만 아니라 많은 현실 문제들이 다차원의 복합요인에 의해 움직이고, 결과값도 다양한 형태로 나타나는 만큼 빅데이터 분석이라고 해 놓고 단순히 많은 데이터를 요약 정리하는 방식으로는 효과적인 정보 추출이 불가능하다”고 지적했다.

지난 7일간 ‘대통령’ 연관 키워드 네트워크/출처=파비 데이터 사이언스 연구소

빅데이터 여론 분석 전문 기관인 데이터 사이언스 경영 연구소(MDSA R&D)에서는 50~100개 키워드가 어떤 방식으로 연관되어 있는지 볼 수 있도록 키워드 네트워크에 기반한 빅데이터 분석을 제공한다. 네트워크 차트 제작 코드를 설계한 데이터 과학자에 따르면 “문장도 여러 단어가 결합되어 완성되는 것처럼 각각의 키워드 역시 절대 단독으로 생산, 소비되지 않는다”며 “키워드 간 거리, 연결된 키워드와의 정보 공유 형태 등을 종합적으로 봐야 진정한 빅데이터 여론 분석”이라고 지적했다.

여론조사를 빅데이터 분석으로 대체할 수 있는 시점이 조금씩 다가오는 것은 분명해 보인다. 그러나 아직까지 완벽한 대체재는 없다는 것이 학계와 업계의 공통적인 의견이다.

Similar Posts