[기자수첩] 여론조사가 틀리는 이유 ⑧

케임브리지 애널리티카, 페이스북 정보로 선거 이끌어 광고 타겟팅 방식이 여론 조작에 미치는 영향 성별, 지역, 연령 정보만으로는 부족한 여론 조사의 정확도

사진=Cambridge Analytica

2016년 미 대선에서 케임브리지 애널리티카(Cambridge Analytica)는 페이스북 유저들이 올려놓은 개인 정보와 ‘좋아요’ 클릭 여부 등의 정보를 바탕으로 개개인별 프로필을 작성한 다음 그 프로필에 맞는 후보자 정보를 뿌리는 방식으로 선거 캠프 활동을 이끌었다. 영국 명문 케임브리지 대학의 수학 교수진 3명이 창업한 케임브리지 애널리티카는 수학계에 널리 알려진 키워드 분석, 네트워크 분석 등의 고급 수학 방법론을 이용해 유권자들의 선호를 선별하는 데 활용했던 것으로 알려졌다.

2016년 대선에서 참패한 미 민주당이 주도한 상원은 페이스북 CEO인 마크 저커버그를 청문회에 세우고 케임브리지 애널리티카에 정보 판매 의혹, 트럼프 대통령과의 비밀 협업 의혹 등을 지적했으나, 페이스북 보안 문제에 대한 헤프닝으로 종결됐다. 이후 케임브리지 애널리티카는 이어진 세무조사 등으로 폐업 절차를 밟기도 했으나, 청문회 당시 페이스북 CEO에게 했던 상원의원들의 질문 수준이 대단히 조잡해 IT업계에서는 정치인들의 무지에 대한 조롱거리 주제로 한동안 사용되기도 했다.

여론 조사? 여론 조작?

데이터 과학자들에 따르면 케임브리지 애널리티카의 선거 유세 지원 방식은 실제로 온라인 광고 타겟팅 서비스 업계에 널리 퍼져 있는 ‘성향 타겟팅(Psychographic targeting)’ 방식이다. 성향 타겟팅은 유저들의 행동 양식 정보를 바탕으로 개인별 성향을 여러 개의 인덱스로 정리하고, 인덱스 정보에 맞춘 광고 메시지를 내보내는 방식으로 광고를 집행한다.

온라인 광고지면 판매 시 구매측에 제공되는 유저 정보/출처=OpenRTB, Swiss Institute of Artificial Intelligence

구글의 현재 광고 타겟팅 방식과 유사한 포맷을 활용하는 OpenRTB에서 제공한 광고지면 구매 대상 공개 정보를 살펴보면 사용자별로 인종, 종교, 질병, 정치 성향, 식습관 등에 대해 매우 자세한 정보가 정리되어 있음을 확인할 수 있다. 업계에 따르면 위와 같은 정보를 설문조사 등으로 파악한 것이 아니라 개인 활동 정보들을 모아 특성을 역추적해 만든 일종의 확률 게임 기반 정보라고 한다. 이를 통해 개인정보 침해 이슈마저 피해 가는 것이다.

이렇게 분석 및 정리된 개인 성향을 이용해 개개인 별로 최적화된 광고를 보여줌으로써 구글, 페이스북 등의 글로벌 최상위권 IT업체들은 고액의 마케팅비를 받게 되고, 같은 논리로 정치 프로파간다를 개개인 맞춤형으로 공급할 수 있다.

법제처 행정사무관으로 재직 중인 문의빈 법학 박사의 ‘플랫폼의 불법촬영물 유통방지의무에 대한 헌법적 연구-유럽사법재판소의 최근 판결을 중심으로’에 따르면 유럽에서는 위와 같은 여론 유도 행위를 여론 조작 여지가 있다고 판단하는 것으로 알려졌다.

여론조작의 전문화인가? 정치 활동의 고급화인가?

이전 세대의 여론 조작은 가짜 뉴스 등을 통해 거짓 소문을 퍼뜨리는 경우가 대부분이었다. 그러나 최근 들어서는 여론조사 결과마저 의뢰자의 입맛에 맞게 조작된 것이 아니냐는 의문이 제기될 정도로 정교해졌다. 위의 미국 사례와 유럽사법재판소의 판결은 가까운 시일 내에 인터넷 광고업이 여론 조작에 쓰일 수도 있음을 시사하는 것과 같다.

여의도 관계자는 “이미 비슷한 도전을 오랫동안 해 왔으나, 케임브리지 애널리티카 수준의 고급 수학 분석을 활용하지 못했을 뿐”이라며 “유권자에게 적합한 메시지를 보내는 것은 정치 활동 중 하나일 뿐, 여론 조작은 아니다”라고 선을 그었다.

빅데이터 전문 여론 분석 업체 ㈜파비의 주장에 따르면 “정치인 개인별로도 다양한 상황에 대해 다양한 의견이 있을 수 있다”며 “성향 타겟팅이 활성화되면 오히려 일부 문구만을 트집 잡아 음해 공격을 하는 정치적 악습을 없앨 기회가 될 것”이라고 반박했다.

전문가들도 여론조사가 개인의 성향을 모두 반영하지 못하는 상황에서 연령, 지역, 성별이라는 단순 정보만으로 지지 후보를 정하는 것은 부적합하다고 지적해왔다. 아울러 다양한 특성을 갖춘 유권자들에 맞춰 성향 타겟팅과 같은 방식으로 미세 조정을 하는 것 자체는 정치 활동의 고급화이지 여론조작의 전문화가 아님을 인정했다. 즉 ‘여론조작’이라는 판단이 내려지기 위해서는 가짜 뉴스 등을 통한 거짓 정보가 제공되어 유권자들의 결정을 왜곡했다는 근거가 있어야 한다는 것이다.

또한 20·30 세대에 이어 현재의 10대가 유권자가 되는 시대가 오면 연령, 지역, 성별에 의존하는 기존의 여론조사가 더더욱 부정확해질 것이라는 의견들이 나왔다. 다양성(Heterogeneity)를 인정하고, 거기에 맞는 여론조사가 실시되기 위해서는 거꾸로 성향 타겟팅에 대한 이해도가 깊은 고급 여론조사를 만들어 낼 수 있어야 한다는 의미다.

Similar Posts