[기자수첩] 여론조사가 틀리는 이유 ①

국민의힘 당 대표 선출을 위한 여론 수렴 방식 설왕설래 여론조사는 틀리고 출구조사는 맞다? 집략추출법 VS 계통추출법 역선택 방지할 수 있는 여론 수렴 방식 도출해내야

최근 국민의힘 이준석 대표가 성추문에 휩쓸리다 당원권 정지에 이어 제명 절차까지 거론되면서, 국민의힘 당 대표 선출 시 여론 수렴 방식으로 채택된 ‘당원 50%, 여론조사 50%’라는 조건에 대해 설왕설래가 오가고 있다.

특히, 여론조사 50%가 국민 여론을 50% 반영하겠다는 기존의 취지와는 달리 실제로는 더불어민주당 지지자들의 선호가 강하게 반영된, 이른바 역(逆)선택을 낳는 절차라는 비난이 강하다. 이론적으로는 국민 여론이 약 50%씩 좌, 우파로 나뉜 상태에서 기존의 제도는 당원 50%와 국민의힘 지지자 25%, 더불어민주당 지지자 25%의 지지성향이 반영된 선출과정이어야 한다.

그러나 한 쪽에서는 ‘더불어민주당 지지자들이 과연 국민의힘 당내 경선에 관심이 있을까?’라는 의문을 제기하면서 실제 여론조사에서도 대부분 국민의힘 지지자들만 응답할 것이라는 의견을 제시하고, 다른 한쪽에서는 더불어민주당 지지자들이 악의적인 생각으로 국민의힘의 쇠망을 위해 전략적으로 여론조사에 응할 것이라는 주장도 있다.

표본 편향에 노출된 여론조사

통계학에서는 이런 경우를 ‘표본 편향(Sample bias)’이라고 부른다. 자연과학처럼 완벽히 통제된 실험실에서도 실험자가 몰랐던 사건이 뒤에서 벌어진 탓에 엉뚱한 실험 결과가 나오는 일이 종종 있는데, 완벽한 통제가 불가능한 사회과학 현상, 특히 이익 추구를 위해 다양한 종류의 암투가 벌어지는 정치 현장에서는 얼마든지 있을 수 있는 일이다.

실제로도 보궐선거가 있으면 타지역으로 주소를 옮기는 경향이 발견되기도 한다. 특정 후보 지지자들이 ‘위장 전입’을 통해 없었던 표를 몇백에서 몇천 표까지 추가해주는 것이다. 물론, 이런 경우 해당 후보 지지자들은 개인 사정이나 후보들의 선거 유세를 돕기 위해 이사했을 뿐이라는 논리를 편다.

이렇게 다양한 형태로 ‘편향’이 뒤섞일 수밖에 없는 상황에 여론조사가 잘 맞아들어가기를 바라는 것은, 극단적인 경우에는 점을 쳐서 맞추는 것과 다를 바 없는 상황으로 이어질 수도 있다.

표본 추출 방식 – 연령, 지역, 성별 기준

온갖 오차(Noise)의 가능성이 주어진 상태임에도 여론조사 기관이 할 수 있는 일은 많지 않다. 여론조사 기관은 비용 문제로 선거구 전체를 모두 조사할 수 없기 때문에, 정확도가 높으리라 추측되는 방식으로 표본을 추출하는 수밖에 없다.

한국에서 일반적으로 이뤄지는 표본 추출 방식은 연령, 지역, 성별에 맞춰 대표 집단을 뽑아내는 것이다. 예를 들어, 10대부터 60대 이상 인구 비율 대로, 분할 선거구의 인구 비율 대로, 성별 비율대로 대표 표본을 뽑아서 전체 선거구와 유사하도록 만든다. 이런 표본 추출법을 ‘집락추출법(Cluster sampling)’이라고 부른다.

각각의 그룹이 전체 그룹과 비슷해지도록 맞춰야 하기 때문에, 여론조사 전화 받는 중에 연령에 응답하고 나면 갑자기 “조사 대상이 아닙니다”라며 조사가 중단된다.

대통령 선거 여론조사 시 한국인 전체 그룹의 인구 구조와 지역별 차이를 잘 반영하는 대표 표본 1,000명을 뽑아 표본오차를 3.1% 이내로 맞추려는 시도가 바로 위와 같은 절차를 통해 정리된다.

여론조사는 왜 더 많이 틀리고, 출구조사는 왜 더 잘 맞을까?

이처럼 수고로운 과정을 거쳐 여론조사를 했는데도 실제와 다른 결과가 나와 맹비난을 듣는 경우가 매우 많다. 지난 2022년 3월 대선의 결과를 놓고 여론조사 대부분이 틀렸다는 반응이 쏟아졌다. 반면, 선거 당일에 이뤄졌던 출구조사는 소수점 1자리까지 정확했다며 놀랐다는 시청자들이 많았다. 언뜻 보면 같은 조사인데 왜 다른 결론이 나왔을까?

출구조사는 여론조사와 다른 방식으로 표본을 추출한다. 몇몇 투표장을 골라 투표소에서 나오는 사람들 5명 중 1명씩을 골라 설문조사를 진행한다. 통계학에서는 이런 표본 추출법을 ‘계통추출법(Systematic sampling)’이라고 부른다.

집락추출법과 계통추출법이 차이가 나는 이유는, 집락추출법을 활용할 때, 1차로 선정한 그룹(예. 10대, 20대 등의 연령 그룹) 비율을 전체 집단의 비율과 맞추는 과정에서 표본이 실제를 잘 반영하지 못하는 경우가 생기기 때문이다. 10대, 20대, 30대 같은 연령 비율을 억지로 맞추려다 보니 우리 눈에 보이지 않는 숨겨진 변수들이 간과되는 경우가 종종 발생한다. 결국 집락추출법이 계통추출법보다 틀릴 확률이 더 높다.

고려대학교 통계학과의 박민규 교수가 ‘2022년 대선으로 돌아보는 출구조사의 과학’이라는 주제로 지난 3월 24일에 개최했던 세미나에서 위의 통계 추출방법 차이에 따른 오차 발생 가능성이 논의된 바 있다. 박 교수에 따르면, 출구조사는 계통추출법으로 선거 당일의 표심을 그대로 반영하기 때문에 오차가 발생할 확률이 낮지만, 여론조사는 구조적으로 집락추출법을 택할 수밖에 없기 때문에 표본 추출 2단계 절차 중 오차가 생길 여지가 있다. 거기에 적극 투표층이 온전히 반영되는 선거 당일 표심과 비 투표층의 표심도 포함되는 전화 여론조사의 격차는 더 커질 수밖에 없다.

박 교수가 지적한 대로, 실제로 집락추출법을 출구 조사법으로 택했던 모 방송사는 계통추출법을 선택한 타 방송사 대비 출구조사 결과가 어긋나기도 했다. 꼭 적극 투표층에 국한하지 않더라도 표본 추출법만으로도 이미 오차가 어느 정도 있다는 사례라는 것이다.

여론조사가 국민 여론을 잘 반영했을까?

다시 국민의힘 당 대표 경선으로 돌아와서, 여론조사 50%라는 요건으로 국민 여론을 반영하면서, 보통의 여론조사가 그렇듯 당시 경선도 집락추출법을 활용했다. 연령, 지역, 성별을 국민 평균값에 맞춘 것이다. 특정 정당 지지자들의 여론이 더 많이 반영될 여지는 낮다.

물론 지지 정당이 아닌 경우에는 자세한 사정을 몰라 무작위로 지지 후보를 선택하거나, 단순히 언론에 많이 노출된 후보를 고르는 경향성이 발생할 수는 있다. 좀 더 조직화된 움직임이 있으면, 특정 정당 지지자들이 의도적으로 후보를 고를 수도 있다. 집락추출법 자체가 갖는 한계를 넘어서, 이런 역(逆)선택의 가능성이 실제로 존재한다.

‘조국수홍’이라는 구호까지 등장할 만큼 역(逆)선택 전략이 상당히 두드러졌던 홍준표 전 국민의힘 대선후보 캠프 출신 인사에게 위의 질문을 했을 때, ‘타 당 후보 지지자들의 반응을 끌어내는 것도 선거 전략이고 확장성을 상징하는 것이 아니겠는가’라고 반문했다.

실제 본 투표에서는 표심으로 바뀔 확률이 낮은 만큼 확장성에 대한 상징인지는 함부로 말하기 어려우나, 기술적으로 존재하는 역(逆)선택의 가능성을 홍 후보 캠프의 관계자들 일부도 인지했었던 것으로 보인다.

국민의힘이 향후 6개월 안에 전당대회를 치를 수 있을지, 이준석 대표가 원하는 대로 내년 여름에나 전당대회를 치를 수 있을지 알 수 없지만, 이번 논란을 겪으며 ‘여론조사 50%’에 대해 ‘국민의힘 지지자 중 여론조사 50%’라는 문구가 삽입될지, 국민의힘 지지자임을 구분하는 문항을 어떠한 방식으로 넣어 여론조사를 만들어낼지 귀추가 주목된다.

Similar Posts