통계는 생활 속에 깊이 들어와 있다. 여론조사니 마케팅이니, 요즘은 빅 데이터라는 새로운 ‘상품’까지, 위력이 대단하다(여기서 통계는 학술적 의미라기보다는 통계청이 다루는 통계 또는 그와 비슷한 일 정도로 이해하자).
그 중에서도 건강이나 의료 분야는 더욱 그렇다. 통계는 거의 일상화되었다. 연구에서 출발했지만 정책과 경제, 가계, 생활에 이르기까지 알게 모르게 큰 힘을 미치고 있다.
통계가 갖는 힘은 상징에서 나온다. 모든 것이 늘 숫자로 호명되는 자본주의 시장에서 통계는 객관성과 진실을 상징한다. 여기에 정치적, 사회적 신뢰가 약할수록 객관과 중립의 요구는 더욱 커진다. 이래저래 한국 사회가 통계에 의존할 이유는 충분한 셈이다.
그렇지만 통계가 어떤 위험을 안고 있는지는 낯선 이야기가 아니다. 국내외를 가릴 것 없이 통계가 남용되고 오용되는 사례는 헤아릴 수 없을 정도로 많다.
가장 대표적이고 흔한 사례들은 ‘해석’이 잘못된 것이다. “갓 운전면허를 딴 사람보다 10년쯤 운전을 한 사람이 교통사고를 더 많이 낸다, 그러니 운전에 익숙해졌을 때 더 주의해야 한다.” 진지한 표정으로 이런 식의 통계를 발표하는 일은 아직도 흔하다.
조금만 따져 봐도 잘못된 해석이다. 초보 운전자보다 10년쯤 된 사람이 차를 더 많이 운전하고, 따라서 사고를 낸 건수(비율이나 가능성이 아니다)도 더 많다고 해석하는 것이 맞다. ‘분모’는 생각지도 않고 많다 적다를 따진 것이 잘못이다.
병원의 진료 환자수를 가지고 10년 전에 비해 갑상샘 질환이 몇 배로 늘었다는 통계도 마찬가지다. 질병의 발생 자체가 늘었는지, 관심이 커져서 더 많이 병원을 찾게 되었는지, 이것만 가지고는 알 수 없다.
통계의 해석도 문제지만, 통계를 아예 ‘조작’하는 일이 더 심각하다. 최근 한 일간 신문이 보도한 것과 같이 조사방법이나 대상을 바꾸는 일이 대표적인 통계 조작이다. 엉터리 근거나 수치를 끌어다 쓰는 일도 흔하다.
불평등을 나타내는 지니계수를 산출하면서 고소득층을 빼거나 물가지수를 산출하면서 갑자기 값이 오른 물품을 제외하면 당연히 값이 달라진다. 넓혀서 보면 원하는 답이 나오도록 유도성 질문을 하는 것도 여기에 속한다.
조금 방법이 다르지만 기준을 달리해서 통계를 산출하는 것도 자주 활용되는 조작 기법이다. 현재의 상황을 2년 전과 비교하는 것과 5년 전과 비교하는 것은 변화의 폭이나 방향이 다를 수밖에 없다. 같은 통계 지표지만 바로 전 정부에 비해서는 개선되었고 그 이전 정부에 비해서는 악화된 것일 수 있다. 어느 기준과 비교할 것인가, 의도가 개입되기 쉽다.
다음으로, 어떤 의도를 가지고 통계를 ‘활용’하는 것도 오남용의 예에서 빠질 수 없다. 수치나 기준, 대상에 손을 댄 것은 아니지만, 넓은 의미에서는 이 역시 조작과 마찬가지로 나쁘다.
가장 고전적인 수법은 통계를 발표하는 시기를 ‘조절’하는 일이다. 선거 때 유불리를 따져 통계 발표 시기를 달리 하는 일이 이번에도 문제가 되었다. 한국 사람들이 통계의 ‘배경’을 읽는 버릇이 생긴 것은 이 때문이다.
앞서 해석의 오류를 말했지만, 오류를 방치하거나 조장하는 것도 특별한 목적으로 통계를 활용하는 한 방법이다. 2002년에 결혼의 부부의 수가 1만 명이고 이혼한 부부의 수가 5천 명이라고 발표한다고 하자. 당장 이혼율이 50퍼센트라는 해석이 뒤따르기 십상이다.
물론 해석을 잘못한 것이다. 이혼한 사람이 결혼한 그 사람들과 같은 사람이 아니므로 이혼율이라고 쓴 것은 틀렸다. 그러나 이 통계를 받아들이는 쪽은 결혼과 이혼을 이런 식의 이혼율로 연결시킬 가능성이 크다.
대체로 여기까지가 통계의 ‘오류’로 흔히 지적된다. 이 정도만 해도 통계를 ‘거짓말’이라고 야유하는 이유로 충분하다(대럴 허프 지음. 새빨간 거짓말, 통계. 더불어책, 2004년). 여느 통계학자들조차 어느 정도는 인정하는 통계의 ‘한계’라고 할 수 있다.
이들 비판은 대체로 외부 요인을 향해 있다. “통계가 무슨 잘못인가”라는 볼 멘 소리에, 통계 그 자체보다 해석과 활용이 잘못되었다고 하는 주장이 대부분이다. 그래서 정치적 외압을 막고 중립성을 보장하는 장치를 마련해야 한다는 대안이 자연스럽게 나온다.
그러나 중요한 한 가지, ‘생산’이 빠졌다. 통계의 해석, 조작, 활용을 비판하는 경우라도, 통계의 생산은 좀처럼 이런 시각 속에 포함되지 못한다. 어떤 통계를 생산할 것인가 하는 과제는 이미 주어진 것으로 당연하게 받아들이는 경향이 강하다.
통계의 생산을 빼면 통계의 ‘옮음’은 절반에 지나지 않는다. 조작이 없고, 제대로 해석되고 활용된다고 한들 통계가 전하는 메시지는 부분적일 뿐이다.
사실 어떤 통계를 어떻게 생산할 것인가 하는 물음만큼 정치적인 것이 없다. 근대 국가에서 통계(특히 국가 통계)는 근본적으로 국가의 영역에 속해 있기 때문이다. 통계의 영어 표현인 ‘statistics’ 속에 국가를 나타내는 영어인 ‘state’의 어원이 포함되어 있다는 것만 봐도 의심할 수 없다. 영국에서는 통계가 한 때 ‘정치 산수’라고 불기기도 했다.
통계의 생산이 정치적 권력관계에서 자유롭지 않은 것은 이런 데서 연유한다. 여기서 권력관계란 사회적 의사결정에 미치는 힘의 균형을 뜻한다. 통계의 정치성을 주장하는 근거를, 주위에서 쉽게 찾을 수 있는 것으로, 몇 가지만 들어보자.
우선 양성 평등과 관련된 통계가 빠질 수 없다. 서울시가 조사해서 2013년 초에 발표한 것에 따르면, 서울시의 61종의 인적 통계 가운데에 절반 가까운 30여종의 통계는 성별이 구분되어 있지 않았다(서울신문 2013년 1월 3일). 건강보험이나 산재 통계에도 성별 분리는 걸음마 단계도 채 벗어나지 못한 상태다.
건강 불평등을 드러내는 통계도 비슷하다. 사회적으로 건강 불평등 문제가 제기된 것이 적어도 10여 년이 넘었지만, 체계적인 국가 통계는 거의 없다고 할 정도다. 관심을 가진 연구자가 퍼즐 맞추기를 하듯 부분적인 정보를 생산해 내야 한다.
소득 불평등을 나타내는 지니계수는 정확성을 믿을 수 없는 대표적 통계다. 하지만, 소득 분포를 제대로 파악하는 일은 늘 뒷전이다. 빈곤층의 의료 이용에 도덕적 해이가 심하다고 비난하지만, 근거는 없이 심증만으로 말한다. 비정규직 문제가 가장 중요한 사회적 의제에 속하지만 정부가 산출하는 통계를 믿는 사람은 드물다.
양성 평등, 소득 분포, 건강 불평등, 빈곤, 비정규 노동만큼 정확한 통계를 필요로 하는 사회문제도 드물 것이다. 그러나 이런 종류의 통계를 정확하게 만들어내는 일은 체계적으로 회피 또는 방치된다. 묻지 않고, 조사하지 않으며, 따라서 결과를 내놓지 못한다. 정치적 권력이 불평등하게 작동하기 때문이다.
통계 생산의 올바름은 중립성과 객관성이란 가치만으로 보장될 수 없다. 국가 통계의 독립성 강화는 더구나 기술적 가치이자 가장 작은 제도적 장치일 뿐이다. 무슨 위원회에 권한을 더 준다고 해야 피상적인 해결책에 지나지 않는다.
대안은 (역설적이지만) 국가 통계의 정치를 회복하는 것이다. 통계가 생산되고 유통되는 전체 과정을 민주적으로 통제해야 한다. 물론 사업과 기술, 정책의 차원을 넘는다. 사회경제적 이해가 국가 통계와 관련된 의사결정에 민주적으로 대표되는 것이 핵심이다.