본문 바로가기
카테고리 없음

독서노트 #36 <벌거벗은 통계학> 1그램의 정보가 1톤의 의견보다 무겁다!

by 가쓰오우동 2024. 2. 4.

<벌거벗은 통계학> 서평

 통계는 우리 실생활에서 많이 사용된다. 대통령 여론조사부터 시작해서, 운동선수들의 타율 같은 기록까지. 통계는 떼려야 뗄 수 없는 관계에 있다. 특히 뉴스를 보다 보면 일반 사람들은 통계가 정확하다고 인지하고 큰 의심 없이 받아들인다. 하지만 이 책을 읽으면 그래프들을 의심하게 될 수 있을 것이다.

 

 물론 우리가 마주하는 통계가 다 오류가 있다든지, 심각한 결함이 있는 건 아니다. 통계를 사용하는 입장에서 어떤 시각으로 보느냐가 중요한 것 같다. "우리나라 경제성장률이 2%씩이나 올랐습니다!" 랑 "우리나라 경제성장률이 2% 밖에는 나오지 않을 것 같습니다!" 두 문장의 큰 차이는 없다. 단지 보는 시각이 다를 뿐이다.

 이 책을 보면 우리가 고등학교 때 배운 통계 관련 개념들이 나온다. 실생활에서 마주할 수 있는 사례를 중심으로 설명하니 이해하기가 한결 쉬웠다. 통계에서 중요한 건 모집단에서 얼마나 표본을 잘 추출하느냐이다. 예를 들어 대통령 여론조사를 한다고 생각해 보자.

 여론조사한다고 우리나라 인구 5천만 명을 다 조사할 수는 없는 노릇이다. 비용을 생각하면 천문학적인 비용이 들어갈 것이기 때문이다. 하지만 적절한 표본을 잘만 뽑는다면, 적은 비용으로도 대통령이 누가 될지 판단해볼 수 있는 것이다.

 하지만 여기서도 주의를 기울여야 한다. 표본을 잘못 추출했을 경우 실제 결과와 다를 수 있기 때문이다. 지역감정이 있는 건 아니지만, 만약 표본추출을 경상도 지역에서 인원을 많이 한다면, 당연히 경상도 지역에서 지지하는 대통령이 당선됐다고 판단할 수 있다. 하지만 최종 결과는? 물론 다른 대통령이 될 수도 있는 것이다.

-1그램의 정보가 1톤의 의견보다 무겁다!

 통계에서 표본추출 다음으로 중요한 게, 표본오차인 것 같다. 그 표본이 얼마만큼의 오차를 가지고 있느냐이다. 즉 오차 범위 내에서 얼마나 정확한 결과를 얻을 수 있느냐라고 생각하면 좋을 것 같다. 우리도 여론조사 결과를 보면 꼭 나오는 멘트가 있다. 표본오차 범위 플러스마이너스 5 구간입니다와 같은 멘트 말이다. 

 표본오차가 그 구간 내에 있다는 것은 95%의 정확도를 가지고 있다는 것이다. 나머지 5%가 부정확한 구간에 들어갈 확률이라는 말이다. 즉 표본집단만 정확하다면 틀릴 일이 거의 없다는 소리랑 비슷하다고 할 수 있다.

 우리는 신문, 인터넷, TV를 통해서도 많은 통계자료를 접한다. 나도 책을 보면서 느낀 건데, 항상 고지 곧 데로 자료를 믿지는 말자란 걸 느꼈다. 기회만 된다면 그 자료 원문을 직접 구해서 확인해볼 필요가 있을 것 같다. 모든 정보가 다 맞는 것도 아니고, 통계를 이용해서 글을 쓰는 사람이 통계를 자신의 시각으로 조작할 수도 있기 때문이다.

 

 요즘엔 수많은 언론사, 인터넷 신문사에서도 다양한 여론조사를 한다. 같은 기간에 했다고 해도 정치색깔에 따라 상당히 다른 결과가 나오는 경우도 많다. 그렇듯 우리는 숫자와 그래프를 보면 먼가 정확하다고 생각하지만 아닐 수 도 있다는 의심을 할 필요는 있다. 

-앞으로

 앞으로 통계는 더욱더 중요해질 것으로 판단된다. 왜냐하면 데이터는 증가하고 그것을 이용해서 소비자한테 어떻게든 이용하려는 기업들은 수도 없이 많기 때문이다. 어디 기업뿐이겠는가? 국가에서 사용하는 통계도 절대 무시할 수 없다. 데이터가 돈이 되는 세상이기 때문이기도 하다. 

 

 덧, 모든 일을 통계를 통해 접근하려는 것도 조심해야 할 것 같다. 통계로 설명할 수 없는 현상도 무수히 많기 때문이다. 과반수가 그렇게 생각한다고 꼭 그 의견을 따를 필요가 있을까? 아니라고 생각한다. 자신의 주간이 뚜렷하면 통계가 다르게 나왔다고 해서 자신의 의견을 부정할 필요는 없다고 생각한다.

단지 통계란 자신의 의견을 뒷받침하기 위해서 필요한 도구라고 생각하자. 자신의 가설을 세우고 뒷받침하는 근거가 통계학적으로 유의미 하다면 자신의 주장이 타당하다고 설득할 수 있다고 볼 수 있다. 사회과학이라든지 최근 통계에 관심이 있는 사람이라면 이 책을 읽어보면 통계가 어떤 것인지 이해하는데 큰 도움이 될 것 같다.

 

 그리고 대학이나 취업을 준비하고 있다면 데이터를 기반으로한 통계학과나 마케팅 직무에도 도움이 된다고 생각한다. 통계를 기반으로 면접에 임하거나 학업을 수료한다면 본인의 기반이 탄탄해짐을 느낄 것이다. 근거가 풍부하고 타당하면 그의 말에 힘이 실릴 것이기 때문이다.