갈루아의 반서재

전체적인 모습을 판단하지 않을 때 '나무만 보고 숲은 보지 않는다'라는 표현을 쓰기도 하는데, '나무가 안 보여도 숲이 보이는 것'이 바로 확률적 사고이다. 하나하나의 나무가 어떤 종류인지는 몰라도 숲을 이루는 나무들 중에서 침엽수가 많은지 활엽수가 많은지, 혹은 잎의 상태는 어떠하며 열매는 열려있는지 따위를 대략적으로 알면 그 숲을 자원으로 활용할지 판단할 수 있다. 나무를 하나하나 살피는 것은 그 후에 하더라도 상관없다. 그러면 '어떻게 생각해야 할 지 몰랐던 부분'의 예로서 다음과 같은 질문을 던져보자.

 

시카고에 피아노 조율사는 몇 명이 있을까?

 

이미 입사 문제로 널리 알려진 문제다. 우선은 다음과 같은 식으로 생각해보자.

 

 

1. 일단 다음과 같은 사고 모델을 세운다.

 

1) 시카고의 전체인구(a) × 열심히 피아노를 연주하는 사람의 비율(b) = 열심히 피아노를 연주하는 사람의 수(c)

 

2) 열심히 피아노를 연주하는 사람의 수(c) × 1년 동안 조율을 부탁하는 빈도(d) × 조율비로 부담하는 금액(e) = 연간 시카고 전체에서 발생되는 피아노 조율비의 합계(f)

 

3) 시카고 전체에서 발생되는 조율비(f) × 제반 경비를 고려한 이익률(g) = 조율사의 평균수입(h) × 조율사의 수(x)

 

 

2. 각각의 항목의 값을 추정한다.

 

 

 

 

시카고의 전체인구(a)

대도시 중 하나이므로 100만은 넘겠지만 500만이 넘는 거대도시는 아니므로 편의상 300만으로 정한다.

3,000,000 

열심히 피아노를 연주하는 사람의 비율(b)

 b = p×q + r×s

0.0036+0.0064=0.01 

 전체인구중 초등,중학생이 차지하는 비율(p)

 : 만약 사람이 100살까지 살고 연령대별 인구의 증감도가 없다면 나이가 같은 사람의 인구의 1%라고 할 수 있다. 미국 또한 인구고령화가 진행되고 있으므로 초등, 중학생은 평균적인 연령대 구성의 80% 정도 밖에 안되는 것으로 가정한다. 또 일본이 장수국가인 점을 감안하여 미국의 평균수명은 미국보다 약간 낮은 75세로 가정한다.    

 9÷75×0.8=0.096

 초등,중학생 중 피아노를 열심히 연주하는 사람의 비율(q)

 :  초등, 중학생이면 한 반에 1~2명의 비율로 있지만 고등학교에 올라가서는 그만두는 경우가 많다. 그외에 음악대학 재학생이나 음악대학을 졸업한 피아노 선생님, 그리고 전문 연주자 등이 있을 것이다. 전문 음악 교육을 받은 적도 없이 취미 삼아 피아노를 치는 사람은 그다지 많지 않을 것이다. 어느 정도 나이를 먹으면 피아노 강사를 그만두는 경우가 많으므로 고령자가 되기 전까지만 대상자로 넣겠다.

 1.5÷40=0.0375

 전체인구중 고등학생 이상 고령자 미만이 차지하는 비율(r)

 48÷75×1=0.64

 고등학생 이상으로 피아노를 열심히 연주하는 사람의 비율(s)

 1÷100=0.01

열심히 피아노를 연주하는 사람의 수(c)

c=a×b

30,000 

1년 동안 조율을 부탁하는 빈도(d)

 1년에 1회

조율비로 부담하는 금액(e)

 1회에 1만 5000엔

15,000 

연간 시카고 전체에서 발생되는 피아노 조율비의 합계(f)

 f=c×d×e

450,000,000 

제반 경비를 고려한 이익률(g)

 80%

 

조율사의 평균수입(h)

4,000,000엔

4,000,000 

 

 

∴ 피아노 조율사의 수  x=(f×g)÷h=(450,000,000×0.8)÷4,000,000=90

 

 

3.

이와 같은 사고방법을 '페르미 추정법'이라고 한다. 정보가 전혀 없고 짐작하기 힘든 사항을 계산하기 위해 우선 모델을 만들고 그 모델에 가정값을 주어 결과를 측정하는 방법이다. 즉 상식적인 범위 내에서 대략적인 수치를 측정해 계산하고 이를 이용해 또 다른 계산의 결론을 내려가는 것이다.

 

여기서 중요한 것은 '어떤 모델'을 만들고 '가정값을 어떻게 주는가'하는 부분이다. 막무가내식 판단을 한다면 더 이상 논의를 진전시키기 힘들고 '더 정확한 추정을 하려면 무엇을 조사해야 할까'하는 부분에 대해서도 알 방법이 없다.

 

그렇지만 가정과 모델을 분명히 정함으로써 '이 모델에 포함되지 않은, 그 밖의 고려할 요인은 없는가'라거나 '여기서 가정한 수치의 정확도를 높일 수 없는가' 혹은 '관점을 달리하여 모델을 만들면 더 정확한 수치에 근거한 추정이 가능하지 않을까' 같은 식으로 적극적인 검토를 할 수 있다.

 

 

4.

그러나 이 정도로 '이제 어떤 문제나 상황에서도 비교적 합리적인 추정을 통해 확률적 사고를 할 수 있게 되었어'라고 생각하기에 이르다. 중요한 것은 '어느 정도 부정확한가'에 대해서도 따로 검토할 필요가 있다는 점이다.

 

위에서 가장 합당한 수치를 추정했다면 이제 '최대 어디에서 최고 어디까지의 범위에 들어갈까'라는 부분을 생각해보는 것이다. 즉 각각의 모델에 의해 계산된 값 중에서 '분명 그럴 리가 없다'라고 단언할 수 없는 최대값과 최소값을 구해보는 것이다. 그렇게 하려면 '추정값'의 범위를 하나하나 살펴봐야 한다.

 

구간을 생각할 때는 우선 '왜 이런 추정을 하는가'라는 목적을 명확하게 설정하는 일도 중요하다.

추정을 할 때는 반드시 '구간'과 '목적'을 잘 생각해야 한다.

 

 

 

확률을 높이는 확률
국내도서
저자 : 니시우치 히로무 / 신현호역
출판 : 비전코리아 2013.11.18
상세보기