E,AHRSS

큰 수의 법칙

last modified: 2015-12-06 22:26:23 Contributors



Contents

1. 본문
2. 관련 항목

1. 본문

Law of Large Numbers(LLN)[1]

n개의 사건 중에서 성질 A를 가지는 것이 r개 있으면, r/n는 A가 일어나는 비율로 생각할 수 있는데, 관찰하는 횟수 n을 크게 함에 따라 r/n는 일정한 값 p에 한없이 가까워진다.[2] (이상 네이버 백과사전)

다 필요 없고 표본 숫자가 많을수록 실사건의 확률이 통계적 예측에서 오차가 줄어간다는 것이다. 당연한 소린데 무슨 법칙이라고 그럴듯한 이름까지 지어줄까...사실 당연하니까 법칙인 거다

근데 사실 수학적 확률과 통계적 확률을 이어주는 굉장히 중요한 법칙이다. 동전에서 한 면이 나올 확률은 1/2이라고 하는데, 근데 실제로 10번을 던져서 정확히 앞면 뒷면이 5번씩이 나오는 경우는 많지 않다. 그렇다고 해서 동전에서 앞면이 나올 확률이 1/2가 아니라고 할 수도 없는 것 아닌가? 즉, 동전을 계속 던지다보면 결국 확률은 1/2에 수렴한다는 것이다.

별게 아닌 것 같지만 생각보다 이게 중요한게 이 법칙을 적극적으로 활용하여 현실에서 많은 돈을 벌어들이는 경우도 있다. 카지노에서 하우스측이 돈을 벌어들이는 것도 이 법칙을 잘 활용한 덕. 카지노의 룰렛 게임을 예로 들자면 룰렛에서 '검정,빨강' '홀수,짝수'에 돈을 걸어 성공한 경우 2배의 금액을 받는다. 숫자는 당연히 홀수 아니면 짝수고 색도 검은색 아니면 빨간색 밖에 없으므로 2배의 금액이면 기대값이 1일 것 같으나 실제로는 0과 00이 있어 1에 미치지 못한다. 간단히 말하자면 이길 확률이 50%일 것 같은데 실제로는 47%정도의 승률이라는 것. 카지노 측은 바로 여기서 대수의 법칙을 활용하는 것이다. 고객 개개인은 게임을 몇번 하는 정도이지만 카지노 측의 입장에선 이 게임을 수만번은 행한다는 점에서 고객 몇명에게는 돈을 조금 빼앗기나 고객 전체에게는 엄청난 돈을 받아낸다는 것이 가능하다. 물론 노골적으로 심하게 승률이 낮으면 아예 손님이 모이지 않으므로 승률은 미묘하게 높게 해놓고 많은 게임, 또는 도박에 거는 금액을 높여 결론적으로 벌어들이는 양을 늘린다.

좀더 일상적인 예시를 들자면, 어떤 남성이 길거리를 지나가는 여성에게 접근하여 연락처를 따낼 가능성이 1/100 정도라고 할 때 암울하다 성공이 불가능해 보이겠으나, 수없이 많이 도전한다면 1/100 정도는 거의 무조건 성공한다는 것. [3]

반대의 개념으로 '소수의 법칙'(少數 작은 수)이 있는데[4] '경우의 수가 충분히 많으면 확률에 근접한다'는 대수의 법칙의 반대로 '경우의 수가 충분히 많지 않으면 확률에서 벗어날 가능성이 높다'는 것. 소수의 경우라면 동전 열개를 던져서 9번이 앞면일 수도 있고, 한번이라면 실력없는 아마추어가 프로를 이겨[5] 승률이 비정상적일 수도 있다. 그러나 경우의 수가 많아진다면 대수의 법칙으로 인해 동전 앞면이 나온 비율은 거의 무조건적으로 1/2에 수렴하고 (실력없는) 아마추어가 프로를 이기는 비율도 매우 줄어든다. 이러한 성향은 마작 같이 미묘한 곳에서 승부가 갈리는 게임에서 아주 잘 드러나는데, 특히 프로마작의 경우 승률 30%만 넘어도 고수, 40%만 되어도 고릴라라는 소리를 들을 정도이다.

프로야구계의 명언 내려갈 팀은 내려간다는 이 큰 수의 법칙을 반영한 과학적인 발언이다. 초반에는 전력이 약한 팀도 높은 승률을 기록할 수 있지만 경기수가 많아질수록 큰 수의 법칙에 따라 원래 실력대로 수렴하여 하위권으로 내려가게 된다. 던파확률의 법칙이나 천봉의 조작 논란 역시 '큰 수의 법칙'을 무시해서 생긴 근거 없는 속설일 뿐이며, 로또 명당 같은 복권 명당도 따지고 보면 사람 많이 몰리니까 계속 명당 자리를 지키고 있는 것일 (=당첨될 "확률"은 다른 집과 똑같은데도 사람이 많이 몰리니까 당첨된 횟수가 많아진) 뿐이다.

많은 사람들이 혼동하는 내용인데, 큰 수의 법칙은 이 반복시행의 결과가 정규분포 형태를 띤다는 중심극한정리(Central Limit Theorem)와는 다른 내용이다. 큰 수의 법칙 어디에도 r/n과 p의 차이가 정규분포를 따른다는 내용은 없기 때문. 어찌 보면 이 중심극한정리는 큰 수의 법칙의 '강화판'이라고 생각할 수 있다. 자세한 것은 정규분포 항목을 참고하자.

----
  • [1] 대수(大數)의 법칙이라고도 한다. '대수의 법칙'이란 일본에서 번역한 용어로 한국인에게는 직관적으로 와닿지 않는 측면도 있고, 대수(代數)와도 헷갈리기에 점차 '큰 수의 법칙'이라는 표현을 사용하는 추세이다. 물론 나이 많은 사람들은 보통 '대수의 법칙'이라는 표현을 쓴다.
  • [2] 엄밀히 말하면 확률변수 r/n이 p로 확률수렴(convergence in probability)이나 확률1수렴 (almost surely 혹은 with probability 1)함을 의미한다. 확률수렴할 경우 약대수의 법칙, 확률1수렴할 경우 강대수의 법칙이 된다. 이 차이는 대학원 이상 확률론 정도에서 배우므로 더 이상의 자세한 설명은 생략한다.
  • [3] 이런 경우 실제로 한번 이상 성공할 확률은 횟수를 반복할수록 생각 이상으로 높아진다. 던파확률의 법칙 참고.
  • [4] 실상 대수의 법칙이라는 개념에 소수의 법칙이 포함된다. 그러므로 일반적으로 쓰이는 개념인지는 확인바람
  • [5] 초심자의 운(beginner's luck)이라는 표현이 많이 쓰인다.

Category