나무모에 미러 (일반/밝은 화면)
최근 수정 시각 : 2024-12-28 13:42:25

도박사의 오류


통계학
Statistics
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break: keep-all"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px"
<colbgcolor=#4d4d4d><colcolor=#fff> 수리통계학 기반 실해석학 (측도론) · 선형대수학 · 이산수학
확률론 사건 · 가능성 · 확률 변수 · 확률 분포 (표본 분포 · 정규 분포 · 이항 분포 · 푸아송 분포 · 카이제곱분포 · t분포 · Z분포 · F-분포 · 결합확률분포) · 확률밀도함수 · 확률질량함수 · 조건부확률 · 조건부기댓값 · 조건부분산 · 전체 확률의 법칙 · 베이즈 정리 · 도박사의 오류 · 도박꾼의 파산 · 몬티 홀 문제 · 뷔퐁의 바늘 · 마르코프 부등식 · 체비쇼프 부등식 · 큰 수의 법칙 (무한 원숭이 정리) · 중심극한정리 · 벤포드의 법칙
통계량 평균 (제곱평균제곱근 · 산술 평균 · 기하 평균 · 조화 평균 · 멱평균 · 대수 평균) · 기댓값 · 편차 (절대 편차 · 표준 편차) · 분산 (공분산) · 결정계수 · 변동계수 · 상관계수 · 대푯값 · 자유도
추론통계학 가설 · 변인 · 추정량 · 점추정 · 신뢰 구간 · 상관관계와 인과관계 · 실험통계학 · p-해킹 · 통계의 함정 · 그레인저 인과관계 · 신뢰도와 타당도
통계적 방법 회귀 분석 · 최소제곱법 · 분산 분석 · 주성분 분석 (요인 분석) · 시계열 분석 · 패널 분석 · 2SLS · 생존 분석 · GARCH · 비모수통계학 · 준모수통계학 · 기계학습 (군집 분석 · 분류 분석) · 위상 데이터분석 · 외삽법 · 메타 분석 · 모델링 (구조방정식)
기술통계학 ·
자료 시각화
도표 (그림그래프 · 막대그래프 · 선 그래프 · 원 그래프 · 상자 수염 그림 · 줄기와 잎 그림 · 산포도 · 산점도 · 히스토그램 · 도수분포표) · 그래프 왜곡 · 이상점 }}}}}}}}}

1. 개요2. 조건3. 특징4. 비판론
4.1. 반박
5. 기타6. 예문7. 도박사의 오류가 아닌 것8. 관련 문서

1. 개요

도박사의 오류(, Gambler's Fallacy[1])는 서로 영향을 끼치지 않는 일련의 확률적 사건들[2]에서 상관관계를 찾아내려 하는 사고의 오류를 의미한다.

2. 조건

고 전제된 상황에서 각 사건 간의 상관관계를 찾아내려는 행위가 도박사의 오류에서 기인하는 행동이라고 볼 수 있다.

쉽게 얘기하자면, 이런 상황에서, 동전을 10번 던졌을 때 앞과 뒤가 7:3의 비율로 나왔다고 할 때, "앞이 많이 나왔으니 다음도 앞이 나올 것이다" 라든지, "뒤가 적게 나왔으니 다음에는 뒤가 나올 차례다"라고 해석하는 것은 모두 도박사의 오류라는 것. 11번째에 앞이나 뒤가 나올 확률은 각각 50:50이다.

또 유명한 것으로는 '주사위를 던져 6이 나왔는데 또 던졌을 때 6이 나올 확률'이 있으며 확률은 언제나 1/6이다. 세 번째로 던져도, 네 번째로 던져도 마찬가지. 첫 번째 결과와 두 번째 결과에 상관관계가 있다고 생각해서 1/12나 1/36 등의 결과를 말한다면 도박사의 오류에 빠진 것이다.[3]

간단히 이야기하자면 주사위를 10번 던져 모두 6이 나올 확률과 1524631521과 같은 숫자배열이 나올 확률은 동일하다는 이야기다.

3. 특징

조작이 없는 한 어떤 회차도 확률은 언제나 똑같다.

자칭 로또연구가(?)가 로또 당첨번호의 수열을 분석해 다음 당첨번호를 예측하는 영상.

역대 로또 당첨 번호 목록에서 숫자가 한두 개는 이월되는 것을 보고 일정한 규칙을 발견했다고 주장한다. 이를 이용해 다음 회차의 당첨 확률을 높이겠다는 기적의 논리를 전개한다.
여기 보시면, 번호가 이어집니다.
1:40부터 본격적인 도박사의 오류가 펼쳐진다. 당첨 번호의 이월 여부를 분석해서 데이터를 추출, '황금 번호' 를 지정해 다음 번호에 적용한다는 것. 그러나 로또 기계가 지난 번호를 기억하지 않는 한 그저 숫자놀음일 뿐이다. 기계는 생각 없이 돌아가며, 지난 추첨 결과는 이번 추첨 결과에 티끌만큼의 영향도 주지 않는다. 지난 번에 나온 번호와 완전히 똑같은 번호가 나올 확률, 혹은 다른 번호가 나올 확률은 완전히 동일하다. 번호의 연결은 무의미하다. 번호 데이터가 500개, 1,000개, 2,000개, 1만 개가 모여서 규칙을 분석하고 평균 값을 내고 예측을 하더라도 로또 기계의 공에 문제가 있지 않은 한 다음 결과와는 완벽하게 무관하다.[4]

참고로 실제로 번호가 이월된 횟수는 프로그램이 밝힌 바보다 100회 이상 적었다. 프로그램의 주인공이 로또에 당첨된 횟수는 나왔으나 얼마나 돈을 부었는지는 나오지 않았다. 흥미를 위한 조작 방송인 셈. 더불어 로또의 기대값은 겨우 반절. 그런데 주인공은 2, 3등 당첨을 여러 번 했다며 자신하고 있다. 당첨 횟수가 사실이라면 어지간히 운이 좋지 않은 이상 당첨금의 두 배는 투자한 것이 된다. 로또를 꾸준히 연구(?)하지 않았더라면 더 유복하게 생활할 수 있었을 것이다. 실제로 위 영상의 주인공 조모 씨는 결국 사기죄로 2018년에 1년 8개월 징역형을 선고받고 감옥에 갔다. 거기에다 그가 방송에서 밝힌 당첨 이력들도 전부 검증되지 않았다. 중앙일보 MBN
우연은 기억도 양심도 없다. 부부가 여섯번째 딸을 가질 확률은 여전히 1/2이다.[5] 룰렛에서 붉은색이 나올 확률도 여전히 1/2이며, 주사위에서 2가 나올 확률은 언제나 1/6이다. 바꿔말하자면, 동전을 던져서 앞뒤를 알아맞히는 게임에서 앞면이 계속해서 다섯 번이 나왔다고 할 때 여섯번째 시도에서도 앞면이 나올 확률은 그전과 다름없이 역시 1/2이다. 동전은 앞에 던진 결과를 기억하지 않는 것이다.
마틴 가드너 , '이야기 파라독스' 제5장 확률의 파라독스 - '도박사의 궤변'.
이 오류는 "모든 독립사건은 앞에서 일어난 사건과 독립적으로 일어난다"라는 확률 이론의 가정을 받아들이지 않는 데서 발생한다. 이전 판의 결과가 다음 판에 영향을 끼칠 거라 생각하는, 일종의 보상 심리라고도 할 수 있다. '이만큼 잃었으니 다음 판에는 운이 좋겠지'라고. 결국 독립사건을 종속사건이라고 해석한 것에 따른 오류가 된다.

혹은 결합 확률(joint probability)와 조건부 확률(conditional probability)를 혼동하는 데서 기인한다고 볼 수도 있다.

각 확률에 해당하는 문제를 제시하면 다음과 같다.

결합 확률: 동전을 3번 던졌을 때, 세번 모두 앞면이 나올 확률은?
P(A∩B∩C) = P(A)P(B)P(C) = 0.5^3 = 0.125

조건부 확률: 동전을 3번 던지는데, 첫번째에서 앞면, 두번째에서 앞면이 나왔다. 그러면 세번째에서 앞면이 나올 확률은?
P(A|B,C) = P(A) = 1/2
(독립사건이므로, 조건부 확률은 A의 확률과 동일하다.)

사실 위의 계산의 경우 직관적으로 알기 힘든 것이 있는데, 바로 특수규칙인 이미 일어난 일의 확률은 100%라는 전제가 바로 드러나지 않기 때문이다. 직관적으로 봤을 때 세번 모두 앞면이 나올 확률이 0.125라면, 두번 앞면이 나오고 다음 앞면이 나올 확률이 0.125라고 생각하기 쉽지만, 사실은 앞의 두 사건은 이미 일어난 확률이기 때문에 확률은 1×1×0.5=0.5라는 계산이다. 확률을 배울 때 이런 소소한 전제들을 넘어가기 때문에 헷갈리기 쉽다.

즉, 사람들이 혼동하는 지점은 이미 동전을 던져서 결과를 알고 있음에도, 동전을 한 번도 던지지 않았을 때, 나오는 확률로 착각해서 계산하기 때문이다. 다시 말하면, 동전을 한 번도 던지지 않았다면, 각 100번을 던졌을 때 무엇이 나올 것인가가 불확실하고, 따라서 100번을 던졌을 때, 발생할 온갖 가능한 경우의 수가 존재한다. 결국, 100번이 전부 앞면인 경우는 전체 가능한 경우 중 매우 드문 경우며, 다시 말하면 확률이 낮다. 당장 유전자가 서로 동일할 확률만 해도 2의 100제곱분의 1을 넘는다.

하지만 우리는 이미 99번째까지 시행 결과를 까보았다. 따라서, 앞면이 80번 나오고 뒷면이 19번 나오거나, 뒷면이 99번 나오는 등의 결과들은 평행 세계에서나 고려 가능한 경우이고,[6] 현재 카운트 가능한 경우의 수에 포함되지 않는 것이다. 즉, 현재 구하려는 사건에서 99번이 앞면이 나오는 것은 정해져 있고, 불확실한 것은 100번째 동전에서 무엇이 나오느냐 뿐이다. 따라서 던졌을 때 가능한 경우는, 100번째 동전이 앞면이 나온 경우와 100번째 동전이 뒷면이 나온 경우 뿐이며, 각각 1/2의 확률을 갖는다.

룰렛에도 똑같이 적용되는데 나온 숫자를 체크하고 분석한 뒤 '이 쪽 숫자가 안 나온지 한참 됐으니 다음에는 이 숫자가 나오겠군!' 하는 행위를 의외로 심심찮게 볼 수 있지만 주사위(동전, 룰렛)'에 기억력 따위는 없다. 동전이 계속 앞면이 나왔다고 동전이 이것을 기억해서 "계속 앞면만 나왔으니 이번에는 뒷면이 나오게 해야지!" 이럴리 없다는 것이다. 육면체 주사위에서 어떤 눈이 나올 확률은 1/6이므로 이 확률에 의해 계산하면 육면체 주사위를 30번 던지면 각 눈이 5번씩 나온다는 계산이 나오지만, 진짜로 30번 던져보면 모든 눈이 5번씩 딱 맞춰서 골고루 나온다는 보장이 없다. 주사위를 계속 던져 3이 가장 적게 나왔다고 주사위가 이것을 기억해서 "3이 가장 적게 나왔으니 이번에는 3이 나오게 해야지!" 이럴리 없기 때문이다. 마틴 가드너가 자신의 저서 '이야기 파라독스'에서 지적했듯이, 이런 생각을 하는 사람들 덕분에 카지노는 연간 수백만 달러의 수입을 챙긴다.

다만 블랙잭의 경우 한정적으로 이게 오류가 아닌 경우가 있다.[7] 이에 관련된 이야기는 영화 21의 원작 'MIT 천재들의 라스베가스 습격'이라는 책에 잘 나오고 픽션이 조금 가미되긴 했지만 굵직한 사건들은 전부 논픽션. 하지만 이 경우는 이들이 카지노 상대로 돈을 딴 수법은 단순하지만 확실하고 정교한 확률이론에 바탕하고 있으므로 도박사의 오류 따위와 비교할 순 없다.여섯 벌의 카드를 사용하는 블랙잭에서 카드카운팅을 하는 천재들의 확률이론과 도박사의 오류 따위(?)는 비교가 안 된다.

단, 이론상으로는 자신이 블랙잭을 반복하면서 나온 카드만을 기억하고 이 방식을 적용하는 것도 가능하지만, 현실적으로는 다른 플레이어들의 카드란 변수가 존재하기 때문에 성공 확률이 그리 높지 않다. 때문에 앞서 언급된 블랙잭 플레이어들은 성공 확률을 높이기 위해 팀을 짜서 카지노를 공략, 다른 팀원들이 게임판에 달라붙어 카드 돌아가는 모양새를 미리 파악하고, 승산이 높다고 판단되면 그제서야 "크게 왕창 걸어줄" 핵심 인물을 끌어들이는[8] 수법을 주로 구사했다. 즉, 다른 플레이어들의 게임 정보를 이용한다는 시점에서 사기 도박이라 할 여지가 남아있는 셈. 물론 딜러가 수작을 부리면 적용되지 않겠지만, 그러면 플레이어가 이전 기록을 참조해서 확률을 논하는 것이 무의미해진다는 점에서 도박사의 오류와 마찬가지인 것이다.

재미있게도 이 도박사의 오류는 이기는 사람은 계속 이기고, 지는 사람은 계속 지는 결과를 낳기도 한다. 이기는 사람은 '이번엔 이겼으니 다음판은 좀 불안해'라며 안전한 선택지를 고르는 경향을 보이고, 지는 사람은 반대로 '이번엔 졌으니 다음엔 분명히 뜬다!' 내지 '이번엔 이겼으니 다음에도 분명히 이긴다!'며 좀 더 위험하고 과감한 선택지를 고르는 심리를 보인다고. 매사의 균형을 아느냐와 같다고 볼 수 있다. 후자는 확률이고 평정심이고 할 것 없이 일확천금에 눈이 멀었기 때문이다.

또한 게이머들도 이러한 도박사의 오류를 쉽게 저지르는 모습을 보이곤 하는데, 예를 들면 어떤 게이머가 실패의 위험이 높은 강화를 하다 날려먹고 전체 챗창에 'ㅇㅇㅇ유저가 +15강화에 실패하였습니다.'라는 말이 뜨면 '이번엔 내 차례다!!'라며 강화를 지르는 모습을 보이는 경우가 있다. 말할 것도 없이 게임제작사가 확률장난을 치지 않는 이상 강화의 확률은 게임 전체의 수량을 조절하는게 아니라 개별 확률이다.

강원랜드에 가보면 바카라라는 게임의 결과를 일일이 기록하며 대박을 노리는 사람들이 굉장히 많은데,[9] 상술했듯 게임 결과를 아무리 열심히 기록해봐야 다음 판도 100% 랜덤이므로 이런 행동은 전부 무용지물이다. 그 모습을 보면 이 간단한 오류가 얼마나 많은 사람의 인생을 망칠 수 있는지 알게 되고 섬뜩해진다.[10] 바카라도 보통 6~8덱을 써서 그것들을 상당수 쓰기 전까지 덱을 교체를 안 하는 경우 카드카운팅을 통해 승률을 올릴 수 있겠으나 그 확률이 매우매우 미미하여(아무리 높게 잡아줘도 0.05%) 의미가 없는 것이다.

같은 맥락에서 로또 등 여러 복권의 당첨 확률을 분석한다는 사람들도 많지만 이 역시 무익한 행위다. 물론 그런 커뮤니티에 가보면 정말로 당첨되었다는 사례가 많지만... 조금 더 생각해보면 알 수 있는 것이 보통 이런 '로또 당첨 확률을 높인다!'고 홍보하는 커뮤니티는 으레 사람이 몰리게 되어있으니 정비례해서 당첨되는 사람 수도 늘어나게 되어있다. 즉, 커뮤니티가 대단해서 당첨되는 사람이 많이 나오는 게 아니라 단지 사람이 많이 모이니 당첨되는 사람이 많이 나오는 거다. 복권 당첨 확률은 추첨기계를 조작하지 않는 한 매번이 전부 동일하니 의미없는 뻘짓은 자제하도록 하자.

한 마디로, "이쯤되면 나올 때 됐다!"라는 헛된 믿음으로 수많은 사람들이 이 오류를 범하고 있다는 것이다.

마찬가지로 복권판매점마다 1등, 2등 당첨자가 몇번 나왔다고 써붙이는 것도 같은 맥락이다. 당첨자가 한번 나온 곳에 사람이 몰리게 되므로 그 안에서 추가 당첨자가 나오기에 계속 당첨자가 늘어날 뿐이지 로또 당첨 확률은 그대로이다.

같은 자금으로 당첨률을 높이고 싶다면 꾸준히 사는 것보단 돈을 모아뒀다가 한번에 여러장을 사는 것을 추천한다. 물론 어지간히 많이 사는게 아닌 이상에야 유의미한 수준의 증가는 아니다.

4. 비판론

간혹 학자들(주로 경제학자)의 뒤떨어지는 현실감각을 비판할 때 '도박사의 오류'에 대한 믿음을 예로 드는 사람도 있다. 블랙 스완에서 저자 나심 탈레브는 "똑똑하신 학자들은 100번 던져 앞면이 100번 나온 동전을 다시 한 번 던질 때 또 앞면이 나올 확률을 자신 있게 2분의 1 이라 하겠지만 현실 감각 있는 사람들은 동전에 무슨 장난을 쳤다는 것을 곧바로 눈치챌 것이다"라는 말을 남겼다.

도박사의 오류는 논리적인 오류보다는 말장난적인 요소가 강하다고 할 수 있다. 확률이라는 단어가 "무엇에 대한 확률인가?" 기준에 따라 말하는 뜻이 완전히 달라지는데 이 도박사의 오류는 그 중의적인 표현을 가지고 트집을 잡는 것이다. 도박사의 오류는 서로의 사건이 독립일때 이전의 사건이 이후의 사건에 미치지 않지만 현실에서 동전을 10번, 1백 번, 1천 번, 1만 번, 10만 번, 1억 번 던져서 앞면만 나오는 경우는 사실상 없다. 왜냐고? 동전을 던지는 시간은 그렇게 길지 않다고 해도 확률이란 건 연속으로 맞거나 틀릴 확률은 그 연속되는 수가 늘어날수록, 또 당초 확률이 낮을수록 기하급수적으로 낮아지기 때문이다. 예를 들어 우리나라 로또 1등 당첨률은 800만 분의 1조차도 되지 않기 때문에 한 회차에는 1번만 시도하고 총 1억 번 시도한다는 가정 하에 가끔씩은 한번도 1등 당첨이 안나올 수도 있지만 동전 던지기의 경우 확률이 1/2로 충분히 높은 만큼 계속 특정 면만 나올 확률은 2의 1억 제곱분의 1에 해당한다.

하지만 동전을 1억 번 던지든 그렇게 던진 다음 다시 1억 번 던지든 세트를 보면 어떤 패턴이든 간에 세트별 패턴은 세트 수만큼 나온다. 물론 1억 번 던지고 다시 또 1억 번 던지면 나왔던 패턴은 절대 다시 나오지 않는 건 아니다. 뽑은 경우의 수를 넣고 다시 뽑든 버리고 다시 뽑든 확률이 너무 낮아지면 가까워진다. 그리고 확률이 낮고 시도 횟수가 적을수록 확률이 얼마나 심히 낮든 크게 차이나지 않는다. 즉 확률이 낮아질수록 독립시행과 독립시행이 아닌 것이 서로 가까워지며 동시에 확률이 낮은 것과 더 낮은 것의 차이 역시나 시도 횟수에 비례해서 가까워진다. 그 말은 1억 분의 1이나 1조 분의 1이나 시도 횟수가 적다면 사실상 똑같다. 결론적으로 수억 번 실제로 던져서 나온 패턴과 조합의 확률이든 던진 횟수만큼 연속으로 같은 면만 나올 확률이든 확률 자체는 똑같다. 하지만 전자가 한 번이라도 실제로 일어났다. 유전자의 경우의 수도 생각해보자.[11] 그리고 가장 중요한 것은 특정 패턴만 계속 나오는 것은 수학의 세계에서만 존재하는 일이다.

즉 일상에서 "앞이 10번 나왔으니까 뒤가 나올 차례"라고 사람들이 흔히 생각하는 이유는 큰 수의 법칙에 기인된 것이고 수학적인 확률을 말로 표현하다보니 말장난의 함정에 빠지는 것이다.

앞면이 나올 확률이 50%인 동전 던지기를 10번 해서 뒷면만 나와 0%의 수치를 기록했다고 치자. 그래도 그건 단순한 우연이고 100번 던지고 1000번 던지다보면 결국 50%에 가까워지게 되는 건 누구나 안다. 여기서 0%에서 50%로 오르는 과정에서 사람들은 그걸 '확률이 오르다'라고 말하게 되는데 같은 확률이라는 단어를 써도 그 기준이 다르기 때문에 이것을 트집 잡아 도박사의 오류에 빠졌다고 말할 수 있는 것이다.

또 원하는 카드를 뽑기 위해 100번을 뽑았는데 10%인 카드가 1장밖에 나오지 않았다는 결과가 나왔을때 그 확률에 대해 의심하는건 도박사의 오류와는 별개이다. 큰 수의 법칙에 따라 뽑는 횟수가 늘어난다면 당연히 확률은 원래 정해져있는 확률에 비례하게 되고 이게 만약 맞지 않는다면 이 확률이 맞는지 의심하는건 자연스러운 것이다. 도박사의 오류는 이전에 시행한 결과가 이후의 결과에 영향을 미치지 않는다는것 뿐이다. 3%라는 확률로 나오는 카드가 100번을 뽑아도 안나와서 확률에 대한 의심을 제기할때 도박사의 오류를 언급하는 것은 잘못된 것이다.[12] 비슷한 예로 동전을 100번을 던졌는데 100번 다 뒷면만 나올경우, 도박사는 동전 자체가 공정하지 않아 던져지는 동전이 뒷면만 나올 경향이 더 큰 동전이 아닌가라고 의심할수 있다. 우연일 확률보다 사기일 확률이 훨씬 크기 때문이다. 이러한 의심은 오류가 아닌 합리적인 의심이며, 통계학적으로는 이같은 의심을 베이지안 통계에 의한 결론(Bayesian conclusion)이라고 한다.

4.1. 반박

누구나 일상에서 써먹을 수 있도록 실용적인 측면에서 접근해보자. 수학이랑 친하지 않으면서, 실제로 게임이나 도박을 하는 플레이어들의 입장에서 말이다. 도박(뽑기)이란 '많이 시도하면 한 번 시도한 사람보다는 뽑힐 가능성이 높다'고 하는데 상식적으로 이는 분명 옳다. 그리고 1%의 뽑기를 100번 하더라도 뽑힐 가능성이 1에 가까워질 뿐 절대 1이 못 된다는 것도 모두가 안다. 하지만 한 번 시도하나 100번 시도하나 '시도한 순간'의 확률은 같다는 도박사의 오류를 잘못 이해하게 되면, 1번 뽑은 사람이나 100번 뽑은 사람이나 1번이라도 뽑힐 가능성은 동일하다고 착각하게 될 수 있다.[13]

하지만 실제로는 그렇지 않다. 1/100의 당첨률을 가진 뽑기를 100번 뽑는다면 1 - (99/100)^100 = 0.63396765873이 되므로 대략 63.3%의 확률로 1번은 뽑힐 거라 기대할 수 있다. 즉 도박사의 오류 이야기는 도박을 시도할 때, 각 시도의 확률이 이전의 결과와 무관하다는 의미일 뿐, 시도 횟수가 전체 도박의 결과에 영향을 미치지 않는다는 의미는 아니다. 도박사의 오류에서는 "100번째 뽑기", 즉 1회 시행의 확률을 묻는 것이고, 위의 질문은 100번을 뽑을 때, 그 결과의 확률을 묻는 것이다. 다시 말하자면 언젠가 한 번은 나온다다음에는 나온다의 차이라고 할 수 있다.

결국 이것은 확률이라는 개념의 근본적인 문제다. 관점을 어디에 두느냐에 따라 전혀 다른 값이 나오기 때문이다. 예를 들어 동전을 아홉 번 던져서 앞 면이 나왔을 때 다음에도 앞면이 나올 확률은 여전히 50%다. 그러나 열번 던져서 전부 앞면이 나올 확률은 약 0.1%에 불과하고, 아홉 번 앞면이 나오고 뒷면 한 번이 나올 확룰은 그 열 배나 된다. 그렇기에 사람들은 이제 뒷면이 나올 때가 됐다는 생각을 하게되고, 도박사의 오류는 바로 전자에서 이미 1/2의 9승이라는 0.2% 짜리 가능성이 실현되었다는 것을 망각하는 데에서 출발한다.

따라서 개념을 정확히 이해한 학자들이라면, 앞서 설명한 동전 던지기 100번 시행이 전부 앞면으로 나온다면, 의심을 한다. 해당 이론의 경우에 '다르게 나오도록 설계되지 않았을 경우' 이라는 명확한 전제가 있기 때문이다.

먼저, 학자들이라면 100번 던져서 앞면이 100번 나올 전체 확률이 극도로 낮으므로 당연히 의심을 할 것이며(가설검정의 원리), 기반 확률이 의심을 받으므로 101번째 던졌을 때의 확률을 1/2라고 자신있게 말할 리도 없다. 동전 던지기 문서 참고.

두번째로, 100번 던져 100번 앞면이 나와도 나심 탈레브가 하는 말처럼 "장난다는 것을 눈치챘다"고 단정하는 것은 불가능하다.[14] 낮은 확률의 사건이라도 발생 불가능한 것은 아니므로, 운이 나빴을 가능성을 배제할 수 없기 때문이다. 해당 동전이 장난친 동전인지 여부는 동전을 뜯어보는 등의 검증이 이루어진 이후에야 확정이 가능할 것이다. 확률만으로 단정이 가능하다면, 낮은 확률의 슬롯 머신에서 잭팟이 터진 경우 운이 좋다고 할 게 아니라 "기계가 망가졌다"고 단언할 수 있어야 한다. 다만 그러한 슬롯머신에서 잭팟이 자주 터진다고 하면 확률이 아닌 잭팟 매커니즘 문제 상 진짜로 고장났다고 단언할 수는 있다

도박사의 오류는 이전 몇개의 시행을 근거로 '이번 시행에는 뜰 것이다'라고 안이하게 믿는 것을 비판하는 것이다. 큰 수의 법칙에 따라 언젠가는 확률에 맞는 결과가 나와야 하고, 그만큼 충분한 큰 수를 시행했을 때 확률에 맞게 나오지 않는다면 베이지안 통계에 의한 결론으로 조작을 의심하는 것이 맞다. 하지만 도박사의 오류가 다루는 대부분의 상황은 아직 뽑기가 계속 진행중인 경우로, 대부분 큰 수의 법칙이 오롯이 반영되기 힘든 상황이다.

가챠가 포함된 모바일 게임에서 베이지안 통계에 의한 결론으로 확률 조작을 밝혀낸 사례가 있긴 하지만, 이는 의심이 만연한 상황에서 누군가가 총대를 메고 검증을 위해 무수한 양의 뽑기를 한번에 시행했기 때문에 가능한 일이다. 다른 일반 사람들이 이번엔 뽑힐 것이라 믿으면서 뽑은 뽑기들은 의심을 만드는 정도에 소모되었을 뿐, 이를 검증하지는 못했다.[15] 이는 뽑기를 전부(충분히 많이) 시행한 다음에 '지금까지 안나왔으니 조작이다'라고 주장해야지, 반대로 뽑기를 하는 중에 '지금까지 안떴으니 다음에는 나올 것이다'라는 사고방식은 옳지 않다는 것을 의미한다. 그리고 도박사의 오류는 이 점을 지적하는 것이다.

무엇보다도 이 논리가 도박사의 오류라고 이름이 붙여져 악명높은 이유는, 만들어지는 거의 모든 예문이 도박의 기대값을 비이성적으로 신앙하여 결과적으로 화자가 추가적으로 도박을 시행하고 싶어한다는 것을 암시하기 때문이다. 특히 지지뜬으로 대표되는 주술적 믿음에 가까운 사고방식은 더더욱 도박사의 오류로 비판받을 소지가 있다. 오히려, 조작을 의심하기 시작하는 시점에서 도박사의 오류와는 거리를 둔 것이다.

애초에 해당 비판은 매우 낮은 확률을 0으로 자기 마음대로 처리하거나[16], 확률이 조작되었다고 말하는 염세적이고 속편한 주장에 불과하다. 현실에서 미국 슈퍼볼 당첨 확률은 2억 9,220만 분의 1이지만 당첨자는 꾸준히 나왔고, 앞으로도 나올 것이다. 마찬가지로 현실에서 동전 던지기 100번중에 100번 앞면같이 0에 가까운 극도로 낮은 확률도 현실에서 누군가에겐 일어날 수 있는 일이고, 만약 비판론자들이 말하던 대로 수학적 개념이 아닌 현실에서 100번중 99번이 앞면이 나왔다면 먼저 확률 조작을 의심하되, 확률이 조작되지 않았다면 그 다음 앞면이 나올 확률이 50%라는 것은 그들도 부정할 수 없는 사실이며 이 사실을 부정하는 것이야 말로 비판론자들 스스로가 오히려 현실감각이 없다는 것을 증명하는 셈이 되는 꼴이다.

5. 기타


인간이 무의식 중에 저지르는 도박사의 오류를 역으로 이용하여 인간이 "임의로" 생성한 수열을 예측하는 것이 가능하다. 위 영상을 보면 동전의 앞면(H)과 뒷면(T)을 무작위로 나열하라고 지시받았을 때, H, T를 좀 더 번갈아가며 사용하고 연속된 패턴을 피하려는 편향성이 나타난다. 비슷한 원리로 인간과의 연속된 가위바위보를 50% 이상의 확률로 이기는 통계기반의 AI를 만들 수 있다.

특정 MMORPG 유저 일부가 철석같이 믿으면서 경험을 통한 통계라며 옹호하는 '강화제물' 또한 대표적인 도박사의 오류라고 할 수있다. 단, 강화와 관련한 프로그래밍에서 변수가 존재하지 않는 단순사이클을 채택한 일부 게임의 경우 강화제물이 진짜로 필요한 경우가 있다. SD건담 캡슐파이터 온라인이 대표적.[17]

요즘 대부분의 온라인 게임은 게임내 경제조절을 강화로 조절하는 경우가 많다. 그래서 수많은 대한민국의 온라인 게임은 강화 실패 시 장비가 파괴되거나 강화 수치를 떨어뜨려 가치를 낮춘다. 당연히 이 확률은 서버상에서 실시간으로 조절이 가능하고 게임내 화폐를 관리하는 경제팀은 데이터를 토대로 강화률을 올리거나 낮춘다. 다만 사람이 일일이 계산할 순 없으므로 당연히 프로그램이 계산하고 그때그때마다 조절한다. 때문에 확률도 있지만 이러한 점도 고려해야 한다. 그러므로 재물은 몇몇 게임에선 동일한 가치를 가진 물건의 강화 확률이 수시로 변한다는 점도 알고 있어야 한다.

또다른 예로 게임에 사용되는 확률보정 매커니즘이 있다. 주로 크리티컬 확률, 회피 확률 같은 데에 사용되는데, 도박사의 오류가 어느 정도는 오류가 아니게 해주는 역할을 한다. 예를 들어 어떤 영웅의 치명타율이 20%로 설정되어 있다고 하면, 처음에는 확률이 20%보다 훨씬 낮게, 예를 들어 6% 정도로 계산되다가 치명타가 안 뜰수록 확률이 올라가고, 치명타가 터지면 다시 6%로 리셋되게 만드는 식으로 구현된다. 이런 알고리즘을 통해 100대를 때리면 실제로 그 중 20대 정도가 치명타가 터지고 99대를 때렸는데 치명타가 15번 밖에 안 나왔다면 100번째 공격은 치명타일 가능성이 매우 높아지는 것이다. 이것도 어디까지나 확률을 사용해 어느 정도 기대값에 맞춰주는 것이라 절대적인 건 아니지만, 어쨌든 이 알고리즘 하에서는 도박사의 오류가 완전히 틀리지는 않는다. 이런 게 사용되는 이유는 확률을 사용하되 확률의 영향이 실력의 영향을 압도해 실력싸움이 아니라 누가누가 다이스 갓의 가호를 더 받느냐 게임이 되어버리는 것을 막기 위함이다. 예를 들어 공격이 치명타로 터질 확률이 10%인 영웅이 있는데, 이 치명타가 순수 랜덤함수로 계산된다고 가정해 보자. 이 영웅이 적을 3번 때렸는데 3대가 연속 치명타로 터져서 자기보다 훨씬 실력이 높은 상대를 순식간에 운빨로 처치해버릴 확률은 0.1%로 전혀 높지 않은 확률이다. 이것만 보면 별 문제가 없어 보이지만, 문제는 한 판에만 플레이어는 수백 번의 평타를 칠 것이고, 이것을 수십 수백 판 반복하다 보면 그런 일이 벌어지는 횟수의 기대값은 작다고 하기 힘들어질 것이다. 그리고 플레이어 한 명만 놓고 봐도 이 정도인데 메이저 AOS게임의 동시접속자는 수백만이나 되기에 플레이어들 전원을 기준으로 놓고 보면 그 기대값은 무시 못 할 만큼 커져버린다.[18] 이렇게 게임이 운에 지나치게 좌우되는 것을 막기 위해 도박사의 오류를 현실로 만들어서 운이 불합리적인 결과로 이어질 확률을 줄이는 것이 확률 보정의 역할인 것이다. 그리고 이런 구성 때문에 미니언 몇 타당 딜교환 한 번 등의 제물시행으로 실질 크리티컬 확률을 높이려는 플레이를 하기도 한다. 순수 랜덤함수를 피함으로써 운의 영향이 줄어들고 실력이 개입할 여지가 새로 만들어지는 것.

6. 예문

이하 예문들은 도박사의 오류를 비꼬기 위한 문장들, 즉 "이걸 믿어라"가 아닌, 이러한 말들이 모두 오류를 가지고 있다는 뜻이므로 혹여나 문서가 이해가 되지 않는 사람들은 착각하지 말자.

예시와는 다르게 일련 사건을 시도한 변수뿐만 아니라 그외의 타 독립 변수로도 도박사의 오류를 범할 수 있으므로 주의하자.

7. 도박사의 오류가 아닌 것

8. 관련 문서


[1] 'Monte Carlo Fallacy'라고도 지칭한다.[2] 통계적으로 말하자면 i.i.d.(= Independent and identically distributed random variables) 조건이라 할 수 있다.[3] 1/36은 첫번째 던졌을 때 6이 나오고 또 던졌을 때 6이 나오는, 즉 (6,6)의 순서쌍이 나올 확률이다. 즉 (x,y)=(6,6)이 나올 확률이 1/36이고, (6,x)=(6,6)이 나올 확률은 1/6인 것.[4] 1, 2, 3, 4, 5, 6이 연속 500번 나와도 다음에 1, 2, 3, 4, 5, 6이 나올 확률은 다른 조합과 같이 1/8145060이다.[5] 이 이야기의 요점은 아들을 다섯이나 둔 부부가 "이번에도 남자애면 어쩌죠?"하는 아내한테 남편이 "걱정 말아요. 지금까지 남자애였으니까 이번에는 분명히 여자애일거요."라고 장담하지만, 감수분열에 문제가 없는 한 부부가 딸을 얻을 확률은 여전히 1/2에 해당한다는 것이다. 물론 수학이 아닌 생물학의 영역으로 가면 자연 상태의 출생 성비가 105:100 정도이므로 이를 근거로 하면 딸을 얻을 확률이 48.8%쯤 되지만, 여전히 (51.2%)^5의 확률로 아들만 다섯을 얻었다는 사실이 여섯 번째 아이가 딸아이일지의 여부에 아무런 영향을 끼치지 않는다는 것은 변함이 없다.[6] 단, 여기서 독립사건이라는 것을 전제해야 하는데, 그런 점에서 앞에서 말했듯이 독립사건과 종속사건을 혼동하는 것이 근본적인 문제라고 볼 수 있다.[7] 플레잉 카드를 1덱(즉, 카드 한 통)만 사용하는 경우. 블랙잭 자체가 카드를 많이 쓰지 않기 때문에 몇 판을 연속으로 한 뒤에 셔플을 하는 식이라 앞 게임에서 쓴 카드가 나중에 안 나오는 식으로 영향을 주게 된다. 셔플할 때 까지를 한 판으로 보면 그 사이에 했던 몇 게임들이 독립사건이 아닌 종속사건이 된다.[8] 별 쓰잘데기없는 잡담을 벌이면서 슬며시 신호를 보내는 식으로.[9] 이건 만국공통인지 일본 도박만화 갬블!에서도 바카라의 결과 기록을 토대로 승승장구하는 갬블러가 나온다. 그래봤자 판의 흐름을 읽은 주인공이 6연속 플레이어를 연달아 맞추자 자기 페이스를 잃고 패배하지만.[10] 카드카운팅 자체는 무의미한 것이 아니라고 생각하는 사람들도 있지만, 그래서 카지노에서도 카드카운팅 방지 대책을 사용하기 때문에 큰 의미가 있다고 보기는 힘들다.[11] 비슷한 예시를 들어보자. 아이 1은 성장곡선이 평범하고 아이 2는 4세에 2m 넘었음에도 불구하고 사고난 것도 아니고 오히려 최종 키는 210cm밖에 되지 않는다. 상식적으로 아이 2가 훨씬 드문 케이스다. 하지만 만약 아이 1과 성장곡선이 소수점 2자리까지 정확히 같을 확률과 아이 2보다도 드문, 예를 들어 3세에 210cm 넘고 5세에 3m까지 컸지만 그 후 오히려 키가 줄어 최종적으로 1.8m의 키가 되는 케이스의 성장곡선이 발생할 확률을 비교해보자면 어떤가? 아이 1은 20세까지 컸다고 가정해보자. 확률이라는 건 연속으로 나올수록 기하급수적으로 낮아지기 때문에 20세까지 컸다면 이미 확률은 아이 2보다 드문 케이스의 성장곡선이 발생할 확률과도 비교할 수 없을 정도로 극악무도하게 낮을 것이다.[12] 참고로 3%라는 매우 낮은 확률에도 불구하고 100번을 뽑으면 그 카드가 나올 확률은 95.2447%로 안 나올 확률은 5%조차 되지 않는다.[13] 실제로 이런 착각을 한 게임사 직원이 확률 조작 여부 문의에 도박사의 오류를 언급했던 사건이 있었다. 전형적인 악용의 예시다.[14] 가설 검정의 원리에서도 마찬가지로 우연히 100번 동안 앞면이 나왔음을 배제하는 것이 불가능하다.[15] 그나마도 그런 경우 상당수가 아예 뽑을 확률이 없는 경우임을 감안하면, 뽑을 확률이 있긴 할 경우 이런 접근방식도 쓰기 더욱 까다로워짐을 알 수 있다.[16] 보통 통계를 다루거나 공학을 전공할 경우 0에 가까운 수를 0으로 처리해버리는 경우가 많다.[17] 완전한 랜덤이란 프로그래밍에선 없으므로 영향을 주긴 줄 것이다. 그저 일반적으로는 계산할 수 없기에 확률은 변함이 없다는 것. 만약 난수를 확인하거나 인위적으로 쉽게 조정할 수 있다면 그 게임의 밸런스는 박살날 것이다(...).[18] 실제로 프로게이머 사이에 이런 일이 있었다. 워크래프트 3 프로게이머 박준블레이드 마스터의 공격에 15% 확률의 크리가 3번 연속 발생, 적 데스 나이트를 순식간에 죽여버려서 상대 선수가 GG를 친 것.[19] 이 이야기는 버전이 수두룩한데 오래전 어느 수학 교과서에서는 일반환자를 진료한 의사가 이 병은 생존률이 1/100이라고 하면서 당신은 완쾌될겁니다! 환자가 어째서요? 라고 하자 "그동안 이 병으로 나에게 진료받은 다른 99명 환자가 죽었으니까요." 이런 경우에는 의사를 믿으면 안 되는 수준이다.[A] 그런데 이건 항상 대진표에 확고한 1등 임요환이 있기 때문이기도 하다. 애초에 경기마다 선수들의 기량에서 차이가 나기 때문에 완전히 확률이 같은 것도 아니다.[21] 로또 판매점은 기본적으로 시도 횟수가 편의점 등 소규모 판매점에 비해 넘사벽으로 많은 곳이기 때문에 당첨자가 많이 배출되는 것이다. 1등이 다른 곳보다 자주 나온 판매점도 있긴 있는데, 이는 명당으로 소문나면서 그것에서 로또를 산 사람이 많아져서 그만큼 다시 1등이 나올 가능성도 높아진 것이다. 사는 사람이 많은 해당 판매점에서 1등이 나올 확률은 높아져도, 그곳에서 구매하는 사람의 당첨 확률은 다른 곳에서 사는 것과 다르지 않다.[22] 게임에 따라 정말 10번째에 치명타가 터질 확률이 높아지기도 하는데, 리그 오브 레전드가 대표적이다. 2번 연속으로 치명타가 터질 확률은 10%보다 낮게 하되, 치명타가 터지지 않으면 확률을 계속 상향조정해서 평균적으로 10%에 근접하도록 만드는 식.[23] 보통 천장까지 3~10회 남았을 때 이런 말이 나온다. 2회 남은 경우에는 1/2라며 해탈하는 경우가 많다.[24] 바둑리그마냥 시즌 끝날때마다 전면 드래프트로 새로 팀을 구성하는게 아니고서야 이게 도박사의 오류의 사례라고 보기는 어렵다. 한 시즌에 전력을 잘 꾸려놓으면 줄부상이나 팀의 재정적 문제가 터진게 아니라면 다음 시즌에도 좋은 전력을 유지하는 것이 당연하므로 매 시즌의 성적은 독립시행이 아니다. 아스날의 경우는 10년간이나 꾸준한 전력을 유지하는데 대한 찬사와 그러면서도 우승 한번을 못하는 데 대한 비아냥으로 하는 말이다. 다만 그런 축구적 요소들을 다 배제하고 오로지 챔스권에 오래 있었다는 이유만으로 다음 시즌에는 챔스에 진출할 확률이 증가할 것이다는 도박사의 오류에 해당될 수 있다.[25] 2022년 롤드컵 때 조별리그부터 결승전까지 대회 내내 이런 소리를 들었는데, 결과는 우승이었다. 계속 열세인 팀이 이겼다고 이번에는 우세인 팀이 이긴다는 생각은 도박사의 오류와 상당 부분 겹친다.[26] 직전 열린 롤드컵에서 우승한 DRX의 행보와 많이 비슷했다. 똑같이 조별리그에서 우승후보(벨기에, TES)를 떨어뜨리고, 토너먼트에서 다른 우승후보(스페인/포르투갈, Gen.G)를 꺾었다.[27] 결과는 4강 4위. 겉보기에 비슷해 보여도 둘은 아무 상관 없는 팀인데다 언더독인 건 같아도 DRX는 (당시 기준) 세계 최고의 LoL 리그 LCK의 중위권 팀이고, 모로코는 축구 변방 아프리카의 (월드컵 성적 기준) 최강자라서 위상이 많이 차이난다. 서로 위치를 바꿔서 DFM우루과이/크로아티아를 만들면 이해하기 쉽다.[28] 이는 시험 문제를 다 푼 뒤 OMR에 답안을 마킹할 때 특정 번호가 너무 많이 나왔거나 너무 적게 나왔을 때 큰 불안감을 조성하는 이유이기도 하다.