작업된 예제로 확률에 대한 직관을 개발하는 법

확률 계산은 직관적이지 않습니다.

우리의 두뇌는 문제를 생각하고 확률을 올바르게 계산하는 대신 지름길을 택하고 잘못된 답을 얻는 데 너무 열심입니다.

응용 확률의 고전적인 문제를 해결하는 것이 문제를 명확하게 하고 직관을 개발하는 데 유용할 수 있습니다. 생일 문제, 남자 또는 여자 문제, 몬티 홀 문제와 같은 이러한 문제는 올바른 해결책에 도달하기 위해 주변 확률, 조건부 확률 및 결합 확률의 규칙을 신중하게 적용해야 한다는 것을 보여줍니다.

이 게시물에서는 고전적인 사고 유발 문제를 통해 확률에 대한 직관을 개발하는 방법을 발견하게 될 것입니다.

이 게시물을 읽은 후 다음을 알게 될 것입니다.

  • 확률을 곱하여 생일 문제를 해결하는 방법.
  • 조건부 확률을 사용하여 남자 또는 여자 문제를 해결하는 방법.
  • 결합 확률을 사용하여 몬티 홀 문제를 해결하는 방법.

개요

이 자습서는 다음과 같이 세 부분으로 나뉩니다.

  1. 생일 문제
  2. 남자 또는 여자 문제
  3. 몬티 홀 문제

생일 문제

응용 확률의 전형적인 예는 두 사람이 같은 생일을 가질 확률을 계산하는 것입니다.

결과가 우리의 직관과 일치하지 않기 때문에 좋은 예입니다. 따라서 때로는 생일 역설이라고도 합니다.

문제는 일반적으로 다음과 같이 나타낼 수 있습니다.

문제 :그룹의 두 사람이 적어도 50-50의 확률로 생일이 같으려면 몇 명이 필요합니까?

이 문제에는 트릭이 없습니다. 그것은 단순히 주변 확률을 계산하는 것을 포함합니다.

무작위로 선택된 사람일 때 어떤 날(윤년 제외)에 생일일 확률은 연중 날짜에 걸쳐 균일하게 분포되어 있다고 가정합니다(예: 1/365 또는 약 0.273%).

직감적으로 생각하면, 적어도 1년의 일수만큼 많은 사람들이 필요할 수 있다고 가정할 수 있습니다 (예 : 365). 이것은 나의 생일과 다른 사람들의 생일이 일치한다고 생각하기 때문에 실패할 가능성이 높습니다. 즉, 나는 나와 같은 날에 태어난 사람이 그룹 내에 존재하기 위해 얼마나 많은 사람들이 필요한지 생각하고 있습니다. 하지만 이것은 잘못된 생각입니다.

대신, 그룹 내의 사람들 쌍과 주어진 쌍이 같은 날에 태어날 확률을 비교하는 것에 대해 생각할 수 있습니다. 이렇게 하면 필요한 계산을 할 수 있게 됩니다.

그룹 내의 쌍별 비교 횟수(각 사람을 자신과 비교하는 것은 제외)는 다음과 같이 계산됩니다.

  • 비교 = n * (n – 1) / 2

예를 들어, 5명으로 구성된 그룹이 있는 경우 그룹 간에 10번의 쌍별 비교를 수행하여 생일이 같은지 확인하므로 예상보다 일치할 기회가 더 많습니다. 중요한 것은 그룹 내의 비교 수가 그룹의 크기에 따라 기하급수적으로 증가한다는 것입니다.

여기서 한단계 더 필요합니다. 문제의 역수를 계산하는 것이 더 쉽습니다. 즉, 그룹의 두 사람이 생일이 같지 않을 확률입니다. 그런 다음 최종 결과를 반전하여 원하는 확률을 제공 할 수 있습니다.

  • p(n명 중 2명은 생일이 같음) = 1 – p(n명 중 2명은 생일이 같지 않음)

일치하지 않는 생일의 확률을 계산하는 것이 소그룹 (이 경우 세 사람)의 예를 통해 쉬운 이유를 알 수 있습니다.

사용자를 그룹에 하나씩 추가할 수 있습니다. 그룹에 사람이 추가될 때마다 해당 연도에 생일이 없는 사용 가능한 일 수가 줄어들고 사용 가능한 일 수가 1씩 줄어듭니다. 예를 들어 365 일, 364 일 등

또한 그룹에 추가된 사람에 대해 일치하지 않을 확률은 이전에 계산된 확률과 결합되어야 합니다. 예를 들어 P (n = 2) * P (n = 3) 등입니다.

이렇게 하면 그룹 크기가 3일 경우 생일이 일치하지 않을 확률은 다음과 같습니다.

  • P (n = 3) = 365/365 * 364/365 * 363/365
  • P (n = 3) = 99.18 %

이것을 반전하면 3일 경우 생일이 일치할 확률은 약 0.820%입니다.

이 단계를 수행하면 첫 번째 사람의 생일을 제외하면 나머지 구성원의 생일 후보 일수가 365일에서 364일(즉, 생일이 없는 날)로 줄어듭니다. 두 번째 사람의 경우 생일이 일치할 확률을 해당 연도의 365일에서 364일 또는 생일이 같지 않을 확률이 약 99.72%로 계산됩니다. 이제 사용 가능한 일수에서 두 번째 사람의 생일을 빼면 363이 나옵니다. 세 번째 사람의 생일이 일치하지 않을 확률은 363/365에 이전 확률을 곱하여 약 99.18%입니다.

대규모 그룹의 경우 아래와 같이 자동화할 수 있습니다.

아래 예제에서는 2에서 30까지의 그룹 크기에 대한 확률을 계산합니다.

예제를 실행하면 먼저 그룹 크기를 출력한 다음 사용 가능한 날짜를 해당 연도의 총 일수로 나눈 값, 그룹에서 일치하는 생일이 없을 확률, 전체 숫자 또는 그룹에서 생일이 일치할 확률이 출력됩니다.

결과는 놀랍게도 두 사람의 생일이 같을 확률이 50 % 이상으로 나오기 위해 23 명만 필요하다는 것을 보여줍니다.

더 놀라운 것은 30 명이 되면 70%의 확률로 증가한다는 것입니다. 20명에서 30명이 평균적인 학급 인원규모이기 때문에 놀랍습니다. 그룹 규모를 약 60 명으로 늘리면 그룹에서 두 사람이 생일이 같을 확률이 99 % 이상입니다!


남자 또는 여자 문제

응용 확률의 또 다른 전형적인 예는 아기가 남자인지 여자인지에 대한 확률을 계산하는 경우입니다.

아무런 정보가 주어지지 않았다면 아기가 남자인지 여자인지에 대한 확률은 50 %입니다. 

더 많은 정보가 포함되면 확률 계산이 변경되어 수학과 확률에 정통한 사람들조차도 헤매게 됩니다.

인기있는 예는 두 자녀를 둔 가족에 대한 정보를 제공하고 한 자녀의 성별을 추정하는 것과 관련된 “두 자녀 문제“라고 합니다. 문제가 정확하게 언급되지 않으면 오해로 이어질 수 있으며 확률을 계산하는 두 가지 다른 방법이 있습니다. 이것은 수학적 표기법 대신 자연어를 사용하는 도전이며, 이 경우 “남자 또는 여자의 역설“이라고 합니다.

정확하게 언급 된 두 가지 예를 살펴 보겠습니다.

사례 1 : 여자는 두 명의 자녀가 있으며 첫째는 남자입니다. 이 여자가 두명의 아들을 가질 확률은 얼마입니까?

무조건 확률 표를 고려하십시오.

우리의 직감에 따르면 다른 아이가 남자일 확률은 0.5 또는 50 %입니다.

또는 우리의 직관은 두 명의 남자가 있는 가족의 확률이 두 자녀 가족을 위한 남자와 여자의 네 가지 가능한 조합에 대해 1/4 (예 : 확률 0.25)이라고 제안 할 수 있습니다.

주어진 정보를 포함하는 가능한 모든 조합을 열거하여이를 탐색 할 수 있습니다.

직관적으로 생각하면 추가 정보로 인해 어떤 경우는 불가능한 것으로 결론 짓게 됩니다.

네 가지 결과가 있지만 주어진 정보는 문제를 2 가지 가능한 결과로 줄입니다 (나이가 많은 어린이는 남자입니다).

실제로 두 결과 중 하나만 남자가 될 수 있으므로 확률은 1/2 또는 (0.5) 50 %입니다.

매우 유사한 두 번째 사례를 살펴 보겠습니다.

사례 2 : 한 여성에게 두 명의 자녀가 있으며 그 중 하나는 남자입니다. 이 여자가 두 아들을 가질 확률은 얼마입니까?

직관적으로 생각하면 우리는 같은 결론으로 도약합니다. 적어도 제 경우에는 그랬습니다.

하지만 이것은 잘못된 것입니다.

예를 들어, 두 번째 아이가 남자인 경우 1/2입니다. 또 다른 생각은 두 자녀를 가질 수 있는 모든 경우 중 남자-남자의 경우 1/4 일 수 있습니다.

이유를 다시 알아보기 위해 가능한 모든 조합을 열거 해 보겠습니다.

다시 말하지만, 직관적으로 생각할 경우 추가 정보가 일부 경우를 불가능하게 만든다는 것입니다.

네 가지 결과가 있지만 제공된 정보는 문제를 세 가지 가능한 결과로 줄입니다 (한 자녀는 남자입니다). 세 가지 경우 중 하나는 남자-남자일 때 확률은 1/3 또는 약 33.33 %입니다.

사례 1에 더 많은 정보가 있으므로 가능한 결과의 영역을 좁히고 직관과 일치하는 결과를 제공 할 수 있습니다.

사례 2는 매우 유사해 보이지만 실제로는 정보가 적습니다. 나이가 많거나 어린아이가 남자인지 알 수 없으므로 가능한 결과의 영역이 더 커서 직관적이지 않은 대답이 나옵니다.

조건부 확률 계산을 사용하여 문제에 접근할 수도 있습니다.

사례 1에서 우리는 문제를 다음과 같이 진술할 수 있습니다 : 첫째 아이가 남자로 알려져 있다고 가정하면 임의의 가족이 두 명의 남자아이 (예 : 남자-남자의 순서)를 가질 확률은 얼마입니까?

다른 사건이 있을 때 한 사건의 확률을 조건부 확률이라고 하며 다음 공식을 사용하여 계산할 수 있습니다.

  • P (A 주어진 B) = P (A 및 B) / P (B)

여기서 이벤트 A를 “2명 남자아이”로, 이벤트 B를 “첫째 남자아이”로 간주 할 수 있습니다.

  • A = “남자아이 2명”
  • B = “첫째가 남자아이”

다음 항을 사용하여 조건부 확률 계산을 다시 설명할 수 있습니다.

  • P(“첫째가 남자 아이일 때 둘다 남자”) = P(“2명의 남자 아이”와 “첫째는 남자”) / P(“첫째는 남자”)

한 가정에서 태어난 자녀들이라면 특정 결과의 관점에서 사건을 보는 것이 도움이 됩니다.

예를 들어, 이벤트는 다음과 같이 남자와 여자의 시퀀스로 정의할 수 있습니다.

  • “2명의 남자 아이”에는 {남자-남자}가 포함됩니다.
  • “첫째가 남자”에는 {남자-남자, 여자-남자}가 포함됩니다.

{여자-여자}와 {남자-여자} 사건은 주어진 정보, 즉 가장 큰 아이가 남자라는 정보를 감안할 때 불가능합니다.

이런 식으로 이벤트의 정의를 살펴보면 조건부 확률 계산의 분자 P ( “2명의 남자 아이” 및 “첫째가 남자”)에 약간의 중복이 포함되어 있음을 알 수 있습니다. 특히 이벤트 “2명의 남자 아이”는 “첫째는 남자” 이벤트의 하위 집합입니다.

이것은 조건부 확률의 특별한 경우입니다 (예 : 사건 A가 사건 B의 부분 집합 인 경우 P (A 및 B).

이 특별한 경우, P(A 및 B)는 P(A)로 단순화될 수 있습니다.

  • P(A 및 B) = P(A), 이벤트 A가 이벤트 B의 하위 집합인 경우.

이것은 초보자에게 어려울 수 있지만 A가 B의 하위 집합인 경우 A가 B의 발생을 의미한다고 종종 말합니다. 즉, A가 발생하면 B가 확실하거나 확률이 1.0입니다.

  • P (A 및 B) = (A * B) = (A * 1.0)

따라서 분자를 “2명의 남자 아이”의 확률로 단순화할 수 있습니다.

  • P(“2명의 남자 아이” 및 “첫째가 남자”) = P(“2명의 남자 아이”)

이제 이 단순화를 사용하여 조건부 확률 계산을 다시 설명할 수 있습니다.

  • P(“첫째가 남자”일 때 “2명의 남자”) = P(“2명의 남자 아이”) / P(“첫째는 남자”)

위의 무조건 확률 표에서 알고 있는 것을 이용하여 이러한 용어로 대체할 수 있습니다.

예를 들어 “2명의 남자 아이”(예: “남자-남자”)의 확률은 1/4입니다. “첫째는 남자”의 확률은 1/4인 “남자-남자”의 확률에 2/4에 해당하는 1/4인 “여자-남자”의 확률을 더한 것입니다.

  • P(“남자 아이 2명”) = 1/4
  • P(“첫째는 남자”) = (1/4 + 1/4) = 2/4 = 1/2

그러므로:

  • P(“첫째는 남자”일 때 “2명의 남자”) = P(“2명의 남자 아이”) / P(“첫째는 남자”)
  • P(“첫째는 남자”일 때 “2명의 남자”) = (1/4) / (1/2)
  • P(“첫째는 남자”일 때 “2명의 남자”) = 1/2

또는 분수 대신 숫자로 :

  • P(“첫째는 남자”일 때 “2명의 남자”) = P(“2명의 남자”) / P(“가장 나이가 많은 남자은 남자”)
  • P(“첫째는 남자”일 때 “2명의 남자”) = 0.25 / 0.5
  • P(“”첫째는 남자”일 때 “2명의 남자”) = 0.5

사례 2에서 우리는 문제를 다음과 같이 진술할 수 있습니다 : 임의의 가족이 두 명의 남자 아이를 가질 확률은 자녀 중 한 명이 남자인 경우.

조건부 확률의 계산은 다음과 같습니다.

  • P (A 주어진 B) = P (A 및 B) / P (B)

여기서는 이벤트 A를 “2 명의 남자 아이”로, 이벤트 B를 “최소 1 명의 남자 아이”로 간주 할 수 있습니다.

  • A = “남자 아이 2명”
  • B = “적어도 1명의 남자 아이”

그리고 다음 항을 사용하여 조건부 확률 계산을 다시 설명할 수 있습니다.

  • P(“최소 1명은 남자”일 때 “2명의 남자”) = P(“2명의 남자” 및 “최소 1명의 남자”) / P(“최소 1명의 남자”)

이 계산에서 특히 분자 P(“2명의 남자” 및 “최소 1명의 남자”)에서 약간의 중복을 볼 수 있습니다.

이벤트 “최소 1명은 남자”은 “2명의 남자”보다 더 일반적이며, 달리 말하면 “2명의 남자”는 “최소 1명은 남자” 이벤트의 하위 집합입니다.

  • “2명의 남자”에는 {남자-남자}가 포함됩니다.
  • “적어도 1명은 남자”에는 {남자-남자, 남자-여자, 여자-남자}가 포함됩니다.

조건부 확률의 규칙이 주어지면 :

  • P(A 및 B) = P(A), 이벤트 A가 이벤트 B의 하위 집합인 경우.

분자를 “2명의 남자”로 단순화할 수 있습니다.

  • P(“2 boys” and “at least 1 boy”) = P(“2 boys”)

이제 다시 계산할 수 있습니다.

  • P(“최소 1명은 남자”일 때 “2명의 남자”) = P(“2명의 남자”) / P(“최소 1명의 남자”)

그런 다음 위의 무조건 확률 표를 사용하여 계산에 특정 값을 대체할 수 있습니다.

예를 들어, “2명의 남자”(예 : 남자-남자)의 확률은 1/4입니다. “적어도 1 명의 남자”의 확률은 “남자-남자”의 확률에 “남자-남자”의 확률을 더한 것입니다.

  • P(“남자 2명”) = 1/4
  • P(“적어도 1명의 남자”) = (1/4 + 1/4 + 1/4) = 3/4

그러므로:

  • P(“최소 1명의 남자”일 때 “2명의 남자”) = P(“2명의 남자”) / P(“최소 1명의 남자”)
  • P(“최소 1명의 남자”일 때 “2명의 남자”) = (1/4) / (3/4)
  • P(“최소 1명의 남자”일 때 “2명의 남자”) = 1/3

또는 분수 대신 숫자로 :

  • P(“최소 1명의 남자”일 때 “2명의 남자”) = P(“2명의 남자”) / P(“최소 1명의 남자”)
  • P(“최소 1명의 남자”일 때 “2명의 남자”) = 0.25 / 0.75
  • P(“최소 1명의 남자”일 때 “2명의 남자”) = 0.333

이 계산은 확률 : 열정적 인 초보자를 위한 과정의 96 페이지에 나와 있습니다.

이것은 가능한 사례를 열거하여 잘못된 직관을 극복하고 정답을 얻는 방법과 조건부 확률을 계산하는 동일한 목적을 달성하는 방법에 대한 유용한 설명입니다.



몬티 홀 문제

적용 확률의 마지막 고전적 문제는 게임 쇼 문제 또는 몬티 홀 문제라고 합니다.

그것은 “Let’s Make a Deal“이라는 실제 게임 쇼를 기반으로 하며 쇼 호스트의 이름을 따서 명명되었습니다.

문제는 일반적으로 다음과 같이 설명할 수 있습니다.

문제 : 참가자는 세 개의 문을 선택할 수 있습니다. 한 대 뒤에는 차가 있고 다른 두 대 뒤에는 염소가 있습니다. 문이 선택되면 차가 어디에 있는지 아는 호스트는 염소가 있는 다른 문을 열고 참가자에게 선택을 유지할지 아니면 열리지 않은 다른 문으로 변경할 것인지 묻습니다.

솔루션이 직관적이지 않고 과거에는 큰 혼란과 논쟁을 불러 일으켰 기 때문에 또 다른 고전적인 문제입니다.

직관을 따르면 처음에는 차를 고를 확률이 3분의 1 또는 33%이며 호스트가 문을 열어 염소를 드러내면 1/2 또는 50%가 됩니다.

이것은 올바르지 않습니다.

모든 조합을 열거하고 무조건 확률을 나열하는 것으로 시작할 수 있습니다. 세 개의 문을 가정하고 사용자가 무작위로 문(예: 문 1)을 선택합니다.

이 단계에서는 지금까지 우리의 직관과 일치하게 자동차가 1/3 확률로 나옵니다.

그런 다음 호스트는 염소가 있는 다른 문 (이 경우 문 2)을 엽니 다.

열린 문은 무작위로 선택되지 않았습니다. 대신 자동차가 없는 위치에 대한 정보로 선택되었습니다.

우리의 직관은 테이블에서 두 번째 사례를 제거하고 나머지 각 사례에 대해 확률을 1/2로 업데이트 할 것을 제안합니다.

이는 올바르지 않으며 오류의 원인입니다.

이 시나리오에 대한 직관적인 조건부 확률을 다음과 같이 요약할 수 있습니다.

호스트가 문을 열기 전에 참가자가 선택을 하지 않은 경우, 예를 들어 문을 여는 호스트가 독립적인 경우와 같이 정확합니다.

호스트가 문을 열기 전에 참가자가 선택을 했기 때문에 트릭이 발생하며 이것은 유용한 정보입니다. 호스트가 선택한 문(door1)을 열거나 뒤에 차가 있는 문을 열 수 없음을 의미합니다. 호스트의 선택은 참가자의 첫 번째 선택에 따라 달라진 다음 제한되었습니다.

대신 호스트가 열리는 문에 관계없이 (선택을) 유지하거나 전환하지 않을 확률을 계산해야 합니다.

문 1의 선택과 전환하지 않음 또는 전환에 따른 결과 표를 살펴 보겠습니다.

전환의 경우 2/3가 자동차를 획득하고(처음 두 줄) 전환하지 않으면 1/3이 자동차(마지막 행)를 획득한다는 것을 알 수 있습니다.

참가자는 전환하면 2/3 또는 66.66%의 확률로 차를 얻을 수 있습니다.

항상 전환해야 합니다.

우리는 나열하고 계산하여 해결했습니다.

이 문제를 해결하는 또 다른 접근법은 원하는 결과의 확률을 최대화하기 위해 두 경우 모두에서 유지 대 전환 결정을 테스트하기 위해 호스트가 문을 여는 공동 확률을 계산하는 것입니다.

예를 들어, 참가자가 문 1을 선택했다고 가정하면 문 1에 자동차가 있는 경우 호스트가 문 3을 열 확률을 다음과 같이 계산할 수 있습니다.

  • P (문 1 = 자동차 및 문 3 = 열림) = 1/3 * 1/2
  • = 0.333 * 0.5
  • = 0.166

그런 다음 도어 2가 자동차와 호스트가 도어 3을 여는 결합 확률을 계산할 수 있습니다. 도어 2에 자동차가 포함되어 있으면 호스트는 도어 3만 열 수 있기 때문에 다릅니다. 확률은 1.0으로 확실합니다.

  • P (문 2 = 자동차 및 문 3 = 열림) = 1/3 * 1
  • = 0.333 * 1.0
  • = 0.333

도어 1을 선택하고 호스트가 도어 3을 열면 자동차가 도어 1(약 16%)보다 도어 2 뒤에 있을 확률(약 33%)이 더 높습니다. 우리는 전환해야 합니다.

이 경우 도어 2로 전환해야 합니다.

또는 동일한 확률 구조를 갖는 선택(호스트가 문2를 여는 것)을 모델링 할 수 있습니다.

  • P (문 1 = 자동차 및 문 2 = 열림) = 0.166
  • P (문 3 = 자동차 및 문 2 = 열림) = 0.333

다시 말하지만, 문 1을 선택하고 호스트가 문 2를 열면 자동차가 문 1(약 16%)보다 문 3 뒤에 있을 확률(약 33%)이 더 높습니다. 우리는 전환해야 합니다.

이러한 확률을 최대화 하려는 경우 가장 좋은 전략은 전환하는 것입니다.

다시 말하지만, 이 예에서는 사례를 열거하고 조건부 확률을 사용하여 잘못된 직관을 극복하고 문제를 해결할 수 있는 방법을 살펴보았습니다.



추가 정보

이 섹션에서는 더 자세히 알아보려는 경우 주제에 대한 더 많은 리소스를 제공합니다.


기사


요약

이 게시물에서는 고전적인 사고 유발 문제를 통해 확률에 대한 직관을 개발하는 방법을 발견했습니다.

특히 다음 내용을 배웠습니다.

  • 확률을 곱하여 생일 문제를 해결하는 방법.
  • 조건부 확률을 사용하여 남자 또는 여자 문제를 해결하는 방법.
  • 결합 확률을 사용하여 몬티 홀 문제를 해결하는 방법.

네피리티
No Comments

Sorry, the comment form is closed at this time.