확률 분포에 대한 간략한 소개

확률은 한 사건의 가능성을 계산하는 것 이상으로 사용될 수 있습니다. 가능한 모든 결과의 가능성을 요약 할 수 있습니다.

확률에는 확률 변수라고 하는 흥미로운 것이 있으며 확률 변수에 대한 각 가능한 결과와 확률 간의 관계를 확률 분포라고합니다.

확률 분포는 확률의 중요한 기본 개념이며 일반적인 확률 분포의 이름과 모양은 익숙할 것입니다. 확률 분포의 구조와 유형은 계량형 또는 이산형과 같은 확률 변수의 속성에 따라 달라지며, 이는 분포를 요약하는 방법 또는 가장 가능성이 높은 결과와 확률을 계산하는 방법에 영향을 미칩니다.

이 게시물에서는 확률 분포에 대한 간략한 소개를 보게 될 것입니다.

이 게시물을 읽은 후 다음을 알게 될 것입니다.

  • 확률 변수는 정의된 영역을 가지며 연속 또는 이산형일 수 있습니다.
  • 확률 분포는 가능한 값과 확률 변수에 대한 확률 간의 관계를 요약합니다.
  • 확률 밀도 또는 질량 함수는 값을 확률에 매핑하고 누적 분포 함수는 값보다 작거나 같은 결과를 확률에 매핑합니다.

개요

이 자습서는 다음과 같이 네 부분으로 나뉩니다.

  1. 확률 변수
  2. 확률 분포
  3. 이산 확률 분포
  4. 연속 확률 분포

확률 변수

확률 변수는 랜덤 프로세스에 의해 생성되는 수량입니다.

확률에서 확률 변수는 가능한 많은 값 중 하나를 취할 수 있습니다 (예 : 상태 공간의 이벤트). 확률 변수에 대한 특정 값 또는 값 집합에 확률을 할당할 수 있습니다.

확률 모델링에서 예제 데이터 또는 인스턴스는 종종 이벤트, 관찰 또는 기본 확률 변수의 실현으로 간주됩니다.

— 페이지 336, 데이터 마이닝: 실용적인 기계 학습 도구 및 기술, 4판. 2016.

확률 변수는 종종 대문자(예: X)로 표시되고 확률 변수의 값은 소문자와 인덱스(예: x1,x2,x3)로 표시됩니다.

X와 같은 대문자는 확률 변수를 나타내고 x와 같은 소문자는 확률 변수가 사용하는 값을 나타냅니다.

— 페이지 viii,확률: 열정적인 초보자를 위해, 2016.

확률 변수가 취할 수 있는 값을 해당 영역이라고 하며, 확률 변수의 영역은 이산형이거나 연속형일 수 있습니다.

확률 이론의 변수를 확률 변수라고 하며 이름은 대문자로 시작합니다. […] 모든 확률 변수에는 영역, 즉 사용할 수 있는 가능한 값의 집합이 있습니다.

— 페이지 486, 인공 지능: 현대적인 접근 방식, 3판, 2009.

이산 확률 변수는 유한한 상태 집합을 갖습니다 (예 : 자동차 색상). true 또는 false 값을 갖는 확률 변수는 이산형이며 참거짓 확률 변수(예: 동전 던지기)라고 합니다. 연속 확률 변수에는 숫자 값의 범위가 있습니다 (예 : 인간의 키).

  • 이산 확률 변수. 값은 유한한 상태 집합에서 가져옵니다.
  • 참거짓 확률 변수. 값은 {참, 거짓} 집합에서 가져옵니다.
  • 연속 확률 변수. 값은 숫자 값의 범위에서 가져옵니다.

확률 변수의 값은 등호 연산자를 통해 지정할 수 있습니다(예: X=True).

확률 변수의 확률은 대문자 또는 Pr을 사용하는 함수로 표시됩니다. 예를 들어,P(X)는 확률 변수 X에 대한 모든 값의 확률입니다.

확률 변수 값의 확률은P (X = True)로 표시 될 수 있으며,이 경우 X확률 변수가 True 값을 가질 확률을 나타냅니다.


확률 분포

확률 분포는 확률 변수 값에 대한 확률의 요약입니다.

분포로서, 확률에 대한 확률 변수의 값의 매핑은 확률 변수의 모든 값이 정렬될 때 모양을 갖습니다. 분포에는 측정 할 수 있는 일반적인 속성도 있습니다. 확률 분포의 두 가지 중요한 속성은 기대값과 분산입니다. 수학적으로 이를 분포의 첫 번째 및 두 번째 순간이라고 합니다. 다른 순간으로는 왜도 (3 번째 순간)와 첨도 (4 번째 순간)가 있습니다.

통계의 평균과 분산에 익숙할 수 있으며, 여기서 개념은 확률 분포 이외의 확률 변수 분포로 일반화됩니다.

기대값은 확률 변수 X의 평균 또는 평균값입니다. 가장 가능성이 높은 값 또는 확률이 가장 높은 결과입니다. 일반적으로 대괄호가 있는 대문자 E의 함수로 표시됩니다(예:X의 예상 값에 대한 E[X] 또는 E[f(x)] 여기서 함수 f()는 X 영역의 값을 샘플링 하는 데 사용됩니다.

확률 변수 X의 기대 값 (또는 평균)은 E (X)로 표시됩니다 …

— 페이지 134, 확률: 열정적인 초보자를 위해, 2016.

분산은 평균에서 확률 변수 값의 산포입니다. 이것은 일반적으로 함수 Var로 표시됩니다. 예를 들어,Var(X)는 함수 f()를 사용하여 X의 영역에서 가져온 값의 분산에 대한 확률 변수또는Var(f(x))의 분산입니다.

분산의 제곱근은 값을 정규화하며 표준 편차라고 합니다. 두 변수 간의 분산을 공분산이라고 하며 두 확률 변수가 함께 변하는 방식에 대한 선형 관계를 요약합니다.

  • 예상 값입니다. 확률 변수의 평균값입니다.
  • 분산. 예상 값 주위의 평균 값 분산입니다.

각 확률 변수에는 고유한 확률 분포가 있지만 여러 다른 확률 변수의 확률 분포는 동일한 모양을 가질 수 있습니다.

가장 일반적인 확률 분포는 몇 가지 매개 변수를 사용하여 정의할 수 있으며 예상 값과 분산을 계산하는 절차를 제공합니다. 확률 분포의 구조는 확률 변수가 이산형인지 계량형인지에 따라 달라집니다.


이산 확률 분포

이산 확률 분포는 이산 확률 변수에 대한 확률을 요약합니다.

확률질량함수(PMF)는 이산형 확률 변수에 대한 확률 분포를 정의합니다. 특정 이산 값에 대한 확률을 할당하는 함수입니다.

이산 확률 분포에는 누적 분포 함수 또는 CDF가 있습니다. 이것은 이산 확률 변수가 특정 이산 값보다 작거나 같은 값을 가질 확률을 할당하는 함수입니다.

  • 확률 질량 함수. 이산 확률 변수의 값에 대한 확률입니다.
  • 누적 분포 함수. 확률은 확률 변수의 값보다 작거나 같습니다.

확률 변수의 값은 순서일 수도 있고 아닐 수도 있으며, 이는 숫자 라인에서 정렬되거나 정렬되지 않을 수 있음을 의미합니다(예: 카운트는 가능, 자동차 색상은 할 수 없음). 이 경우, PMF 및 CDF의 구조는 불연속적일 수 있거나, 값들에 걸친 상대적 확률에서 깔끔하거나 깨끗한 전이를 형성하지 않을 수 있다.

이산 확률 변수의 예상 값은 최빈값을 찾는 것과 같이 모드를 사용하여 샘플에서 계산할 수 있습니다. PMF의 확률 합은 1과 같습니다.

잘 알려진 이산 확률 분포의 몇 가지 예는 다음과 같습니다.

  • 푸 아송 분포.
  • 베르누이 분포와 이항 분포.
  • 다항 분포와 다항 분포.
  • 이산 균일 분포.

잘 알려진 이산 확률 분포를 가진 공통 영역의 몇 가지 예는 다음과 같습니다.

  • 주사위 굴림의 확률은 이산 균일 분포를 형성합니다.
  • 동전 던지기의 확률은 베르누이 분포를 형성합니다.
  • 확률 자동차 색상은 다항 분포를 형성합니다.


연속 확률 분포

계량형 확률 분포는 계량형 확률 변수에 대한 확률을 요약합니다.

확률 분포 함수 또는 PDF는 계량형 확률 변수에 대한 확률 분포를 정의합니다. 확률 질량 함수 또는 PMF를 갖는 이산 확률 변수와의 이름 차이에 유의하십시오.

이산 확률 분포와 마찬가지로 연속 확률 분포에는 영역의 특정 숫자 값보다 작거나 같은 값의 확률을 정의하는 누적 분포 함수 또는 CDF도 있습니다.

  • 확률 분포 함수. 계량형 확률 변수의 값에 대한 확률입니다.
  • 누적 분포 함수. 확률은 확률 변수의 값보다 작거나 같습니다.

연속 함수로서 구조는 간략한 곡선을 형성합니다.

잘 알려진 계량형 확률 분포의 몇 가지 예는 다음과 같습니다.

  • 정규 분포 또는 가우스 분포.
  • 멱법칙 분포.
  • 파레토 분포.

잘 알려진 계량형 확률 분포가 있는 영역의 몇 가지 예는 다음과 같습니다.

  • 인간의 키의 확률은 정규 분포를 형성합니다.
  • 영화가 히트작이 될 확률은 멱법칙 분포를 형성합니다.
  • 소득 수준의 확률은 파레토 분포를 형성합니다.

추가 정보

이 섹션에서는 더 자세히 알아보려는 경우 주제에 대한 더 많은 리소스를 제공합니다.

기사


요약

이 게시물에서는 확률 분포에 대한 간략한 소개를 발견했습니다.

특히 다음 내용을 배웠습니다.

  • 확률의 확률 변수는 정의된 영역을 가지며 연속 또는 이산형일 수 있습니다.
  • 확률 분포는 가능한 값과 확률 변수에 대한 확률 간의 관계를 요약합니다.
  • 확률 밀도 또는 질량 함수는 값을 확률에 매핑하고 누적 분포 함수는 값보다 작거나 같은 결과를 확률에 매핑합니다.

질문이 있으신가요?
아래 의견에 질문을 하면 최선을 다해 답변해 드리겠습니다

네피리티
No Comments

Sorry, the comment form is closed at this time.