파이썬에서 파라메트릭 통계적 가설 테스트를 계산하는 방법

모수 통계 방법은 종종 데이터 샘플에 가우스 분포가 있다고 가정하는 방법을 의미합니다.

응용 머신러닝에서는 데이터 샘플, 특히 샘플의 평균을 비교해야 합니다. 아마도 한 기술이 하나 이상의 데이터 세트에서 다른 기술보다 더 잘 수행되는지 확인하기 위해. 이 질문을 정량화하고 결과를 해석하기 위해 스튜던트 t-검정 및 분산 분석과 같은 모수가설 검정 방법을 사용할 수 있습니다.

이 자습서에서는 둘 이상의 데이터 표본 평균 간의 차이를 정량화하는 모수 통계적 유의성 검정을 알아봅니다.

이 자습서를 완료하면 다음을 알 수 있습니다.

  • 두 독립 데이터 표본의 평균 간의 차이를 정량화하기 위한 스튜던트 t-검정입니다.
  • 두 종속 데이터 표본의 평균 간의 차이를 정량화하기 위한 쌍체 스튜던트 t-검정입니다.
  • 상기 ANOVA와 반복 측정은 2개 이상의 데이터 샘플의 평균 간의 유사성 또는 차이를 확인하기 위한 분산 분석입니다.

튜토리얼 개요

  1. 모수 통계적 유의성 검정
  2. 테스트 데이터
  3. 스튜던트 t-검정
  4. 페어링된 학생 t-검정
  5. 분산 분석 검정
  6. 반복 측정 분산 분석 검정

모수 통계적 유의성 검정

모수 통계 검정에서는 데이터 표본이 특정 모집단 분포에서 추출되었다고 가정합니다.

그들은 종종 가우스 분포를 가정하는 통계 테스트를 참조합니다. 데이터가 이 분포를 적합시키는 것이 매우 일반적이기 때문에 모수 통계 방법이 더 일반적으로 사용됩니다.

두 개 이상의 데이터 샘플에 대해 가질 수 있는 일반적인 질문은 분포가 동일한지 여부입니다. 모수 통계적 유의성 검정은 데이터가 동일한 가우스 분포, 즉 평균과 표준 편차가 동일한 데이터 분포, 즉 분포의 매개 변수에서 나온다고 가정하는 통계적 방법입니다.

일반적으로 각 검정은 통계에 대한 배경 지식과 통계 검정 자체에 대한 더 깊은 지식을 가지고 해석해야 하는 검정 통계량을 계산합니다. 또한 검정은 검정 결과를 해석하는 데 사용할 수 있는 p-값을 반환합니다. p-값은 두 표본이 동일한 분포를 가진 모집단에서 추출되었다는 기본 가정(귀무 가설)이 주어지면 두 데이터 표본을 관찰할 확률로 생각할 수 있습니다.

p-값은 알파라고 하는 선택된 유의 수준의 맥락에서 해석될 수 있습니다. 알파의 일반적인 값은 5% 또는 0.05입니다. p-값이 유의 수준보다 작으면 검정은 귀무 가설을 기각할 충분한 증거가 있으며 표본이 분포가 다른 모집단에서 추출되었을 가능성이 높다는 것입니다.

  • p <= 알파: 귀무 가설 기각, 다른 분포.
  • p > alpha: 귀무 가설, 동일한 분포를 기각하지 못합니다.

테스트 데이터

특정 모수적 유의성 테스트를 살펴보기 전에 먼저 각 테스트를 시연하는 데 사용할 수 있는 테스트 데이터 세트를 정의하겠습니다.

서로 다른 분포에서 추출한 두 개의 샘플을 생성합니다. 각 샘플은 가우스 분포에서 추출됩니다.

randn() NumPy 함수를사용하여 각 샘플에서 평균이 0이고 표준 편차가 1인 100개의 가우스 난수 샘플을 생성합니다. 첫 번째 표본의 관측치는 평균이 50이고 표준 편차가 5가 되도록 척도화됩니다. 두 번째 표본의 관측치는 평균이 51이고 표준 편차가 5가 되도록 척도화됩니다.

통계 테스트를 통해 표본이 서로 다른 분포에서 추출되었음을 발견할 것으로 예상하지만, 표본당 100개의 관측치라는 작은 표본 크기는 이 결정에 약간의 노이즈를 추가할 것입니다.

전체 코드 예제는 다음과 같습니다.

예제를 실행하면 데이터 샘플이 생성된 다음 각 샘플에 대한 평균 및 표준 편차를 계산하고 인쇄하여 서로 다른 분포를 확인합니다.



스튜던트 t-검정

스튜던트 t-검정은 가우스 분포를 갖는 것으로 알려진 두 개의 독립적인 데이터 샘플이 “학생“이라는 가명을 사용한 William Gosset의 이름을 따서 명명된 동일한 가우스 분포를 갖는다는 통계적 가설 검정입니다.

가장 일반적으로 사용되는 t 검정 중 하나는 독립 표본 t 검정입니다. 주어진 변수에 대한 두 독립 표본의 평균을 비교하려는 경우 이 검정을 사용합니다.

— 페이지 93, 일반 영어 통계, 제 3 판, 2010.

검정의 가정 또는 귀무 가설은 두 모집단의 평균이 동일하다는 것입니다. 이 가설을 기각하면 모집단의 평균이 다르고 분포가 동일하지 않다는 충분한 증거가 있음을 나타냅니다.

  • H0 기각 실패: 표본 분포가 동일합니다.
  • 기각 H0: 표본 분포가 같지 않습니다.

스튜던트 t-테스트는 ttest_ind() SciPy 함수를 통해 파이썬에서 사용할 수 있습니다. 이 함수는 두 개의 데이터 표본을 인수로 사용하고 계산된 통계량과 p-값을 반환합니다.

검정이 두 독립 표본 간의 분포 차이를 발견할 것이라는 기대와 함께 검정 문제에 대한 스튜던트 t-검정을 시연할 수 있습니다. 전체 코드 예제는 다음과 같습니다.

예제를 실행하면 생성된 데이터 샘플에 대한 스튜던트 t-검정이 계산되고 통계량과 p-값이 인쇄됩니다.

통계량을 해석하면 표본 평균이 다르며 유의성이 5% 이상이라는 것을 알 수 있습니다.



짝을 이룬 학생의 t-검정

어떤 식으로든 관련된 두 데이터 표본 간의 평균을 비교하려고 할 수 있습니다.

예를 들어, 데이터 샘플은 동일한 객체에 대한 두 개의 독립적인 측정값 또는 평가를 나타낼 수 있습니다. 이러한 데이터 샘플은 반복되거나 종속적이며 쌍체 샘플 또는 반복 측정값이라고 합니다.

표본이 독립적이지 않기 때문에 스튜던트 t-검정을 사용할 수 없습니다. 대신, 데이터 샘플이 종속적이라는 사실을 수정하는 수정된 버전의 검정(쌍을 이루는 스튜던트 t-검정이라고 함)을 사용해야 합니다.

종속 표본 t 검정은 단일 종속 변수에 대한 두 평균을 비교하는 데에도 사용됩니다. 그러나 독립 표본 검정과 달리 종속 표본 t 검정은 단일 표본 또는 일치하거나 쌍을 이루는 두 표본의 평균을 비교하는 데 사용됩니다.

— 페이지 94, 일반 영어 통계, 제 3 판, 2010.

테스트는 더 이상 관찰 사이에 차이가 있다고 가정하지 않고 동일한 피험자에 대한 치료 전후에 관찰이 쌍으로 이루어 졌다고 가정하지 않기 때문에 단순화됩니다.

검정의 기본 가정 또는 귀무 가설은 표본 간의 평균에 차이가 없다는 것입니다. 귀무 가설의 기각은 표본 평균이 다르다는 충분한 증거가 있다는 것을 나타냅니다.

  • H0 기각 실패: 쌍체 표본 분포가 동일합니다.
  • H0 기각: 쌍체 표본 분포가 같지 않습니다.

쌍을 이루는 스튜던트 t-테스트는 ttest_rel() SciPy 함수를 사용하여 파이썬에서 구현할 수 있습니다. 쌍을 이루지 않은 버전과 마찬가지로 이 함수는 두 개의 데이터 샘플을 인수로 사용하고 계산된 통계량과 p-값을 반환합니다.

테스트 데이터 세트에서 쌍을 이루는 스튜던트 t-검정을 시연할 수 있습니다. 표본이 쌍을 이루지 않고 독립적이지만 관측치가 쌍을 이루는 척하고 통계량을 계산할 수 있습니다.

전체 예제는 다음과 같습니다.

예제를 실행하면 검정 통계량과 p-값이 계산되고 인쇄됩니다. 결과의 해석은 표본의 평균이 다르므로 분포가 다르다는 것을 시사합니다.



분산 분석 검정

때때로 여러 개의 독립적인 데이터 샘플이 있을 수 있는 상황이 있습니다.

데이터 표본의 각 조합에 대해 스튜던트 t-검정을 쌍으로 수행하여 어떤 표본이 다른 평균을 가지고 있는지 파악할 수 있습니다. 모든 샘플의 분포가 동일한지 여부에만 관심이 있는 경우 부담스러울 수 있습니다.

이 질문에 답하기 위해 분산 분석 테스트 또는 줄여서 ANOVA를 사용할 수 있습니다. ANOVA는 2개 이상의 그룹에 걸친 평균이 동일하다고 가정하는 통계적 검정입니다. 증거가 그렇지 않다는 것을 시사하는 경우 귀무 가설이 기각되고 하나 이상의 데이터 표본이 다른 분포를 갖습니다.

  • H0 기각 실패: 모든 표본 분포가 동일합니다.
  • 기각 H0: 하나 이상의 표본 분포가 같지 않습니다.

중요한 것은 테스트가 모든 샘플이 동일한지 여부에 대해서만 언급할 수 있다는 것입니다. 어떤 샘플이 얼마나 다른지 또는 얼마나 다른지 정량화할 수 없습니다.

일원 분산 분석(일원 분산 분석)의 목적은 하나의 종속 변수에 대해 둘 이상의 그룹(독립 변수)의 평균을 비교하여 그룹 평균이 서로 유의하게 다른지 확인하는 것입니다.

— 페이지 105, 일반 영어 통계, 제3판, 2010.

이 테스트에서는 데이터 표본이 가우스 분포이고, 표본이 독립적이며, 모든 데이터 표본의 표준 편차가 동일해야 합니다.

ANOVA 테스트는 f_oneway() SciPy 함수를 사용하여 파이썬에서 수행할 수 있습니다. 이 함수는 둘 이상의 데이터 샘플을 인수로 사용하고 검정 통계량과 f-값을 반환합니다.

평균이 같은 두 표본과 약간 다른 평균을 가진 세 번째 표본을 갖도록 검정 문제를 수정할 수 있습니다. 그런 다음 테스트에서 하나 이상의 샘플이 다른 분포를 갖는다는 것을 발견할 것으로 예상합니다.

전체 예제는 다음과 같습니다.

예제를 실행하면 검정 통계량과 p-값이 계산되어 인쇄됩니다.

p-값의 해석은 하나 이상의 표본 평균이 다르다는 것을 나타내는 귀무 가설을 올바르게 기각합니다.



반복 측정 분산 분석 검정

어떤 식으로든 관련되거나 종속적인 여러 데이터 샘플이 있을 수 있습니다.

예를 들어, 우리는 다른 기간에 주제에 대해 동일한 측정을 반복 할 수 있습니다. 이 경우 샘플은 더 이상 독립적이지 않습니다. 대신 여러 쌍의 샘플이 있습니다.

쌍별 스튜던트 t-검정을 여러 번 반복할 수 있습니다. 또는 단일 검정을 사용하여 모든 표본의 평균이 동일한지 확인할 수 있습니다. ANOVA 테스트의 변형을 사용하거나 수정하여 2개 이상의 샘플에서 테스트할 수 있습니다. 이 테스트를 반복 측정 분산 분석 테스트라고합니다.

기본 가정 또는 귀무 가설은 모든 쌍체 표본의 평균이 동일하므로 분포가 동일하다는 것입니다. 표본에서 그렇지 않다고 제안하면 귀무 가설이 기각되고 쌍체 표본 중 하나 이상이 다른 평균을 갖습니다.

  • H0 기각 실패: 모든 쌍체 표본 분포가 동일합니다.
  • 기각 H0: 하나 이상의 쌍체 표본 분포가 같지 않습니다.

그러나 반복 측도 분산 분석은 쌍체 t 검정에 비해 여러 가지 장점이 있습니다. 첫째, 반복 측정 분산 분석을 사용하면 두 개 이상의 시점에서 측정된 종속 변수에 대한 차이를 조사할 수 있는 반면, 독립 t 검정을 사용하면 두 시점의 종속 변수에 대한 점수만 비교할 수 있습니다.

— 페이지 131, 일반 영어 통계, 제 3 판, 2010.

불행히도 작성 당시에는 SciPy에서 사용할 수 있는 반복 측정 ANOVA 테스트 버전이 없습니다. 이 테스트가 곧 추가되기를 바랍니다.

프로젝트에서 필요하고 대체 구현을 찾고 찾을 수있는 경우 완전성을 위해이 테스트를 언급합니다.


확장

이 섹션에는 탐색할 수 있는 자습서를 확장하기 위한 몇 가지 아이디어가 나열되어 있습니다.

  • 분포가 동일한 데이터 표본에 대해 작동하도록 모든 예제를 업데이트합니다.
  • 각 테스트의 요구 사항과 동작에 따라 세 가지 통계적 유의성 테스트 각각을 선택하기 위한 순서도를 만듭니다.
  • 머신러닝 프로젝트에서 데이터 샘플을 비교하는 3가지 사례를 고려하고, 샘플에 대해 비가우스 분포를 가정하고, 각 경우에 사용할 수 있는 테스트 유형을 제안합니다.


추가 정보

이 섹션에서는 더 자세히 알아보려는 경우 주제에 대한 더 많은 리소스를 제공합니다.


API

기사


요약

이 자습서에서는 둘 이상의 데이터 표본 평균 간의 차이를 정량화하는 모수 통계적 유의성 검정을 발견했습니다.

특히 다음 내용을 배웠습니다.

  • 두 독립 데이터 표본의 평균 간의 차이를 정량화하기 위한 스튜던트 t-검정입니다.
  • 두 종속 데이터 표본의 평균 간의 차이를 정량화하기 위한 쌍체 스튜던트 t-검정입니다.
  • ANOVA와 반복 측정은 둘 이상의 데이터 샘플의 평균 간의 유사성 또는 차이를 확인하기 위한 분산 분석입니다.

네피리티
No Comments

Sorry, the comment form is closed at this time.