12월 2022

선형 대수학은 벡터, 행렬 및 선형 변환과 관련된 수학의 하위 분야입니다.알고리즘 작동을 설명하는 데 사용되는 표기법에서 코드의 알고리즘 구현에 이르기까지 머신러닝 분야의 핵심 기반입니다.선형 대수학은 머신러닝 분야에 필수적이지만 긴밀한 관계는 종종 벡터 공간이나 특정 행렬 연산과 같은 추상적 개념을 사용하여 설명되지 않습니다.이 게시물에서는 선형 대수학을 사용하는 머신러닝의 10가지 일반적인 예를 발견하게 될 것입니다.이 게시물을 읽은 후 다음을 알게 될 것입니다.테이블 형식 데이터 세트 및 이미지와 같은 데이터로 작업할...

Read More

선형 대수학은 머신러닝에 대한 더 깊은 이해의 전제 조건으로 보편적으로 동의되는 수학 분야입니다.선형 대수학은 많은 난해한 이론과 발견이 있는 큰 분야이지만 현장에서 가져온 너트와 볼트 도구와 표기법은 머신러닝 실무자에게 실용적입니다. 선형 대수학이 무엇인지에 대한 견고한 기초가 있으면 좋은 부분이나 관련 부분에만 집중할 수 있습니다.이 튜토리얼에서는 머신러닝 관점에서 선형 대수학이 정확히 무엇인지 알아낼 것입니다.이 자습서를 완료하면 다음을 알 수 있습니다.선형 대수학은 데이터의 수학입니다.선형 대수학은 통계 분야에...

Read More

데이터에 상한과 하한을 두는 것이 유용할 수 있습니다.이러한 경계는 변칙을 식별하고 예상되는 사항에 대한 기대치를 설정하는 데 사용할 수 있습니다. 모집단의 관측치에 대한 한계를 공차 구간이라고 합니다. 공차 구간은 추정 통계량 필드에서 나옵니다.공차 구간은 단일 예측값에 대한 불확실성을 정량화하는 예측 구간과 다릅니다. 또한 평균과 같은 모집단 모수의 불확실성을 정량화하는 신뢰 구간과도 다릅니다. 대신, 공차 구간은 모집단 분포의 일부를 포함합니다.이 자습서에서는 통계적 공차 구간과 가우스 데이터에 대한 공차...

Read More

머신러닝 관점의 예측은 해당 예측의 불확실성을 숨깁니다.예측 구간은 예측의 불확실성을 정량화하고 전달하는 방법을 제공합니다. 이는 대신 평균 또는 표준 편차와 같은 모집단 모수의 불확실성을 정량화하려는 신뢰 구간과 다릅니다. 예측 구간은 단일 특정 결과에 대한 불확실성을 설명합니다.이 자습서에서는 예측 구간과 간단한 선형 회귀 모델에 대해 예측구간을 계산하는 방법을 알아봅니다.이 자습서를 완료하면 다음을 알 수 있습니다.예측 구간은 단일 지점 예측의 불확실성을 정량화합니다.이 예측 구간은 간단한 모델의 경우...

Read More

머신러닝의 대부분은 보이지 않는 데이터에 대한 머신러닝 알고리즘의 성능을 추정하는 것과 관련이 있습니다.신뢰 구간은 추정치의 불확실성을 정량화하는 방법입니다. 모집단의 독립 관측치 표본에서 추정된 평균과 같은 모집단 모수에 한계 또는 발생가능성를 추가하는 데 사용할 수 있습니다. 신뢰 구간은 추정 통계량 필드에서 가져옵니다.이 튜토리얼에서는 신뢰 구간과 실제로 신뢰 구간을 계산하는 방법을 알아봅니다.이 자습서를 완료하면 다음을 알 수 있습니다.신뢰 구간은 모집단 모수 추정치의 한계입니다.그 분류 방법의 추정된 기술에 대한 신뢰...

Read More

통계적 가설 검정을 사용하여 두 표본 간의 차이가 무작위 기회로 인한 것인지 여부를 나타낼 수 있지만 차이의 크기에 대해서는 언급할 수 없습니다."새로운 통계"라고 하는 방법에서는 추정 값에 대한 효과의 크기와 불확실성의 양을 정량화하기 위해 p-값 대신 또는 추가로 사용이 증가하고 있습니다. 이 통계 방법을 "추정 통계"라고 합니다.이 튜토리얼에서는 통계적 가설 테스트의 대안 또는 보완으로 추정 통계에 대한 짧은 소개를 발견하게 될 것입니다.이 자습서를 완료하면 다음을 알...

Read More

머신러닝 방법을 비교하고 최종 모델을 선택하는 것은 적용된 머신러닝의 일반적인 작업입니다.모델은 일반적으로 평균 기술 점수를 직접 계산하고 비교하는 k-fold 교차 검증과 같은 리샘플링 방법을 사용하여 평가됩니다. 이 접근 방식은 간단하지만 평균 기술 점수 간의 차이가 실제인지 통계적 우연의 결과인지 알기 어렵기 때문에 오해의 소지가 있습니다.통계적 유의성 검정은 이 문제를 해결하고 동일한 분포에서 추출되었다는 가정을 고려하여 기술 점수 표본이 관찰될 가능성을 정량화 하도록 설계되었습니다. 이 가정...

Read More

모수 통계 방법은 종종 데이터 샘플에 가우스 분포가 있다고 가정하는 방법을 의미합니다.응용 머신러닝에서는 데이터 샘플, 특히 샘플의 평균을 비교해야 합니다. 아마도 한 기술이 하나 이상의 데이터 세트에서 다른 기술보다 더 잘 수행되는지 확인하기 위해. 이 질문을 정량화하고 결과를 해석하기 위해 스튜던트 t-검정 및 분산 분석과 같은 모수가설 검정 방법을 사용할 수 있습니다.이 자습서에서는 둘 이상의 데이터 표본 평균 간의 차이를 정량화하는 모수 통계적 유의성 검정을 알아봅니다.이...

Read More

응용 머신러닝에서는 두 데이터 샘플의 분포가 동일한지 또는 다른지 확인해야 하는 경우가 많습니다.표본이 동일한 분포를 가질 가능성을 정량화할 수 있는 통계적 유의성 검정을 사용하여 이 질문에 답할 수 있습니다.데이터에 익숙한 가우스 분포가 없으면 유의성 검정의 비모수 버전을 사용해야 합니다. 이러한 테스트는 유사한 방식으로 작동하지만 배포가 없으므로 테스트를 수행하기 전에 먼저 실제 값 데이터를 순위 데이터로 변환해야 합니다.이 자습서에서는 데이터 표본이 동일하거나 다른 분포를 가진 모집단에서...

Read More

응용 머신러닝에 필요한 17가지 통계 가설 테스트에 대한 빠른 참조 가이드와 Python의 샘플 코드입니다.사용할 수 있는 수백 개의 통계적 가설 테스트가 있지만 여기에는 머신러닝 프로젝트에서 사용할 작은 하위 집합만 있습니다.이 게시물에서는 Python API를 사용하는 예제와 함께 머신러닝 프로젝트에 대한 가장 인기 있는 통계적 가설 테스트에 대한 치트 시트(cheat sheet)를 찾을 수 있습니다.각 통계 테스트는 다음을 포함하여 일관된 방식으로 제공됩니다.테스트의 이름입니다.테스트에서 확인하는 내용.테스트의 주요 가정.테스트 결과가...

Read More