응용 머신러닝 문제에 대해 작업하면서 더 좋은 결과를 빠르게 얻기 위한 패턴이나 프로세스를 개발하게 됩니다.일단 개발되면 이 프로세스를 프로젝트마다 반복해서 사용할 수 있습니다. 공정이 더 견고하고 발전할수록 신뢰할 수 있는 결과를 더 빨리 얻을 수 있습니다.이 게시물에서는 머신러닝 문제를 해결하기 위한 프로세스를 공유하고자 합니다.이를 다음 프로젝트의 시작점 또는 템플릿으로 사용할 수 있습니다.5단계 체계적인 프로세스저는 5 단계 프로세스를 사용하는 것을 좋아합니다.문제 정의데이터 준비스팟 체크 알고리즘결과 개선결과...

Read More

머신러닝 운영을 위한 5가지 모범 사례.모든 예측 모델이 Google 규모인 것은 아닙니다.때로는 소프트웨어에 넣으려는 작은 예측 모델을 개발하기도 합니다.최근에 이런 질문을 받았습니다.사실, 머신러닝에 대한 나의 지식에서 누락된 부분이 있습니다. 모든 자습서는 머신러닝 모델을 빌드할 때까지의 단계를 제공합니다. 이 모델을 어떻게 사용할 수 있습니까?이 게시물에서는 모델을 프로덕션으로 쉽게 전환하고 최대한 활용할 수 있는 몇 가지 모범 사례를 살펴봅니다.모델을 만들었습니다. 다음은 뭘 할까요?당신은 체계적인 프로세스를 거쳐 문제를...

Read More

새 데이터에 대한 예측을 수행하는 데 사용하는 머신러닝 모델을 최종 모델이라고 합니다.최종 모델을 학습하는 방법에 대해 적용된 머신러닝에 혼동이 있을 수 있습니다.이 오류는 다음과 같은 질문을 하는 현장 초보자에게 나타납니다.교차 검증으로 어떻게 예측합니까?교차 검증에서 어떤 모델을 선택합니까?학습 데이터 세트에서 모델을 준비한 후 모델을 사용하나요?이 게시물은 혼란을 해소할 것입니다. 이 게시물에서는 새 데이터에 대한 예측을 수행하기 위해 머신러닝 모델을 마무리하는 방법을 알아봅니다.최종 모델이란 무엇입니까?최종 머신러닝 모델은...

Read More

문제의 실행 가능한 모델을 찾고 조정했으면 해당 모델을 사용할 때입니다. 이유를 다시 살펴보고 해결하려는 문제에 대한 해결책이 필요한 형식을 상기시켜야 할 수도 있습니다.결과로 작업을 수행할 때까지 문제가 해결되지 않습니다. 이 게시물에서는 질문에 대한 답변으로 결과를 제시하는 전술과 프로토타입 모델을 프로덕션 시스템으로 전환할 때 고려해야 할 사항을 알아봅니다.해결하려는 문제의 유형에 따라 결과 표시가 매우 다릅니다. 머신러닝 노력의 결과를 활용하는 데는 두 가지 주요 측면이 있습니다.결과 보고시스템 운영화결과 보고좋은 모델과 충분한...

Read More

과적합과 싸우고 더 나은 일반화를 얻는 데 사용할 수 있는 20가지 팁, 트릭 및 기술딥러닝 모델에서 어떻게 더 나은 성능을 얻을 수 있습니까? 가장 많이 묻는 질문 중 하나입니다. 이것은 다음과 같이 바꿔 질문할 수 있습니다.정확도를 높이려면 어떻게 해야 합니까?...

Read More

더 나은 예측을 위해 사용할 수 있는 32가지 팁, 트릭 및 해킹.머신러닝의 가장 중요한 부분은 예측 모델링입니다.이것은 기록 데이터에 대해 훈련되고 새 데이터에 대한 예측을 수행하는 모델의 개발입니다.예측 모델링과 관련하여 가장 중요한 질문은 다음과 같습니다.어떻게 하면 더 나은 결과를 얻을 수 있습니까?이 비법 가이드에는 수년간의 응용 프로그램과 최고의 머신러닝 실무자 및 경쟁 우승자를 연구하여 추출한 최고의 조언이 포함되어 있습니다.이 가이드를 사용하면 성능을 향상시킬 수 있을...

Read More

문제에 대해 합리적으로 잘 작동하는 하나 또는 두 개의 알고리즘을 갖는 것이 좋은 시작이지만 때로는 사용 가능한 시간과 리소스가 주어지면 최상의 결과를 얻을 수 있습니다.이 게시물에서는 성능을 향상 시키고 머신러닝 알고리즘에서 얻는 결과를 개선하는 데 사용할 수 있는 방법을 검토합니다.알고리즘을 튜닝할 때는 테스트 프로그램에서 제공하는 결과에 대해 높은 신뢰도를 가져야 합니다. 즉, 알고리즘 실행을 평가하는 데 사용하는 성능 측정값의 분산을 줄이는 기술을 사용해야 합니다. 합리적으로...

Read More

사용할 알고리즘 또는 알고리즘 구성을 알고 있다면 머신러닝을 사용할 필요가 없습니다.최상의 머신러닝 알고리즘 또는 알고리즘 매개 변수는 없습니다. 그럼에도 이런 질문들을 많이 받게 됩니다.최고의 머신러닝 알고리즘은 무엇입니까?머신러닝 알고리즘과 문제간의 매핑은 무엇입니까?머신러닝 알고리즘에 가장 적합한 매개 변수는 무엇입니까?이러한 질문에는 패턴이 있습니다.일반적으로 이러한 질문에 대한 답은 미리 알지 못하며 알 수도 없습니다. 경험적 연구를 통해 발견해야 합니다.이러한 질문에 답할 수있는 광범위한 브러시 휴리스틱이 있지만 알고리즘이나 문제를 최대한 활용하려는...

Read More

머신러닝 알고리즘을 평가할때 사용하는 테스트 옵션은 과도한 학습, 평범한 결과 또는 최상의 결과와의 차이를 의미 할 수 있습니다. 이 게시물에서는 알고리즘 평가 테스트 프로그램에서 사용할 수 있는 표준 테스트 옵션과 다음에 올바른 옵션을 선택하는 방법을 알아봅니다.임의성올바른 테스트 옵션을 선택하는 데 어려움의 원인은 임의성입니다. 대부분의(거의 모든) 머신러닝 알고리즘은 어떤 식으로든 임의성을 사용합니다. 임의성은 알고리즘에서 명시적일 수도 있고, 알고리즘을 훈련시키기 위해 선택된 데이터의 샘플에 있을 수도 있습니다.이것은 알고리즘이...

Read More

스팟 검사 알고리즘은 머신러닝 문제에 대한 다양한 알고리즘을 빠르게 평가하여 어떤 알고리즘에 집중하고 무엇을 버려야 하는지 알 수 있도록 하는 것입니다.이 게시물에서는 스팟 검사 알고리즘의 3가지 이점, 다음 문제에 대한 스팟 검사를 위한 5가지 팁 및 알고리즘 제품군에서 스팟 검사를 위해 사용할 수 있는 가장 인기 있는 10가지 데이터 마이닝 알고리즘에 대해 알아봅니다.스팟 검사 알고리즘스팟 검사 알고리즘은 적용된 머신러닝 프로세스의 일부입니다. 새로운 문제에서는 문제의 구조를...

Read More