머신러닝 학습 어떻게 시작할까? 2. 머신러닝이란 무엇이며 어디에 집중해야 할까?

머신러닝은 방대하며 학제간 연구 분야입니다. 머신러닝을 통해 멋진 결과를 얻고 매우 어려운 문제에 대한 해결책을 찾을 수 있습니다. 그러나 이것은 종종 예측 모델링 또는 예측 분석이라고하는 광범위한 머신러닝 분야의 작은 부분에 불과합니다. 이 게시물에서는 머신러닝 실무자로서 최상의 서비스를 제공하기 위해 머신러닝에 대해 생각하는 방식을 변경하는 방법을 발견하게됩니다.

이 게시물을 읽은 후, 당신은 알게 될 것입니다 :

  • 머신러닝이란 무엇이며 인공 지능 및 통계와 어떻게 관련되어 있습니다.
  • 집중해야 할 머신러닝의 영역.
  • 문제와, 그 문제를 해결하기 위한 머신러닝 솔루션에 대해 생각하는 방법.

이제 시작해 보겠습니다.


개요

이 게시물은 다음과 같이 3 부분으로 나뉩니다.

  1. 당신은 혼란스럽습니다.
  2. 머신러닝이란 무엇입니까?
  3. 머신러닝


당신은 혼란스럽습니다.

해결해야 할 머신러닝 문제가 있지만 머신러닝이 정확히 무엇인지에 대해 혼란스럽습니다. 혼란스러워 할 만 합니다. 초보자에게는 혼란스럽습니다. 머신러닝은 방대한 연구 분야이므로 당신과 관련 있는 문제해결에만 우선 집중해야 합니다.

우리는 머신러닝을 가장 광범위한 용어로 설명하고 통계 및 인공 지능과 같은 다른 연구 분야와 어떻게 관련되어 있는지 설명할 것입니다. 그리고 우리는 실용적인 엔지니어링 및 문제 해결을 위해 실제로 알아야 할 머신러닝의 측면을 살펴볼 것입니다.


머신러닝이란 무엇입니까?

머신러닝은 학습하는 프로그램과 관련된 컴퓨터 과학 분야입니다. 머신러닝 분야는 경험을 통해 자동으로 개선되는 컴퓨터 프로그램을 구성하는 방법과 관련이 있습니다.

머신러닝, 1997.


머신러닝은 매우 광범위하며, 여기에는 다음과 같은 다양한 유형의 학습이 포함될 수 있습니다.

  • 유기체 집단이 오랜 시간에 걸쳐 환경에 적응하는 방법을 어떻게 “학습”하는지 조사하기 위한 코드 개발.
  • 뇌의 한 뉴런이 다른 뉴런의 자극에 반응하여 어떻게 “학습”하는지 조사하는 코드 개발.
  • 개미가 집에서 식량 공급원까지의 최적 경로를 어떻게 “학습”하는지 연구하기 위한 코드 개발.


저는 머신러닝이 광범위한 연구 프로그램이라는 것을 알려 드리기 위해 의도적으로 이러한 난해한 예를 제시했습니다.


더 잘 알고있는 또 다른 경우는 다음과 같습니다.

  • 기록 데이터에서 패턴을 “학습”하는 방법을 연구하는 코드 개발.


이것은 덜 매력적이지만, 실무자로서 우리가 깊이 관심이있는 머신러닝의 작은 단편입니다.

이 코너는 다른 예제와 구별되지 않습니다. 학습 방법, 기본 작업, 학습 평가 방법 등에서 많은 중복이 있을 수 있습니다.


인공 지능은 어떻습니까?

머신러닝은 인공 지능의 하위 분야입니다. 인공 지능은 또한 컴퓨터 과학의 영역이며 지능적이거나 지능적인 일을 할 수 있는 프로그램을 개발하는 데 관심이 있습니다. 지능에는 머신러닝과 같은 학습이 포함되지만 추론, 계획, 기억 등과 같은 다른 관심사가 포함될 수 있습니다. 여기에는 다음과 같은 다양한 유형의 학습이 포함될 수 있습니다.

  • 물류를 최적으로 계획하는 방법을 연구하는 코드 개발.
  • 텍스트 단락에 대해 추론하는 방법을 연구하는 코드 개발.
  • 사진의 내용을 인식하는 방법을 연구하는 코드 개발.


통계는 어떻습니까?

통계 또는 컴퓨터 응용 통계는 데이터의 관계를 설명하고 이해하는 것과 관련된 수학의 하위 분야입니다.

여기에는 다음과 같은 다양한 유형의 학습이 포함될 수 있습니다.

  • 변수의 분포를 요약하는 모델 개발.
  • 두 변수 간의 관계를 가장 잘 특성화하는 모델 개발.
  • 두 관측치 모집단 간의 유사성을 테스트하기 위한 모델 개발.


또한 데이터의 패턴 학습에 관심이있는 머신러닝의 영역과 겹칩니다.

통계의 데이터를 이해하는 데 사용되는 많은 방법을 머신러닝에서 사용하여 데이터의 패턴을 학습할 수 있습니다. 이러한 작업을 머신러닝 또는 응용 통계라고 할 수 있습니다.


머신러닝

머신러닝은 큰 연구 분야이며 특정 문제를 해결하는 데 도움이 될 수 있습니다.

그러나 당신은 그것의 모든 것에 대해 알 필요가 없습니다.

  • 당신은 머신러닝에서와 같이 난해한 유형의 학습을 연구하는 학자가 아닙니다.
  • 당신은 인공 지능에서와 같이 지능형 에이전트를 만들려고 하지 않습니다.
  • 통계에서와 같이 변수들이 데이터에서 서로 관련되는 이유에 대해 배우는 데 관심이 없습니다.


사실, 데이터에서 관계를 배울 때 :

  • 알고리즘의 기능을 연구하지 않습니다.
  • 당신은 완전히 새로운 이론이나 알고리즘을 개발하고 있지 않습니다.
  • 기존 머신러닝 알고리즘을 새로운 사례로 확장하지 않습니다.

이것들은 우리가 관심을 가질만한 머신러닝의 영역 중 하나일 수 있지만, 당신과 같은 실무자가 아닌 학자를 위한 활동 일 수 있습니다.


그렇다면 머신러닝의 어떤 부분에 집중해야 할까요?

머신러닝에 대해 생각하는 두 가지 방법이 있다고 생각합니다.

  1. 해결하려는 문제의 관점에서.
  2. 당신이 필요로 하는 해결책의 관점에서.


머신러닝 문제

문제는 다음과 같이 가장 잘 설명 할 수 있습니다.

입력과 출력으로 구성된 과거 데이터를 최대한 활용하여 미래에 새롭거나 보이지 않는 입력이 주어진 출력을 능숙하게 예측하는 모델 또는 절차를 찾으십시오.

이것은 매우 구체적입니다.

우선, 비지도학습과 같은 머신러닝의 전체 하위 필드를 버리고 지도학습이라는 한 가지 유형의 학습과 해당 버킷에 맞는 모든 알고리즘에 집중합니다. 그렇다고 해서 비지도학습의 방법을 활용할 수 없다는 의미는 아닙니다. 그것은 단지 당신이 적어도 처음부터 당신의 관심을 집중시키지 않는다는 것을 의미합니다.

둘째, 그것은 당신에게 다른 모든 것을 지배하는 명확한 목표를 제공합니다 : 그것은 모델 복잡성, 모델 해석 가능성 등과 같은 다른 관심사를 희생시키는 모델 기술입니다. 다시 말하지만, 이것은 이것이 중요하지 않다는 것을 의미하지는 않으며, 단지 모델 기술 이후에 또는 모델 기술과 함께 고려된다는 것을 의미합니다.

셋째, 이런 식으로 문제의 틀을 잡는 것은 예측 모델링이라는 다른 연구 분야에 깔끔하게 들어 맞습니다. 그것은 숙련된 예측을 하는 모델을 개발하기 위해 머신러닝의 방법을 차용하는 연구 분야입니다. 일부 비즈니스 영역에서는 이 영역을 예측 분석이라고도 할 수 있으며 데이터 수집 및 준비, 모델 배포 및 유지 관리와 관련된 활동을 포함하는 모델링 구성 요소 이상을 포함합니다.

최근에 이 활동을 데이터 과학이라고도 할 수 있지만, 이 문구는 해결책을 찾기 위해 문제를 발명하거나 발견하는 의미를 가지고 있습니다. 나는 당신이 이 활동이라고 부르는 것이 중요하지 않다고 생각합니다. 그러나 머신러닝에 대한 관심과 사용이 매우 구체적이며 학자들의 다른 용도와 다르다는 것을 깊이 이해하는 것이 중요하다고 생각합니다. 이를 통해 읽으려는 자료와 선택한 도구를 필터링하여 해결하려는 문제에 집중할 수 있습니다.


머신러닝 솔루션

필요한 솔루션은 다음과 같이 설명하는 것이 가장 좋습니다.

기록 데이터에서 입력과 연관된 출력 간의 알 수 없는 기본 관계의 가장 가능성 있는 근사치를 자동으로 생성하는 모델 또는 프로시저입니다.

다시 말하지만, 이것은 매우 구체적입니다. 예측을 수행하는 데 사용할 수 있는 프로그램이나 모델을 생성하는 자동 메서드가 필요합니다. 앉아서 문제를 해결하기위한 코드를 작성할 수는 없습니다. 그것은 전적으로 데이터에 따라 다르며 많은 데이터를 가지고 있습니다.

사실, 이 유형의 문제는 하향식 매뉴얼 코딩 솔루션과 맞지 않습니다. 앉아서 문제를 해결하기 위해 if 문을 작성할 수 있다면 머신러닝 솔루션이 필요하지 않습니다. 그것은 프로그래밍 문제일 것입니다. 필요한 머신러닝 방법의 유형은 기록 데이터의 입력과 출력 간의 관계를 학습합니다.

이 프레임을 사용하면 실제 기본이지만 알려지지 않은 매핑 함수가 어떻게 생겼는지, 기록 데이터의 노이즈, 손상 및 샘플링이 다양한 모델링 방법으로 만든 매핑의 근사치에 어떻게 영향을 미칠 수 있는지 생각할 수 있습니다.

이 프레임이 없으면 다음과 같은 것들이 궁금 할 것입니다.

  • 왜 하나의 슈퍼 알고리즘이나 매개 변수 집합이 없습니까?
  • 왜 전문가들은 어떤 알고리즘을 사용해야 하는지 모르겠습니다.
  • 모델의 예측으로 0%의 오류를 달성할 수 없는 이유

해결하려는 예측 모델링 문제의 정의되지 않은 특성을 확인하고 합리적인 기대치를 설정하는 데 도움이 됩니다.


요약

이 게시물에서는 머신러닝 실무자로서 최상의 서비스를 제공하기 위해 머신러닝에 대해 생각하는 방식을 바꿔 보았습니다. 당신은 이러한 내용들을 배웠습니다 :

  • 머신러닝이란 무엇이며 인공 지능 및 통계와 어떻게 관련되어 있는지.
  • 집중해야 할 머신러닝의 영역.
  • 문제와, 그 문제를 해결하기 위한 머신러닝 솔루션에 대해 생각하는 방법.
네피리티
No Comments

Sorry, the comment form is closed at this time.