지도 학습과 비지도 학습, 그리고 준지도 학습

지도 학습이란 무엇이며 비지도 학습과 어떤 관련이 있나요?

이 게시물에서는 지도 학습, 비지도 학습 및 지도 학습에 대해 알아볼 것입니다. 이 게시물을 읽은 후 다음을 알게 될 것입니다.

  • 분류 및 회귀 지도 학습 문제에 대해.
  • 클러스터링 및 연관 비지도 학습 문제에 대해.
  • 지도 문제와 비지도 문제에 사용되는 알고리즘의 예.
  • 준지도 학습이라고 하는 지도 학습과 비지도 학습 사이에 있는 문제.

지도 학습

대부분의 실용적인 머신러닝은 지도 학습을 사용합니다.

지도 학습은 입력 변수(x)와 출력 변수(Y)가 있고 알고리즘을 사용하여 입력에서 출력으로의 매핑 함수를 학습하는 곳입니다.

Y = f (X)

목표는 매핑 함수를 잘 근사하여 새 입력 데이터(x)가 있을 때 해당 데이터에 대한 출력 변수(Y)를 예측할 수 있도록 하는 것입니다.

훈련 데이터 세트에서 학습하는 알고리즘의 프로세스는 학습 과정을 감독하는 교사로 생각할 수 있기 때문에 지도 학습이라고 합니다. 우리는 정답을 알고 알고리즘은 반복적으로 훈련 데이터에 대한 예측을 수행하고 교사가 수정합니다. 알고리즘이 허용 가능한 수준의 성능을 달성하면 학습이 중지됩니다.


지도 학습 문제는 회귀 및 분류 문제로 더 그룹화할 수 있습니다.

  • 분류: 분류 문제는 출력 변수가 “빨간색” 또는 “파란색” 또는 “질병” 및 “질병 없음”과 같은 범주인 경우입니다.
  • 회귀: 회귀 문제는 출력 변수가 “달러” 또는 “가중치”와 같은 실제 값인 경우입니다.

분류 및 회귀 분석을 기반으로 구축된 몇 가지 일반적인 유형의 문제에는 각각 권장 사항 및 시계열 예측이 포함됩니다.

지도학습 알고리즘의 몇 가지 인기 있는 예는 다음과 같습니다.

  • 회귀 문제에 대한 선형 회귀.
  • 분류 및 회귀 문제에 대한 랜덤 포레스트입니다.
  • 분류 문제에 대한 벡터 머신을 지원합니다.

비지도학습

비지도 학습은 입력 데이터(X)만 있고 해당 출력 변수가 없는 경우입니다.

비지도 학습의 목표는 데이터에 대해 자세히 알아보기 위해 데이터의 기본 구조 또는 분포를 모델링하는 것입니다.

위의 지도 학습과 달리 정답이 없고 교사가 없기 때문에 이를 비지도 학습이라고 합니다. 알고리즘은 데이터에서 흥미로운 구조를 발견하고 제시하기 위해 자체 고안에 맡겨집니다.

비지도 학습 문제는 클러스터링 및 연관 문제로 더 그룹화할 수 있습니다.

  • 클러스터링: 클러스터링 문제는 구매 동작별로 고객을 그룹화하는 것과 같이 데이터에 내재된 그룹을 검색하려는 위치입니다.
  • 연결: 연결 규칙 학습 문제는 X를 구매하는 사람도 Y를 구매하는 경향이 있는 경우와 같이 데이터의 많은 부분을 설명하는 규칙을 검색하려는 경우입니다.

비지도 학습 알고리즘의 몇 가지 인기 있는 예는 다음과 같습니다.

  • 클러스터링 문제에 대한 k-평균.
  • 연관 규칙 학습 문제에 대한 선험적 알고리즘.


준지도 학습

많은 양의 입력 데이터(X)가 있고 일부 데이터에만 레이블이 지정된(Y) 문제를 준지도 학습 문제라고 합니다.

이러한 문제는 지도 학습과 비지도 학습 사이에 있습니다.

좋은 예는 일부 이미지 (예 : 개, 고양이, 사람)만 레이블이 지정되고 대다수는 레이블이 지정되지 않은 사진 아카이브입니다.

많은 실제 머신러닝 문제가 이 영역에 속합니다. 이는 도메인 전문가에게 액세스해야 할 수 있으므로 데이터에 레이블을 지정하는 데 비용이 많이 들거나 시간이 많이 소요될 수 있기 때문입니다. 레이블이 지정되지 않은 데이터는 저렴하고 수집 및 저장하기 쉽습니다.

비지도 학습 기법을 사용하여 입력 변수의 구조를 발견하고 학습할 수 있습니다.

또한 지도 학습 기법을 사용하여 레이블이 지정되지 않은 데이터에 대한 최상의 추측 예측을 수행하고, 해당 데이터를 지도 학습 알고리즘에 학습 데이터로 다시 공급하고, 모델을 사용하여 보이지 않는 새로운 데이터에 대한 예측을 수행할 수 있습니다.



요약

이 게시물에서는 감독, 비지도 및 반 감독 학습의 차이점을 배웠습니다. 이제 다음 사항을 알고 있습니다.

  • 지도 학습 : 모든 데이터에 레이블이 지정되고 알고리즘은 입력 데이터의 출력을 예측하는 방법을 학습합니다.
  • 비지도 학습 : 모든 데이터는 레이블이 지정되지 않으며 알고리즘은 입력 데이터에서 고유한 구조를 학습합니다.
  • 준지도 학습 : 일부 데이터에는 레이블이 지정되지만 대부분은 레이블이 지정되지 않으며 감독 기술과 비지도 기술을 혼합하여 사용할 수 있습니다.
네피리티
No Comments

Sorry, the comment form is closed at this time.