머신러닝의 벡터 규범에 대한 짧은 소개
벡터의 길이 또는 크기 계산은 머신러닝의 정규화 방법으로 직접 또는 더 광범위한 벡터 또는 행렬 작업의 일부로 필요한 경우가 많습니다.
이 튜토리얼에서는 vector norm이라고 하는 벡터 길이 또는 크기를 계산하는 다양한 방법을 알아봅니다.
이 자습서를 완료하면 다음을 알 수 있습니다.
- 벡터의 절대값의 합으로 계산되는 L1 norm
- 제곱 벡터 값의 합에 대한 제곱근으로 계산되는 L2 norm
- 최대 벡터 값으로 계산되는 최대 norm
튜토리얼 개요
이 튜토리얼은 다음과 같이 네 부분으로 나뉩니다.
- 벡터 정규화
- 벡터 L1 표준
- 벡터 L2 norm
- 벡터 최대 표준
벡터 정규화
벡터의 크기 또는 길이를 계산하는 것은 종종 직접 또는 더 넓은 벡터 또는 벡터-행렬 연산의 일부로 필요합니다.
벡터의 길이를 vector norm 또는 벡터의 크기라고 합니다.
벡터의 길이는 공간에서 벡터의 범위를 설명하는 음수가 아닌 숫자이며 벡터의 크기 또는 표준이라고도 합니다.
— 페이지 112, 선형 대수학에 대한 좋은 가이드, 2017
벡터의 길이는 모두 0 값으로 구성된 벡터를 제외하고 항상 양수입니다. 벡터 공간의 원점에서 벡터의 거리를 요약하는 일부 측정값을 사용하여 계산됩니다. 예를 들어, 요소가 3개인 벡터에 대한 벡터 공간의 원점은 (0, 0, 0)입니다.
표기법은 광범위한 계산에서 vector norm을 나타내는 데 사용되며 vector norm 계산 유형에는 거의 항상 고유한 표기법이 있습니다.
머신러닝에 사용되는 몇 가지 일반적인 벡터 정규화 계산을 살펴보겠습니다.
벡터 L1 표준
벡터의 길이는 L1 norm을 사용하여 계산할 수 있으며, 여기서 1은 L의 위 첨자입니다(예: L^1).
벡터의 L1 norm에 대한 표기법은 || v||1여기서 1은 아래 첨자입니다. 따라서 이 길이는 때때로 택시 표준 또는 맨해튼 표준이라고 합니다.
L1 norm은 절대 벡터 값의 합으로 계산되며, 여기서 스칼라의 절대값은 |a1| 표기법을 사용합니다. 실제로 표준은 벡터 공간의 원점에서 맨해튼 거리를 계산하는 것입니다.
벡터의 L1 norm은 norm 순서(이 경우 1)를 지정하는 매개 변수와 함께()norm을 사용하여 NumPy에서 계산할 수 있습니다.
먼저 1×3 벡터가 정의 된 다음 벡터의 L1 norm이 계산됩니다.
예제를 실행하면 먼저 정의된 벡터가 인쇄된 다음 벡터의 L1 norm이 인쇄됩니다.
L1 norm은 머신러닝 알고리즘을 정규화 방법(예: 모델의 계수를 작게 유지하고 모델을 덜 복잡하게 유지하는 방법)으로 피팅할 때 자주 사용됩니다.
벡터 L2 표준
벡터의 길이는 L2 norm을 사용하여 계산할 수 있으며, 여기서 2는 L의 위 첨자입니다(예: L^2).
벡터의 L2 norm에 대한 표기법은 || v||2 여기서 2는 아래 첨자입니다.
L2 norm은 벡터 공간의 원점에서 벡터 좌표까지의 거리를 계산합니다. 따라서 원점에서 유클리드 거리로 계산되기 때문에 유클리드 표준이라고도합니다. 결과는 양의 거리 값입니다.
L2 norm은 제곱 벡터 값의 합에 대한 제곱근으로 계산됩니다.
벡터의 L2 norm은 기본 매개 변수와 함께()함수를 사용하여 NumPy에서 계산할 수 있습니다.
먼저 1×3 벡터가 정의 된 다음 벡터의 L2 norm이 계산됩니다.
예제를 실행하면 먼저 정의된 벡터가 인쇄된 다음 벡터의 L2 norm이 인쇄됩니다.
L1 norm과 마찬가지로 L2 norm은 머신러닝 알고리즘을 정규화 방법(예: 모델의 계수를 작게 유지하고 모델을 덜 복잡하게 유지하는 방법)으로 피팅할 때 자주 사용됩니다.
지금까지 L2 norm은 머신러닝의 다른 vector norm보다 더 일반적으로 사용됩니다.
벡터 최대 표준
벡터의 길이는 최대 norm이라고도 하는 최대 norm을 사용하여 계산할 수 있습니다.
벡터의 최대 norm을 L^inf라고 하며, 여기서 inf는 위 첨자이며 무한대 기호로 나타낼 수 있습니다. 최대 norm의 표기법은 || 엑스|| inf, 여기서 inf는 아래 첨자입니다.
최대 norm은 벡터의 최대 값을 반환하는 것으로 계산되므로 이름이 계산됩니다.
벡터의 최대 norm은 순서 매개 변수가 inf로 설정된 norm()함수를 사용하여 NumPy에서 계산할 수 있습니다.
먼저 1×3 벡터가 정의 된 다음 벡터의 최대 norm이 계산됩니다.
예제를 실행하면 먼저 정의된 벡터가 인쇄된 다음 벡터의 최대 norm이 인쇄됩니다.
최대 정규화는 최대 정규화라고 하는 신경망 가중치와 같은 머신러닝의 정규화로도 사용됩니다.
확장
이 섹션에는 탐색할 수 있는 자습서를 확장하기 위한 몇 가지 아이디어가 나열되어 있습니다.
- 자체 데이터를 사용하여 각 작업을 사용하여 5 개의 예제를 만듭니다.
- 목록 목록으로 정의된 행렬에 대해 각 행렬 연산을 수동으로 구현합니다.
- 머신러닝 문서를 검색하고 사용 중인 각 작업의 예제 1개를 찾습니다.
추가 정보
이 섹션에서는 더 자세히 알아보려는 경우 주제에 대한 더 많은 리소스를 제공합니다.
책
API
기사
요약
이 튜토리얼에서는 vector norm이라고 하는 벡터 길이 또는 크기를 계산하는 다양한 방법을 발견했습니다.
특히 다음 내용을 배웠습니다.
- 벡터의 절대값의 합으로 계산되는 L1 norm입니다.
- 제곱 벡터 값의 합에 대한 제곱근으로 계산되는 L2 norm입니다.
- 최대 벡터 값으로 계산되는 최대 norm입니다.