머신러닝을 위한 수학적 기호의 기초

17 11월

머신러닝을 위한 수학적 기호의 기초

by Nepirity

in Technology

Comments

머신러닝 방법에 대한 설명을 읽을 때 수학적 기호는 피할 수 없습니다.

종종 방정식에서 하나의 용어 또는 하나의 기호만 달라도 전체 방정식을 잘못 이해하게 될 수 있습니다. 이것은 특히 개발 세계에서 온 머신러닝 초보자에게 매우 실망스러울 수 있습니다.

수학적 기호의 몇 가지 기본 영역과 논문 및 책에서 머신러닝 방법에 대한 설명을 통해 작업하기 위한 몇 가지 트릭을 알고 있다면 큰 진전을 이룰 수 있습니다.

이 자습서에서는 머신러닝에서 기술에 대한 설명을 읽을 때 접할 수 있는 수학적 기호의 기본 사항을 알아봅니다.

이 자습서를 완료하면 다음을 알 수 있습니다.

곱셈, 지수, 근 및 로그의 변형을 포함한 산술에 대한 기호입니다.
시퀀스와 집합에 대한 기호(인덱싱, 합계 및 집합 멤버 자격)입니다.
수학적 기호에 어려움을 겪고 있는 경우 도움 받기 위해 사용할 수 있는 5가지 기술.

튜토리얼 개요

이 튜토리얼은 아래와 같이 일곱 부분으로 나뉩니다.

수학 기호에 대한 좌절감
산술 기호
그리스 문자
시퀀스 기호
기호 설정
다른 기호
추가 도움말 보기

수학 기호에 대한 좌절감

머신러닝 알고리즘에 대해 읽을 때 수학적 기호를 접하게 될 것입니다.

예를 들어 기호를 사용하여 다음을 수행할 수 있습니다.

알고리즘을 설명합니다.
데이터 준비를 설명합니다.
결과를 설명합니다.
테스트 프로그램을 설명합니다.
의미를 설명하십시오.

이러한 설명은 연구 논문, 교과서, 블로그 게시물 및 다른 곳에 있을 수 있습니다.

종종 용어가 잘 정의되어 있지만 익숙하지 않은 수학적 기호 규범도 있습니다.

이해하지 못하는 하나의 용어 또는 하나의 방정식만 있어도 전체를 이해하지 못 하게 될 수도 있습니다. 저는 이 문제를 여러 번 겪었습니다.

이 자습서에서는 머신러닝 방법에 대한 설명을 읽을 때 도움이 되는 몇 가지 기본 수학적 기호를 검토합니다.

산술 기호

이 섹션에서는 기본 산술에 대한 명확하지 않은 기호와 학교를 졸업한 이후로 잊어버렸을 수 있는 몇 가지 개념을 살펴보겠습니다.

간단한 산술

기본 산술 기호는 다음과 같습니다.

덧셈: 1 + 1 = 2
빼기: 2 – 1 = 1
곱셈: 2 x 2 = 4
나누기 : 2 / 2 = 1

대부분의 수학 연산에는 역 연산을 수행하는 자매 연산이 있습니다. 예를 들어, 뺄셈은 덧셈의 역이고 나눗셈은 곱셈의 역수입니다.

대수학

우리는 종종 특정 데이터 또는 특정 구현과 분리하기 위해 작업을 추상적으로 설명하려고 합니다.

이러한 이유로 우리는 대수학의 과도한 사용을 보게 됩니다 : 그것은 수학적 기호로 용어나 개념을 나타내는 대문자 또는 소문자 또는 단어입니다. 그리스 알파벳의 문자를 사용하는 것도 일반적입니다.

수학의 각 하위 필드에는 예약 문자가 있을 수 있습니다 : 그것은 항상 같은 것을 의미하는 용어 또는 문자입니다. 그럼에도 불구하고 대수 용어는 설명의 일부로 정의되어야 하며 그렇지 않은 경우 당신의 잘못이 아니라 잘못된 설명일 수 있습니다.

곱셈 기호

곱셈은 일반적인 기호와 약칭 둘 다 사용 가능합니다 .

종종 “x”또는 별표 “*”가 곱셈을 나타내는 데 사용됩니다.

1
2
c = a x b
c = a * b

또는 점으로 표시할 수도 있고

1
c = a . b

별표도 같은 의미이며

1
c = a * b

또는 기호와 공백이 전혀 없을 수도 있습니다.

1
c = ab

지수와 제곱근

지수는 거듭제곱으로 올린 숫자입니다.

지수는 다음과 같이 숫자, 꺽쇠, 제곱기호로 표시할 수 있으며

1
2^3

2를 3번 곱하는 것을 그대로 보여 줄 수도 있습니다

1
2 x 2 x 2 = 8

1
2^2 = 2 x 2 = 4

숫자의 제곱은 제곱근을 사용하여 반전할 수 있습니다. 루트 기호를 쓸 수도 있고, “sqrt()”함수를 사용할 수도 있습니다.

1
sqrt(4) = 2

제곱근

여기서 우리는 결과와 지수를 알고 있으며 제곱근을 찾고자 합니다.

사실, 루트 연산은 지수를 반전시키는 데 사용할 수 있으며, 기본 제곱근은 제곱근 틱 앞에 아래 첨자 2로 표시되는 2의 지수를 가정합니다.

예를 들어, 큐브 루트를 취하여 숫자의 세제곱을 반전 할 수 있습니다 (여기서 3은 곱셈이 아니며 루트 기호의 틱 앞의 기호입니다).

1
2
2^3 = 8
3 sqrt(8) = 2

로그와 e

10을 정수 지수로 제곱할 때 우리는 종종 이것을 자릿수라고 부릅니다.

1
10^2 = 10 x 10 or 100

이 연산을 되돌리는 또 다른 방법은 제곱근이 10이라고 가정하여 결과 100의 로그를 계산하는 것입니다. 이것은 log10()으로 작성됩니다.

1
log10(100) = 2

여기서 우리는 결과와 제곱근을 알고 지수를 찾고자 합니다.

이를 통해 우리는 매우 쉽게 위아래로 움직일 수 있습니다. 컴퓨터에서 사용되는 이진법을 사용하기 때문에 2의 제곱근이 일반적으로 사용된다고 가정하는 로그도 취합니다. 예를 들어:

1
2
2^6 = 64
log2(64) = 6

또 다른 인기 있는 로그는 e라는 자연 염기를 가정하는 것입니다. e는 예약되어 있으며 거의 무한한 정밀도를 가진 값을 나타내는 오일러 수 ( “oy-ler“로 발음)라고하는 특수 숫자 또는 상수입니다.

1
e = 2.71828…

e를 거듭제곱 하는 것을 자연 지수 함수라고 합니다.

1
e^2 = 7.38905…

ln()으로 표시되는 자연 로그를 사용하여 반전할 수 있습니다.

1
ln(7.38905…) = 2

자연 지수와 자연 로그는 수학 전반에 걸쳐 일부 시스템(예: 복리와 같이 기하급수적으로 증가하는 시스템)의 지속적인 성장을 추상적으로 설명하는 데 유용합니다.

그리스 문자

그리스 문자는 변수, 상수, 함수 등에 대한 수학적 기호 전반에 걸쳐 사용됩니다.

예를 들어, 통계에서 우리는 소문자 그리스 문자 mu를 사용하는 평균과 소문자 그리스 문자 시그마로 표준 편차에 대해 이야기합니다. 선형 회귀에서는 계수를 소문자 beta로 이야기합니다.

모든 대문자와 소문자 그리스 문자와 발음 방법을 아는 것이 유용합니다.

대학원생이었을 때 그리스 알파벳을 인쇄하여 컴퓨터 모니터에 붙여서 암기하곤 했습니다.

아래는 전체 그리스 알파벳입니다.

그리스어 알파벳,위키피디아에서 가져옴

“수학, 과학 및 공학에서 사용되는 그리스 문자”라는 제목의 Wikipedia 페이지는 수학 및 과학의 다양한 하위 분야에서 각 그리스 문자의 일반적인 용도를 나열하므로 유용한 가이드이기도 합니다.

시퀀스 기호

머신러닝 기호은 종종 시퀀스에 대한 작업을 설명합니다.

시퀀스는 데이터 배열 또는 용어 목록일 수 있습니다.

인덱싱

시퀀스에 대한 기호를 읽는 핵심은 시퀀스의 인덱싱 요소 기호입니다.

종종 기호은 1에서 n과 같이 시퀀스의 시작과 끝을 지정하며, 여기서 n은 시퀀스의 범위 또는 길이입니다.

시퀀스의 항목은 아래 첨자로 i, j, k와 같은 변수에 의해 인덱스됩니다. 이것은 배열 기호과 같습니다.

예를 들어, a_i는 시퀀스 a의 i^번째 요소입니다.

시퀀스가 2차원인 경우 두 개의 인덱스가 사용될 수 있습니다. 예를 들어:

b_{i,j}는 시퀀스 b의 i,j^번째 요소입니다.

시퀀스 연산

수학 연산은 시퀀스에 걸쳐 수행할 수 있습니다.

두 가지 연산이 시퀀스에서 너무 자주 수행되어 합계와 곱셈이라는 자체 속기가 있습니다.

시퀀스 합계

시퀀스에 대한 합계는 대문자 그리스 문자 sigma로 표시됩니다. 시그마 아래의 시퀀스 합계의 변수와 시작 (예 : i = 1)과 시그마 위의 합계 끝의 인덱스 (예 : n)로 지정됩니다.

1
Sigma i = 1, n a_i

이것은 요소 1에서 시작하여 요소 n까지의 시퀀스 a의 합입니다.

시퀀스 곱셈

시퀀스에 대한 곱셈은 대문자 그리스 문자 pi로 표시됩니다. 문자 아래와 위에 각각 연산의 시작과 끝이있는 시퀀스 합계와 같은 방식으로 지정됩니다.

1
Pi i = 1, n a_i

이것은 요소 1에서 시작하여 요소 n까지의 시퀀스 a의 곱입니다.

기호 설정

집합은 고유한 항목의 그룹입니다.

머신러닝에서 용어를 정의할 때 집합 기호가 사용되는 것을 볼 수 있습니다.

숫자 집합

볼 수 있는 일반적인 집합은 정수 집합 또는 실수 집합 내에 있는 것으로 정의된 용어와 같은 숫자 집합입니다.

표시될 수 있는 몇 가지 일반적인 숫자 집합은 다음과 같습니다.

모든 자연수 집합: N
모든 정수 집합: Z
모든 실수 집합: R

다른 세트도 있습니다. 위키백과의 특별 세트를 참조하십시오.

우리는 종종 부동 소수점 값보다는 용어를 정의 할 때 실제 값 또는 실수에 대해 이야기하는데, 이는 컴퓨터에서 연산을 위해 별개로 만든 것입니다.

멤버십 설정

용어 정의에서 설정된 멤버십을 보는 것이 일반적입니다.

집합 멤버쉽은 대문자 “E”처럼 보이는 기호로 표시됩니다.

1
a E R

멤버십 설정

이는 a가 집합 R 또는 실수 집합의 구성원으로 정의됨을 의미합니다.

또한 많은 집합 작업이 있습니다. 두 가지 일반적인 집합 작업은 다음과 같습니다.

합집합 또는 집계: A U B
교차 또는 겹침: A ^ B

위키백과에서 세트에 대해 자세히 알아보세요.

다른 기호

다른 기호를 접할 수 있습니다.

이 섹션에서 일부를 배치하려고합니다.

추상적으로 메서드를 정의한 다음 별도의 기호으로 특정 구현으로 다시 정의하는 것이 일반적입니다.

예를 들어, 변수 x를 추정하는 경우 x를 수정하는 기호를 사용하여 나타낼 수 있습니다. 예를 들어:

x 수정자

동일한 기호가 다른 문맥에서 다른 의미를 가질 수 있습니다 (예 : 다른 객체 또는 수학의 하위 분야에서의 사용). 예를 들어, 혼동의 일반적인 지점은 |x|이며, 이는 컨텍스트에 따라 다음을 의미할 수 있습니다.

|x|: x의 절대값 또는 양수값입니다.
|x|: 벡터 x의 길이입니다.
|x|: 집합 x의 카디널리티(cardinality)입니다.

이 자습서에서는 수학적 기호의 기본 사항만 다루었습니다. 머신러닝과 더 관련이 있고 더 자세히 검토해야 하는 수학의 일부 하위 분야가 다음과 같이 있습니다.

선형 대수학.
통계.
확률.
미적분학.

그리고 아마도 약간의 다변량 분석과 정보 이론도 포함됩니다.

수학 기호에 대한 도움을 받기 위한 5가지 팁

이 섹션에는 머신러닝에서 수학적 기호에 어려움을 겪을 때 사용할 수 있는 몇 가지 팁이 나열되어 있습니다.

저자에 대해 생각하십시오

사람들은 당신이 읽고 있는 논문이나 책을 썼습니다.

하지만 이들도 실수를 하고, 누락하고, 심지어 자신이 쓰는 내용을 완전히 이해하지 못하기 때문에 혼란스럽게 만들기도 합니다.

읽고 있는 기호의 제약을 약간 풀고 저자의 의도에 대해 생각하십시오. 그들은 무엇을 설명하려고 합니까?

아마도 이메일, 트위터, 페이스 북, 링크드 인 등을 통해 저자에게 연락하여 설명을 구할 수도 있습니다. 학자들은 다른 사람들이 자신의 작업을 이해하고 사용하기를 원한다는 것을 기억하십시오 (대부분은 그렇습니다).

위키피디아 확인

Wikipedia에는 읽고 있는 기호의 의미나 의도를 좁히는 데 도움이 되는 기호 목록이 있습니다.

한번쯤 읽어보는 것이 좋습니다.

코드에서 스케치

수학 연산은 데이터에 대한 함수일 뿐입니다.

읽고 있는 모든 것을 변수, for-loops 등의 유사 코드에 매핑해 보시기 바랍니다.

스크립팅 언어를 인위적인 데이터의 작은 배열 또는 Excel 스프레드 시트와 함께 사용할 수 있습니다.

기술에 대한 읽기와 이해가 향상됨에 따라 기술에 대한 코드 스케치가 더 의미가 있으며 마지막에는 미니 프로토 타입을 갖게 됩니다.

필자는 몇 줄의 matlab에서 매우 복잡한 논문을 인위적인 데이터로 스케치하는 학술 스케치를 보기 전까지는 이 접근 방식에 대해 많은 관심을 갖지 않았습니다. 시스템이 완전히 코딩되고 “실제” 데이터 세트로 실행되어야 하며 유일한 옵션은 원본 코드와 데이터를 얻는 것이라고 믿었지만 그런 믿음이 잘못된 것이라는 것을 알게 되었습니다.

저는 이제 이 방법을 항상 사용하고 Python에서 기술을 스케치합니다.

대안 찾기

새로운 기술을 이해하려고 할 때 사용하는 트릭이 있습니다.

저는 새로운 기술에 관한 논문을 읽을 때 이를 참조하는 논문을 모두 읽습니다.

해당 기술에 대한 다른 학자들의 해석과 설명을 읽으면 종종 원래 논문 내용에 대한 저의 잘못된 이해를 바로 잡을 수 있습니다.

물론 항상 그런 것은 아닙니다. 때로는 논점을 흐리게 하고 오해의 소지가 있는 설명이나 새로운 기호를 보게 될 수도 있습니다. 그러나 이러한 시도는 종종 도움이 됩니다. 따라서 원래의 논문으로 돌아가서 다시 읽은 후에 참조 논문이 실제로 원래 방법을 잘못 해석한 경우를 종종 발견하곤 합니다.

질문 게시

믿으실지 모르겠지만 사람들이 서로에게 수학을 설명하는 것을 좋아하는 온라인 공간이 있습니다.

어려움을 겪고 있는 기호의 스크린샷을 찍고, 전체 참조 또는 링크를 작성하고, 오해의 영역과 오해 영역을 질문 및 답변 사이트에 게시해 보시길 바랍니다.

시작하기에 좋은 두 곳은 다음과 같습니다.

수학적 기호를 통해 작업하는 트릭은 무엇입니까?
아래 의견에 알려주십시오.

추가 정보

이 섹션에서는 더 자세히 알아보려는 경우 주제에 대한 더 많은 리소스를 제공합니다.

섹션 0.1. 수학 읽기[PDF], 벡터 미적분학, 선형 대수학 및 미분 형식, 2009.
수학의 언어와 문법[PDF], 티모시 가워스
수학 이해, 가이드, 피터 알펠드.

요약

이 자습서에서는 머신러닝에서 기술에 대한 설명을 읽을 때 접할 수 있는 수학적 기호의 기본 사항을 발견했습니다.

특히 다음 내용을 배웠습니다.

곱셈, 지수, 근 및 로그의 변형을 포함한 산술에 대한 기호입니다.
시퀀스와 집합에 대한 기호로서, 인덱싱, 합계 및 집합 멤버 자격을 포함합니다.
수학적 기호에 어려움을 겪고 있는 경우 도움을 받는 데 사용할 수 있는 5가지 기술.