머신러닝 적용사례 제 1장. Dynamic time warping에 대한 기초적인 이해

14 9월

머신러닝 적용사례 제 1장. Dynamic time warping에 대한 기초적인 이해

오늘날 머신러닝에 대해 많은 사람들이 이야기하고 있지만 실제로 어떤 원리에 의해 무엇을 위해 활용되고 있는지 구체적으로 알고 있는 사람은 많지 않습니다. 이러한 내용이 궁금하신 분들을 위해서 앞으로 몇 편의 글을 통해 머신러닝의 활용사례에 대해 설명해 드리고자 합니다. 참고로, 본 내용의 상당 부분은 인공지능(AI)·데이터 전문 기업 데이터브릭스가 제공하는 블로그 게시글을 번역한 것임을 사전에 밝힙니다. 원문을 직접 읽어보고 싶으신 분은 여기서 eBook을 다운로드 받아 보시기 바랍니다.

오늘은 그 첫번째 시간으로서 Dynamic time warping(줄여서 DTW, 한국어로 동적 시간 왜곡)에 대해 알아 보겠습니다. Warp라고 하면 SF 영화에서 시공간의 경계를 넘어 단시간에 머나먼 우주로 여행하는 것을 상상하실지도 모르겠습니다. 하지만 여기서 Warp는 시공간 여행이 아니라 비교 데이터 포인트 사이의 시간 지표가 완벽하게 동기화되지 않을 때 사용되는 기술입니다. 보다 쉽게 설명하면 속도가 다른 2개의 시계열 패턴의 유사성을 비교하는 것입니다. 예를 들어 2개의 서로 다른 목소리가 동일인의 것인지 확인하고자 할 때 Dynamic time warping이 사용됩니다. 동일인이 말하더라도 말할 때마다 속도가 다를 수 있기 때문에 통상적인 방법으로는 비교가 불가능할 수 있기 때문입니다. 당신이 “오케이 구글”을 빠르게 말하든 느리게 말하든 구글 어시스턴스가 당신의 목소리를 인식할 수 있는 것은 Dynamic time warping 기술이 적용되어 있기 때문입니다.

이 뿐만 아니라 Dynamic time warping은 여러 다양한 분야에 활용되는 유용하고 강력한 기술입니다. 당신이 Dynamic time warping의 개념을 이해하게 된다면 다음과 같이 우리의 일상생활에 적용되는 다양한 사례를 찾아볼 수 있을 것입니다.

n 금융시장 : 완벽하게 일치하지는 않더라도 유사한 기간 동안의 주식 거래 데이터를 비교할 수 있습니다. 예를 들어, 2월 28일과 3월 31일의 월간 거래 데이터를 비교할 수 있습니다.

n 웨어러블 피트니스 트래커 : 보행 속도가 시간에 따라 변하더라도 보행 속도와 걸음 숫자를 보다 정확하게 계산할 수 있습니다.

n 루트 계산 : 좌회전시에는 직진차로에서 운행할 때보다 느리게 주행하는 것과 같은 사용자의 운전 습관을 알고 있다면 예상 도착 시간을 보다 정확하게 계산할 수 있습니다.

자연 상태에서 완벽하게 일치하는 시계열 데이터를 찾는 것은 매우 힘들기 때문에 데이터 과학자, 데이터 분석가 그리고 시계열 데이터를 다루는 모든 사람은 이 기술에 익숙해질 필요가 있습니다.

이 글에서 다루고자 하는 것은 다음과 같습니다.

n Dynamic time warping의 기본 원리

n 샘플 오디오 데이터에 Dynamic time warping 적용

n MLflow를 활용하여 샘플 판매 데이터에 Dynamic time warping 적용

시계열 비교 방법의 목적은 2개의 시계열 입력간에 거리 측정법을 생성하는 것입니다. 2개의 시계열간의 유사성 또는 비유사성은 데이터를 벡터값으로 변환하고 벡터 공간에서 이 두 지점간의 유클리드 거리에 의해 계산함으로써 얻을 수 있습니다. Dynamic time warping은 1970년대 이래로 음파를 이용하여 문장과 단어 인식에 사용되어 왔던 중요한 시계열 비교 기술입니다. 이와 관련하여 “정렬된 그래프 탐색 기술에 기반한 고립된 단어에 대한 Dynamic time warping”이라는 논문이 종종 인용됩니다.

배경

이 기술은 패턴 매칭뿐만 아니라 이상 감지에도 사용할 수 있습니다. (예: 중첩 모양이 크게 변경되었는지 이해하거나 이상값을 조사하기 위해 두 개의 분리된 기간 사이의 시계열을 중첩 시키는 것)

예를 들어 다음 그래프에서 빨간색과 파란색 선을 볼 때 전통적인 시계열 매칭(즉, 유클리드 매칭)은 극도로 제한적입니다.

반면에 Dynamic time warping을 사용하면 X축(즉, 시간)이 반드시 동기화되어 있지 않더라도 두 곡선을 균등하게 일치시킬 수 있습니다.

또 다른 방면으로는, 낮은 숫자가 계열이 더 유사함을 의미한다는 비유사성 점수에 대해 생각해 볼 수 있습니다.

최적(워핑) 경로를 사용하여 크기를 일치시키도록 다음 규칙에 따라 함수 f(x)와 매핑할 수 있는 경우 두 시계열(기본 시계열 및 새 시계열)은 유사한 것으로 간주됩니다.

사운드 패턴 매칭

통상적으로, Dynamic time warping은 오디오 클립의 유사성을 확인하기 위해 사용됩니다.

예제에서 우리는 “The Expanse”라는 TV 쇼의 두 가지 다른 인용문을 담은 4개의 서로 다른 오디오 클립을 사용할 것입니다.

4개의 오디오 클립(아래에서 들을 수 있지만 필수는 아님)이 있으며 그 중 3개(클립 1, 2 및 4)는 인용문을 기반으로 합니다.

“Doors and corners, kid. That’s where they get you.”

그리고 클립 하나(clip 3)는 인용문입니다.

“You walk into a room too fast, the room eats you.”

아래는 matplotlib9*을 이용한 4개의 오디오 클립의 시각화 이미지입니다.

l 클립1은 인용문 “Doors and corners, kid. That’s where they get you.” 에 기반한 기본 시계열입니다.

l 클립2는 클립1을 기반으로 억양과 발화 패턴을 극도로 과장시켜 만든 새로운 시계열[ v2]입니다.

l 클립3는 인용문 “You walk into a room too fast, the room eats you.”을 클립1과 동일한 억양과 속도로 만든 또 다른 시계열입니다.

l 클립4는 클립1을 기반으로 억양과 발화 패턴을 클립1과 유사하게 만든 새로운 시계열[v3]입니다.

Matplotlib을 사용하여 이 오디오 클립들을 읽고 시각화한 코드는 다음 몇 줄의 코드에 요약되어 있습니다.

전체 코드는 Dynamic time warping Background 노트북에서 찾아볼 수 있습니다.

아래에 언급된 것처럼 두 클립(이 경우 클립 1과 4)은 동일한 인용문에 대해 다른 억양(진폭)과 대기 시간을 갖습니다.

전통적인 유클리드 매칭을 따른다면(다음 그래프에 따라), 진폭을 무시하더라도 원본 클립(파란색)과 새 클립(노란색) 사이의 타이밍은 일치하지 않습니다.

하지만 Dynamic time warping을 따른다면 두 클립 사이에 시계열 매칭을 위해 시간을 이동시킬 수 있습니다.

시계열 비교를 위해 우리는 fastdtw PyPi 라이브러리를 사용할 것입니다. Databricks 작업 영역 내에 PyPi 라이브러리를 설치하는 지침은 여기(Azure | AWS)에서 찾을 수 있습니다. fastdtw를 사용하여 우리는 서로 다른 시계열 사이의 거리를 빠르게 계산할 수 있습니다.

전체 코드는 Dynamic time warping Background 노트북에서 찾아볼 수 있습니다.

몇가지 관찰할 수 있는 것들 :

l 앞의 그래프에서 알 수 있듯이 클립 1과 클립 4는 동일한 단어와 억양을 가지므로 클립 사이의 거리가 가장 짧습니다.

l 클립 4에 비해 길지만 클립 1과 3 사이의 거리도 상당히 짧습니다. 단어는 다르지만 억양과 속도는 동일합니다.

l 1번과 2번은 같은 인용구를 사용하고 있지만 지나치게 과장된 억양과 속도로 인해 거리가 가장 깁니다.

위의 사례에서 알 수 있듯이, Dynamic time warping을 이용하여 2개의 서로 다른 시계열의 유사성을 확인할 수 있습니다.

다음 순서로, Dynamic time warping을 판매 동향 감지에 활용하는 사례를 알아보겠습니다.

Tags:

Dynamic Time Warping

머신러닝 적용사례 제 1장. Dynamic time warping에 대한 기초적인 이해

Tags:

네피리티

No Comments

Latest Posts

Latest Tweets

Latest Posts