07
11월
데이터에서 이상치 식별하기
in Technology
Comments
많은 머신러닝 알고리즘은 입력 데이터에서 특성 값의 범위와 분포에 민감합니다. 입력 데이터의 이상치는 머신러닝 알고리즘의 학습 프로세스를 왜곡하고 오도하여 학습 시간이 길어지고 모델이 덜 정확하며 궁극적으로 결과가 좋지 않을 수 있습니다.학습 데이터에 대한 예측 모델이 준비되기 전에도 이상치는 잘못된 표현을 초래할 수 있으며 수집된 데이터에 대한 오해의 소지가 있는 해석을 초래할 수 있습니다. 이상치는 평균 및 표준 편차와 같은 기술 통계량과 히스토그램 및 산점도와 같은 플롯에서...
Read More