하루공부

📋ML_KNN_알고리즘🚩

킴바다 2022. 11. 9. 17:36

K-최근접 이웃(KNN)

  • 거리 기반 모델
  • 선형 과계를 전제로 하지 않음
  • 각 데이터 간의 거리를 활용하여 새로운 데이터를 예측  => 가까이에 있는 데이터를 고려하여 예측값이 결정
  • K Nearest Neighbors => K개의 가장 가까운 이웃 데이터에 의해 예측된다
  • 분류 및 회귀 문제를 푸는 데 사용

  • 다중 분류(2개 이상) 문제에서 가장 간편히 적용할 수 있는 알고리즘
  • 데이터가 크지 않고 예측이 까다롭지 않은 상황에서 KNN을 사용하면 빠르고 쉽게 예측 모델을 구현할 수 있음
    • 기준 모델로도 사용
  • 주로 분류(Classification)에서 사용
  • 로지스틱 회귀(LogisticRegression)로해결할수 없는 3개 이 상의 목표 변수들을 분류할 수 있음
  • 작은 데이터셋에 적합

장점

-수식에 대한 설명이 불필요할 만큼 직관적&간단

- 독립변수와 종속변수의 선형 관계를 가정할 필요 없음( <=> 선형 모델)

 

단점

- 데이터가 커질수록 처리 속도가 느려질 수 있음

- 아웃라이어(이상치)에 취약함

※ 아웃라이어(Outlier):평균치에서 크게 벗어나는 데이터 ex) 페이커, 유재석, BTS…

 

 

 

필요한 라이브러리