하루공부
📋ML_KNN_알고리즘🚩
킴바다
2022. 11. 9. 17:36
K-최근접 이웃(KNN)
- 거리 기반 모델
- 선형 과계를 전제로 하지 않음
- 각 데이터 간의 거리를 활용하여 새로운 데이터를 예측 => 가까이에 있는 데이터를 고려하여 예측값이 결정
- K Nearest Neighbors => K개의 가장 가까운 이웃 데이터에 의해 예측된다
- 분류 및 회귀 문제를 푸는 데 사용
- 다중 분류(2개 이상) 문제에서 가장 간편히 적용할 수 있는 알고리즘
- 데이터가 크지 않고 예측이 까다롭지 않은 상황에서 KNN을 사용하면 빠르고 쉽게 예측 모델을 구현할 수 있음
- 기준 모델로도 사용
- 주로 분류(Classification)에서 사용
- 로지스틱 회귀(LogisticRegression)로해결할수 없는 3개 이 상의 목표 변수들을 분류할 수 있음
- 작은 데이터셋에 적합
장점
-수식에 대한 설명이 불필요할 만큼 직관적&간단
- 독립변수와 종속변수의 선형 관계를 가정할 필요 없음( <=> 선형 모델)
단점
- 데이터가 커질수록 처리 속도가 느려질 수 있음
- 아웃라이어(이상치)에 취약함
※ 아웃라이어(Outlier):평균치에서 크게 벗어나는 데이터 ex) 페이커, 유재석, BTS…
필요한 라이브러리