-
머신 러닝 만들기(파이썬을 이용)기계학습 2021. 9. 10. 13:12
"생선의 이름을 자동으로 분류해야 한다."
라는 일을 하기위해서 머신러닝을 짜야한다.
문제 정의
도미 vs 빙어
2개의 class
classification(분류)
binary classification(이진 분류)
데이터 준비
도미(bream) 데이터 - 산점도(파랑)
빙어(smelt) 데이터 - 산점도(주황)
데이터 합치기
length = bream_length+smelt_length
weight = bream_weight+smelt_weight
fish_data = [[l, w] for l, w in zip(length, weight)]
정답 준비
1 - 도미
0 - 빙어
fish_target = [1]*35 + [0]*14
k-최근접 이웃
from sklearn.neighbors import KNeighborsClassifier
kn = KNeighborsClassifier()
kn.fit(fish_data, fish_target)
kn.score(fish_data, fish_target) -> 1.0
kn을 '객체' 보다는 모델이라고 부른다.
머신러닝 -> 지도 학습 -> k-최근접 이웃
k-최근접 이웃 알고리즘
- k-Nearest Neighbor(k-NN)
- 입력에 대해 가장 가까운 k개를 찾아서 분류(회귀)하는 방식
- 회귀: 여러개의 독립적인 변수에 영향을 받는 변수의 상관관계
- k-NN에서 학습이란 학습 데이터(training data)와 항목(target)을 저장하는 것
가장 가까운 거리를 어떻게 찬는가.
여러 거리 척도 사용 가능하다.
유클리드 거리
점x=𝑥1,𝑥2,…,𝑥𝑛와 점점y=𝑦1,𝑦2,…,𝑦𝑛가 있을 때 , 두 점사이의 거리를 계산하는 방법
지금 까지 한 것으로 머신러닝 모델 하나를 만들었다.
'기계학습' 카테고리의 다른 글
회귀 (0) 2021.09.24 머신 러닝 만들기 - 데이터 전처리 (0) 2021.09.17 데이터 전처리 (0) 2021.09.17 머신 러닝 만들기(파이썬을 이용) - 2 (0) 2021.09.10 기계학습 (0) 2021.09.03