🎟️ 들어가기

🎟️ 01-3 마켓과 머신러닝: 생선 분류 문제

💗 01-3 Code

도미와 빙어 데이터를 준비하고, 산점도로 시각화하기

# 도미 데이터 준비하기
bream_length = bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 
31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 
35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0]
bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0, 
500.0, 340.0, 600.0, 600.0, 700.0, 700.0, 610.0, 650.0, 575.0, 685.0, 620.0, 680.0, 
700.0, 725.0, 720.0, 714.0, 850.0, 1000.0, 920.0, 955.0, 925.0, 975.0, 950.0]

# 도미의 길이와 무게 산점도로 표현하기
import matplotlib.pyplot as plt #맷플롯립 라이브러리가 필요하다

plt.scatter(bream_length, bream_weight) #첫 번째 인수는 x, 두 번째 인수는 y에 할당
plt.xlabel('length') #축 이름 설정하기, = 이 아니라 괄호 안에 넣는 것 조심!
plt.ylabel('weight')
plt.show() #그래프 띄우기

# 이번에는 빙어 데이터를 준비하여, 도미와 빙어를 한 번에 산점도로 나타낼 수 있다. 
smelt_length = [9.8, 10.5, 10.6, 11.0, 11.2, 11.3, 11.8, 11.8, 12.0, 12.2, 12.4, 13.0, 14.3, 15.0]
smelt_weight = [6.7, 7.5, 7.0, 9.7, 9.8, 8.7, 10.0, 9.9, 9.8, 12.2, 13.4, 12.2, 19.7, 19.9]

# 도미와 빙어 한 번에 산점도로 표현하기
plt.scatter(bream_length, bream_weight)
plt.scatter(smelt_length, smelt_weight)
plt.xlabel('length')
plt.ylabel('weight')
plt.show()

#결과: 선형성을 띈다

K-최근접 이웃 머신러닝 모델 구축하기

# 머신러닝을 적용하기 위해 도미와 빙어의 데이터를 하나로 합치기
length = bream_length + smelt_length
weight = bream_weight + smelt_weight

# 사이킷런 라이브러리를 적용하기 위해 2차원 리스트로 만들기
# 사이킷런에서는 대부분 2차원의 리스트를 사용한다
# zip 함수와 리스트 반복 구문을 사용한다
fish_data = [[l,w] for l, w in zip(length, weight)]
# length, weight 리스트에서 하나씩 꺼내는 것을 반복, 리스트 컴프리헨션
# [l,w]가 하나의 원소로 구성된 리스트가 만들어짐 

# 정답 데이터 준비하기(도미=1, 빙어=0)
fish_target = [1]*35 + [0]*14

# K-최근접이웃 알고리즘 로드하기
from sklearn.neighbors import KNeighborsClassifier
kn = KNeighborsClassifier() #객체 만들기

# 모델 훈련시키기
kn.fit(fish_data, fish_target)
kn.score(fish_data, fish_target) #정확도 평가
kn.predict([[30,600]]) #예측하기 

# 참고 데이터를 49개로 한 kn49 모델
kn49 = KNeighborsClassifier(n_neighbors=49)

🎟️ 1주차 기본 숙제: 코랩 실습 환경 캡쳐하기

스크린샷 2024-07-07 오후 7.38.57.png