自己练手用的,可能是最简单的了吧,什么都没有封装。
# -*- coding:utf-8 -*-
import numpy as np
x_data = np.array([[1.0, 1.1], [1.0, 1.0], [0, 0], [0, 0.1]])
y_data = np.array(['A', 'A', 'B', 'B'])
x = np.array([[0, 0]]) # 要分类的数据
distance = np.sum((x-x_data)**2, axis=1)**(1/2) # 这里采用欧式距离
dis_sort = distance.argsort() # 将距离数组排序,以下标的形式显示出来,最小元素下标在dis_sort首位
dist_dic = {}
for i in range(3): # 假设K值为3
alabel = y_data[dis_sort[i]]
dist_dic[alabel] = dist_dic.get(alabel, 0)+1 # 这里用字典保存最好了
results = sorted(dist_dic, reverse=True) # sorted里面放原始字典dist_dic,排序后结构为['B', 'A'];如果里面放dist_dic.items(),结果为[('B', 2),('A', 1)]
print(results[0])