KNN英文全称K-nearst neighbor,中文名称为K近邻算法,它是由Cover和Hart在1968年提出来的
KNN算法原理:
- 计算已知类别数据集中的点与当前点之间的距离;
- 按照距离递增次序排序;
- 选择与当前距离最小的k个点;
- 确定前k个点所在类别的出现概率
- 返回前k个点出现频率最高的类别作为当前点的预测分
#-*-coding:utf-8-*-
import numpy as np
import pandas as pd
def distance(v1,v2):
dist=np.sqrt(np.su