机器学习笔记——Knn
原理:
K近邻是个分类算法。存在一个标注好的数据集,输入没有标签的新数据后,计算新数据与标注好数据之间的距离,根据距离远近进行排序,选择前k个数据,统计k个数据中,各类别的占比,将待分类的新数据归为占比多的类别中。
距离:
距离是确定两样本间相似度的标志,常用的距离定义有很多种,一般采用欧式距离。
import numpy as np
def Eucli_dist(x,y):
x=np.array(x)#转成数组形式后,可以直接进行向量的加减
y=np.array(y)
return np.sqr
原创
2020-07-18 20:56:30 ·
126 阅读 ·
0 评论