1.什么是K近邻
通俗的将,如果我是一个样本,KNN算法就是找最近的几个样本,看看它们都属于什么类别,然后选择占比最大的类别作为自己的类别。KNN的全称是k-NearestNeighbor,K就是我们要寻找的样本数量,K=1时就是找最近的样本,然后自己的类别就是那个样本的类别。
KNN中还要计算自己与其他样本的距离,这里就有多做距离计算方法(取决于参数 p≥1 p ≥ 1 ):
- 曼哈顿距离(Manhattan distance):当 p=1 p = 1 时,距离计算公式为:
L1(xi,xj)=∑l=1N