KNN算法: 邻近算法,或者说K最邻近(KNN,K-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻近值来代表。近邻算法就是将数据集合中每一个记录进行分类的方法。 算法思想: 给定已知的数据和标签,给定k值。给定新数据,那么怎么判断新数据为哪一类呢? 那就把新数据和已知的数据进行距离计算吧,这里要注意必须刻画成可计算的数值进行计算,通常采用欧氏距离,也就是我们初中学过的两点之间计算距离的方法。 计算完的距离就是会有大有小吧,那么再根据大小进行排序