K近邻算法是一种用于分类和回归的非参数统计方法,是计算机学习最基础的算法之一。他正是基于以上思想:要确定一个样本的类别,可以计算他与所有训练样本的距离,然后找出和该样本最接近的K个样本,统计出这些样本的那边并进行投票,票数最多的那个那就是分类的结果。
预测算法的流程中如下: 1 . 在训练样本集中找到距离待测样本最近的K个样本,并保存至集合N中。 2. 统计集合N中每一类样本的个数Ci,i=1,2,3……,c; 3. 最终分类的结果为argmaxCi(最大的对应的那个Ci)那个类。
准备实验环境,需要mindspore 2.0和win_x86和Linux系统。