K-近邻算法:KNN
【原理】
前提条件:存在一个样本数据集,该样本数据集中每一组数据都有一个标签,即我们提前是知道每一组数据是属于哪一类的。
输入:输入一组还不知道属于哪一类的数据。
输出:判断输入的数据是哪一类?
用KNN算法求解过程:求解该输入数据到每一组样本数据的距离,按照距离的大小从小到大排列,选取其中最小的前K组数据。统计该K组数据中各类型所占的数目,占比最大的那一个类型即为解。
两个点之间的距离计算:;
则点A和点B之间的距离为
。任何两个点之间的距离实质是都是两个向量之间的距离。
各点坐标的表示:每一个点的坐标的表示,以一个32x32的图像代表一个点为例,该数字图像是32x32的,总共有1024个像素,因此与其对应的点的坐标应该有1024个参数。我们可就从左到右、从上到下逐一扫描图像上的点并将每点的像素值挨个赋值给对应的坐标参数。