【机器学习】KNN —k近邻算法的学习
算法介绍
这个算法适合机器学习初学者的算法,基本没有任何的数学知识,在机器学习中有很好地效果,能够解释很多机器学习中的问题,更完整的刻画机器学习的算法应用,同样也有很多缺点。
如图,当新的数据来到时,将数新的数据与原有数据进行比较,选取其最近的K 个原有数据来进行比较,通过比较的结果来判断该点的分类情况。该算法首先能解决的就是监督学习中的分类问题,当然回归问题也可得到解决。
举例
在这里的数据集是根据学习视频里编写的假的数据集,具体思路根据代码中的注释来观察。
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
raw_data_X = [ [3.393533211,2.331273381 ],
[3.110073483,1.781539638],
[1.343808831,3.368360954],
[3.582294042,4.679179110],
[2.280362439,2.866990263],
[7.423436942,4.696522875],
[5.745051997,3.533989803],
[9.172168622,2.511101045],
[7.792783481,3.424088941],
[7.939820817,0.791637231] ]
raw_data_y = [0,0,0,0,0,1,1,1,1,