#coding=utf8
#KNN.py
from numpy import *
import operator
def createDataSet():
group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]) #我觉得可以这样理解,每一种方括号都是一个维度(秩),这里就是二维数组,最里面括着每一行的有一个方括号,后面又有一个,就是二维,四行
labels=['A','A','B','B']
return group,labels
def classify0(inX,dataSet,labels,k): #inX是你要输入的要分类的“坐标”,dataSet是上面createDataSet的array,就是已经有的,分类过的坐标,label是相应分类的标签,k是KNN,k近邻里面的k
dataSetSize=dataSet.shape[0] #dataSetSize是sataSet的行数,用上面的举例就是4行
diffMat=tile(inX,(dataSetSize,1))-dataSet #前面用tile,把一行inX变成4行一模一样的(tile有重复的功能,dataSetSize是重复4遍,后面的1保证重复完了是4行,而不是一行里有四个一样的),然后再减去dataSet,是为了求两点的距离,先要坐标相减,这个就是坐标相减
sqDiffMat=diffMat**2 #上一行得到了坐标相减,然后这里要(x1-x2)^2
机器学习实战 第二章KNN(1)python代码及注释
最新推荐文章于 2024-06-12 10:02:24 发布