代码来自 PeterHarrington. 机器学习实战[M]. 人民邮电出版社, 2013. 为了方便阅读做了简单的注释
def classify0(inX, dataSet, labels, k):
dataSetSize = dataSet.shape[0] # 获取矩阵的维数(numpy中的函数)
diffMat = tile(inX, (dataSetSize, 1)) - dataSet # 先依据inX建立
# 一个与dataSet一样的矩阵,
# 然后计分别计算与dataSet每个点的距离
sqDiffMat = diffMat**2 # 计算diffMat的2次幂
sqDistances = sqDiffMat.sum(axis=1) # 默认axis是0,普通的相加
# axis是1, 矩阵的每一行相加
distances = sqDistances**0.5
sortedDistIndicies = distances.argsort() # 从大到小排序
classCount = {}
for i in range(k): # range()表示从0到k个数[0,1