def datingClassTest(): #测试函数
hoRatio = 0.10 #设置比例
datingDataMat, datingLabels = file2matrix('datingTestSet2.txt') #返回文本文件处理的数据,分别是3列特征值和一列标签
normMat, ranges, minVals = autoNorm(datingDataMat) #返回归一化之后的数据,分别是3列特征值,一行1*3的最大最小值之差,1*3的每列最小值
m = normMat.shape[0] # m为数据的总数
numTestVecs = int(m * hoRatio) #验证的数据个数为数据总数乘以0.1
errorCount = 0.0 #错误个数暂时定为0个等待增加
for i in range(numTestVecs): #循环100次
classifierResult = classify0(normMat[i, :], normMat[numTestVecs:m, :], datingLabels[numTestVecs:m], 3)
#第一次循环为第一行数据(x1,y1,z1)与后面的900个点分别计算欧式距离,取最近的3个值的标签,取标签重复次数最多的
print('the classifier came back with: %s, the real answer is %s' %(classifierResult, datingLabels[i]))
#分别显示算法的分类标签和真实标签
if (classifierResult != datingLabels[i]):
errorCount += 1.0
print("the total error rate is: %f" %(errorCount / float(numTestVecs)))
学习要点:
python中的int,float
链接:https://www.cnblogs.com/lulipro/p/5059622.html