一、问题描述
- 主要程序为kNN.py,在主程序中,包含函数:
- classify0(inX, dataSet, labels, k):实现分类
- file2matrix(filename):将文本文件转换为矩阵,本例中没有用到
- autoNum(dataSet):这个函数没有用到,作用是实现均值归一化
- img2vector(filename):将图片转化为向量,图片大小是32*32,转化后的向量为1*1024,
- Detect_Test():数字识别和错误率计算函数
二、各函数的代码
- classify0(inX, dataSet, labels, k):
from os import listdir
from numpy import *
import operator
def classify0(inX, dataSet, labels, k):
dataSetSize = dataSet.shape[0]
diffMat = tile(inX, (dataSetSize,1)) - dataSet
sqDiffMat = diffMat**2
sqDistances = sqDiffMat.sum(axis=1)
distances = sqDistances**0.5