机器学习之K近邻算法识别手写数字:
1.准备数据:将图像转换为测试向量
书中提供数据0到9如图所示,世纪图像存储在源代码的两个子目录里:目录trainingDigits中包含了大约2000个例子,每个例子的内容如下图所示,每个数字大约有200个样本;目录testDigits中包含了大约900个测试数据。两组数据没有重叠。

我们将把一个32*32的二进制图像矩阵转化为1*1024的向量,这样前两节使用的分类器可以处理数据图像信息了。实现代码:
def img2vector(filename):
"""
Function: 32*32图像转换为1*1024向量
Args: filename:文件名称字符串
Returns: returnVect:转换之后的1*1024向量
"""
#初始化要返回的1*1024向量
returnVect = zeros((1, 1024))
#打开文件
fr = open(filename)
#读取文件信息
for i in range(32):
#循环读取文件的前32行
lineStr = fr.readline()
for j in range(32):
#将

最低0.47元/天 解锁文章
2226

被折叠的 条评论
为什么被折叠?



