根据《机器学习实战》
#将文本记录转换为Numpy的解析程序
def file2matrix(filename):
fr=open(filename)
arrayOLines=fr.readlines()
numberOfLines=len(arrayOLines) #得到文件行数
returnMat=zeros((numberOfLines,3)) #将行数和列数为3的矩阵填充为0
classLabelVector=[] #类标签向量
index=0
for line in arrayOLines: #迭代每行
line = line.strip() #去除首位空格
listFromLine=line.split('\t') #以空格划分数据
returnMat[index,:]=listFromLine[0:3] #将第index行所有行赋值上当前行前三项
classLabelVector.append(int(listFromLine[-1])) #该行标签给她
index +=1
return returnMat,classLabelVector