这篇博客记录了利用python读取txt文件的方法,暂且只记录了一个比较简单的方法。如有需要,之后还会添加新的方法。
先看我们要处理的数据:
其中前三列是特征数组,最后一列是标签。
程序如下:
dataMat=[];
labelMat=[];
fr=open(filename)
for line in fr.readlines():
lineArr=line.strip().split('\t')
dataMat.append([float(lineArr[0]),float(lineArr[1]),float(lineArr[2])])
labelMat.append(lineArr[3])
需要注意一下几点:
1. 利用python 内置的list数据结构来逐行存储数据,但在计算矩阵的时候最好转换成numpy的array形式来处理:dataMat=array(dataMat)
2. 对lineArr[0]进行float转换,否则读完之后是string类型