读取数据可以方便我们的工作,python中常见的数据读取方式有很多,那么python如何读取数据呢?
利用pandas中的read_csv模块直接将数据读取出来。(推荐学习:Python视频教程)data = pd.read_csv('/home/nw/Desktop/dataset/iris.txt',header = None)
上面的代码,read_csv中前面的是数据集存放的路径,后面的header很重要,经常以为少了header,数据的总量减小了1,因为少掉的那一行数据变成了DataFrame里面的列索引。
还有一种是比较传统的方法,直接用open打开文件,把文件里面的信息先取出来,不管取出来是什么样子的,先取出来再说,想要作什么处理直接对取出的变量做处理即可。f= open('/home/nw/Desktop/dataset/iris.txt','rb')
dataset = pickle.load(f)
#这种方法适用于自己存取自己的数据,有时候在读取别人的数据的时候是不行的,因为别人存数据的方式不一定是用pickle.dump的方
##式存数据的。
f = open('/home/nw/Desktop/dataset/iris.txt')
'''
注意这里的open后