1 obj1 = open('E:\Python\\filetest.txt','r')2 obj1 = open('filetest.txt','w+')3 obj1.write('I heard the echo, from the valleys and the heart\nOpen to the lonely soul of sickle harvesting\n')4 obj1.writelines([5 'Repeat outrightly, but also repeat the well-being of\n',6 'Eventually swaying in the desert oasis'
7 ])
刚刚我们使用write和writelines方法向文件里写入了泰戈尔的一段小诗,结果如下:
I heard the echo, fromthe valleys and the heart
Open to the lonely soul of sickle harvesting
Repeat outrightly, but also repeat the well-being of
Eventually swayingin the desert oasis
读文件操作
我们以上面这个文件为例,来说说读文件:
首先来看一下直接读取文件中所有内容的方法read和readlines,从下面的结果来看就知道这两种方法一个返回列表,一个是返回字符串,和上面的write方法相对应:
#readline方法
obj1= open('E:\Python\\filetest.txt','r')
print'readlines:',obj1.readlines()5#readline方法
print"read:",obj1.read()
View Code
readlines: ['I heard the echo, from the valleys and the heart\n', 'Open to the lonely soul of sickle harvesting\n', 'Repeat outrightly, but also repeat the well-being of\n', 'Eventually swaying in the desert oasis']
1 read: I heard the echo, fromthe valleys and the heart2 Open to the lonely soul of sickle harvesting3 Repeat outrightly, but also repeat the well-being of4 Eventually swaying in the desert oasis
readlines和read方法虽然简便好用,但是如果这个文件很庞大,那么一次性读入内存就降低了程序的性能,这个时候我们就需要一行一行的读取文件来降低内存的使用率了。
readline,next,xreadlines:用来按行读取文件,其中需要仔细看xreadlines的用法,因为xreadlines返回的是一个迭代器,并不会直接返回某一行的内容
需要注意的是,尽管我把这一大坨代码放在一起展示,但是要是真的把这一大堆东西放在一起执行,就会报错(ValueError: Mixing iteration and read methods would lose data),具体的原因下面会进行解释。
1 obj1 = open('E:\Python\\filetest.txt','r')2 #readline方法3 print "readline:",obj1.readline()4 #readline方法5 print "next:",obj1.next()6 #readline方法7 r =obj1.xreadlines()8 print 'xreadlines:',r.next()9 #readline方法10 print 'readlines:',obj1.readlines()11 #readline方法12 print "read:",obj1.read()
View Code
先展示一下执行上面这些程序的结果好了:
左侧是代码,右侧是相应的执行结果。这里先展示readline,next,xreadlines这三个方法。
1 readline: I heard the echo, fromthe valleys and the heart2
3 next: Open to the lonely soul of sickle harvesting4
5 xreadlines: Repeat outrightly, but also repeat the well-being of
这里要补充一点,xreadlines方法在python3.0以后就被弃用了,它被for语句直接遍历渐渐取代了:
1 obj1 = open('filetest.txt','r')2 for line inobj1:3 print line4
5 运行结果:6 I heard the echo, fromthe valleys and the heart7
8 Open to the lonely soul of sickle harvesting9
10 Repeat outrightly, but also repeat the well-being of11
12 Eventually swaying in the desert oasis
文件中的指针
看完了文件的读写,文件的基本操作我们就解决了,下面介绍文件处理中和指针相关的一些方法: seek,tell,truncate
1 obj1 = open('filetest.txt','w+')2 obj1.write('I heard the echo, from the valleys and the heart\n'
3 'Open to the lonely soul of sickle harvesting\n')4 print '1.tell:',obj1.tell()5 obj1.writelines([6 'Repeat outrightly, but also repeat the well-being of\n',7 'Eventually swaying in the desert oasis'
8 ])9 print '2.tell:',obj1.tell()
首先看tell,tell的作用是指出当前指针所在的位置。无论对文件的读或者写,都是依赖于指针的位置,我们从指针的位置开始读,也从指针的位置开始写。我们还是写入之前的内容,在中间打印一下tell的结果。执行代码后结果如下:
1 tell: 96
2 tell: 188
接下来再看一下seek的使用:
1 obj1 = open('E:\Python\\filetest.txt','r')2 print "next:",obj1.next(),'tell1:',obj1.tell(),'\n'
3 obj1.seek(50)4 print "read:",obj1.read(),'tell2:',obj1.tell(),'\n'
1 next: I heard the echo, fromthe valleys and the heart2 tell1: 188
3
4 read: Open to the lonely soul of sickle harvesting5 Repeat outrightly, but also repeat the well-being of6 Eventually swaying in the desert oasis tell2: 188
从显示的执行结果来看这个问题,我们在使用next读取文件的时候,使用了tell方法,这个时候返回的是188,指针已经指向了tell的结尾(具体原因在下面解释),那么我们执行read方法,就读不到内容了,这个时候我们使用seek方法将指针指向50这个位置,再使用中read方法,就可以把剩下的内容读取出来。
在看一个关于truncate的例子:
1 obj1 = open('filetest.txt','r+')2
3 obj1.write('this is a truncate test,***')4 obj1.seek(0)5 print 'first read:\n',obj1.read()6
7 obj1.seek(0)8 obj1.write('this is a truncate test')9 obj1.truncate()10 obj1.seek(0)11 print '\nsecond read:\n',obj1.read()
1 first read:2 this is a truncate test,***valleys and the heart3 Open to the lonely soul of sickle harvesting4 Repeat outrightly, but also repeat the well-being of5 Eventually swaying inthe desert oasis6
7 second read8 this is a truncate test
有上面的打印结果我们可以知道,在文件进行写操作的时候,会根据指针的位置直接覆盖相应的内容,但是很多时候我们修改完文件之后,后面的东西就不想保留了,这个时候我们使用truncate方法,文件就仅保存当前指针位置之前的内容。我们同样可以使用truncate(n)来保存n之前的内容,n表示指针位置。
with操作文件
为了避免打开文件后忘记关闭,可以通过管理上下文,即:with open('文件路径','操作方式') as 文件句柄:
1 #使用whith打开可以不用close2 with open('E:\Python\\filetest.txt','r') asfile_obj:3 file_obj.write('')4
5 #在Python 2.7后,with又支持同时对多个文件的上下文进行管理,下例为同时打开两个文件6 #with open('E:\Python\\filetest1.txt','r') as file_obj1,open('E:\Python\\filetest2.txt','w') as file_obj2:'''
容易犯的错误:
ValueError: Mixing iteration and read methods would lose data
我在操作文件的过程中遇到过这样一个问题,从字面上来看是说指针错误,那么这种问题是怎么产生的呢?我发现在使用next或者xreadlines方法之后再使用read或readlines方法就会出现这种错误,原因是next或者xreadlines包括我们平时常用的for循环读取文件的方式,程序都是在自己内部维护了一个指针(这也解释了我们使用这些方法的时候再用tell方法拿到的指针都是指向了的文件末尾,而不是当前独到的位置),所以如果我们要先使用上述的next或者xreadlines方法读取一行,然后再用read或readlines方法将剩余的内容读到就会报错。
解决方案:
这个时候有两种解决方案:
第一种,在读取一行后,用seek指定指针的位置,就可以继续使用其他方法了
第二种,使用readline方法,这个方法没有内部维护的指针,它就是辣么单纯的一行一行傻傻的读,指针也就傻傻的一行一行往下移动。这个时候你也可以使用tell方法追踪到指针的正确位置,也可以使用seek方法定位到想定位的地方,配合truncate,wirte等方法,简直不能更好用一些。