1)常规方法:从前往后依次读取
步骤:open打开文件。
读取文件,把文件所有行读入内存。
遍历所有行,提取指定行的数据。
优点:简单,方便
缺点:当文件大了以后时间太慢,无法忍受
2)推荐方法:
步骤:open打开日志文件。
移动文件读取指针到文件末尾。
从后往前移动指针直到合适的位置。
读取文件,提取指定行的数据。
优点:时间相对固定,适合处理大文件
代码实现:
1 fname = 'test.html'
2 with open(fname, 'r', encoding='utf-8') as f: #打开文件
3 lines = f.readlines() #读取所有行
4 first_line = lines[0] #取第一行
5 last_line = lines[-1] #取最后一行
6 print('文件' + fname + '第一行为:'+first_line)7 print('文件' + fname + '最后一行为:' +last_line)8
9
10 with open(fname, 'rb') as f: #打开文件
11 #在文本文件中,没有使用b模式选项打开的文件,只允许从文件头开始,只能seek(offset,0)
12 first_line = f.readline() #取第一行
13 offset = -50 #设置偏移量
14 whileTrue:15 """
16 file.seek(off, whence=0):从文件中移动off个操作标记(文件指针),正往结束方向移动,负往开始方向移动。17 如果设定了whence参数,就以whence设定的起始位为准,0代表从头开始,1代表当前位置,2代表文件最末尾位置。18 """
19 f.seek(offset, 2) #seek(offset, 2)表示文件指针:从文件末尾(2)开始向前50个字符(-50)
20 lines = f.readlines() #读取文件指针范围内所有行
21 if len(lines) >= 2: #判断是否最后至少有两行,这样保证了最后一行是完整的
22 last_line = lines[-1] #取最后一行
23 break
24 #如果off为50时得到的readlines只有一行内容,那么不能保证最后一行是完整的
25 #所以off翻倍重新运行,直到readlines不止一行
26 offset *= 2
27 print('文件' + fname + '第一行为:' +first_line.decode())28 print('文件' + fname + '最后一行为:' + last_line.decode())
View Code