一、file tell( )方法
tell( )方法返回文件的游标位置,即文件指针当前位置。
二、遇到的问题
在使用中发现:同样的.txt文件内容和.py文件,在Mac上和windows上运行的结果不同,即tell( )返回的结果不一致。
测试文件内容如下:
good evening!
ryroad2
12
测试代码如下:
with open("file.txt", "r", encoding="utf-8") as fp:
print(fp.tell())
print(fp.readline())
print(fp.tell())
print(fp.readline())
print(fp.tell())
在windows上运行结果如下:
在mac上运行结果如下:
三、问题出现的原因
为了弄清楚为什么tell( )方法在windows与mac上返回的结果不一致,我们分别在windows和mac上运行如下代码:
import os
os.linesep
len(os.linesep)
windows运行结果:
mac运行结果:
Tips:os.linesep返回当前平台使用的行终止符。如上图所示,Windows使用'\r\n',Mac使用'\n'。官网解释为“The string used to separate (or, rather, terminate) lines on the current platform. ”
综上所述,tell( )方法在windows与mac上返回的结果不一致的原因是:
在windows平台上,文件第一行“good evening!"其实等于"good evening!\r\n",共15个字符,而tell( )是从0开始计算的,所以在读取完第一行后,游标指向文件第二行的首个字符"r",所以返回15。
在mac平台上,文件第一行“good evening!"其实等于"good evening!\n",共14个字符,所以返回14。
四、扩展内容
微软的自带记事本程序notepad.exe会给UTF-8编码的文件头加入三个隐藏的字节(即BOM)。就是为了让编辑器不去猜测文件本身是ASCII码还是UTF-8。
所以会出现以下情况:
tell()返回18,由正常的15+3个隐藏BOM字节组成。可使用notepad++编辑,将文件保存为utf-8 without BOM,即可解决此问题。