一、文件工具
外部文件是我们运行系统工具完成的工具核心所在!如:程序从A文件读取输入,将程序结果存入文件B,在载入C文件来检查期望的结果。python的内建函数open是脚本用来在计算机底层系统下访问文件的主要工具,open函数被调用时将返回一个新的与外部文件相连的文件对象。
二、python3.x中的文件对象模型
python3.x中的文件对象模型:文本文件、二进制文件;
在实践中,文本文件用于所有真正的文本相关数据;而二进制文件则用于存储内容(如:打包的二进制数据、图像、音频文件和可执行文件等);
这两种文件类型是通过传入open的模式字符串参数来区分:参数中填上“b”(如:“rb”、“wb”)表示文件中包含二进制数据;
在对编码新文件内容时,文本文件使用普通字符串(‘spam’或bytes.decode()解释:把字节序列解码成字符串),而对二进制使用字节字符串(b'spam'或str.encode解释:把字符串编码成字节序列);
由于不能混用这两种类型,所以选择文件模式很重要;python很多内建工具已作出选择,如:
1.struct与pickle模块在3.X中处理字节字符串,而XML包则处理str字符串。
2.管道符和套接字等系统工具,它们将数据作为字节字符串形式来传输(不过在必要时,它们的内容可以解码和编码为Unicode文本)
三、使用内建文件对象
概述:open函数返回的文件对象有多种方法,包括:
1.读取数据(read、readline、readlines);
2.写入数据(write、writelines);
3.释放系统资源(close);
4.移动到文件的任意位置(seek);
5.将输出缓存区中的数据强制转移到磁盘(flush);
6.获取底层的文件句柄(fileno)等。
在程序打开文件后,若中途程序出现异常,程序还未执行关闭调用代码的时候,确保文件关闭的方式:异常处理器、上下文管理器;
#异常处理器
myfile = open(filename, 'w')
try:
...process myfile...
finally:
myfile.close()
#上下文管理器
with open(filename,'w') as myfile:
...process myfile,auto-closed on statrment exit...
#上下文管理器嵌套
with open A() as a,B() as b:
...statement...
#举例:
with open('data') as fin,open('resluts','w) as fout:
for line in fin:
fout.write(transform(line))
下面,简单示例说明每个函数的实现效果:
#文件和目录工具
with open("document") as docu :
docu.seek(0)#回到文件开头
d = docu.read()#将整个文件读入字符串
print(d)
#Hello file world!!!
#Nice! world!
#OK!
docu.seek(0)
d1 = docu.readlines()#将整个文件读入行列表
print(d1)#['Hello file world!!!\n', 'Nice! world!\n', 'OK!']
docu.seek(0)
d2 = docu.readline()#每次读取一行
print(d2)#Hello file world!!!
with open("document") as dc:
for line in dc.readlines():
print(line,end="")
file = open("document")
print(file.__next__())
print(file.__next__())
print(file.__next__())
#读
with open("document","wb")as o:
o.write('qwe'.encode())
print(open("document","rb").read().decode())
三.1 struct模块解析打包的二进制数据
为了以一种结构化的方式得到二进制数据的内容并构建其内容,可以使用标准库的struct模块;
# -*-coding:utf-8-*-
import struct
## 按照特定格式打包,>表示高位优先,i是四字节整数,4s代表四字节字符串,h是二字节整数,f是浮点数
data = struct.pack('>i4shf',2, b'spam', 3 , 1.234)
file = open("data.bin",'wb')
file.write(data)
file.close()
file = open('data.bin','rb')
bytes = file.read()
# 按照同样的格式解包
values = struct.unpack('>i4shf',bytes)
print(values)
四、os模块中的底层文件工具
os.open(path,flags,mode)#打开文件并返回其描述符;
os.read(descriptor,N)#最多读取N个字节并返回一个字节字符串
os.write(descriptor,string)#把字节字符串string中的字节写入文件
os.lseek(descriptor,postion,how)#在文件中移至position;
os调用通过文件的描述符来处理文件,描述符是整数代码或“句柄”,代表着操作系统中的文件。基于描述符的文件已原始字节形式进行处理,而且没有文本换行符和Unicode转换的概念。
import os,sys
for stream in (sys.stdin,sys.stdout,sys.stderr):
print(stream.fileno())#fileno文件的描述符descriptor
#0,1,2
#下面说明sys.stdout.write与os.write(descripor,string)的效果一样
sys.stdout.write("Hello!!!\n")#除了打印string参数外,还要返回字节数
#Hello!!!
os.write(1,b"Hello!!!\n")#描述符:1-----》stdout;
#Hello!!!
#下面说明借助os模块写入
with open("document","w") as f:
fd=f.fileno()#获取文件描述符
#方式1:文件对象方法写入
f.write("Hello file\n")
f.flush()#不然首先os.write()到硬盘
#方式2:借助os模块写入
os.write(fd,b'Hello file!!!!!!\n')
print(open("document").read())
#结果:
#Hello file
#Hello file!!!!!!
os.open的标识符可以让在打开文件时指定更高级的参数,比如唯一访问权(O_EXCL)和非阻塞模式(O_NONBLOCK)
四.1 其他的os模块文件工具
os模块也包含各种各样的文件工具。如:
os.rename():重命名;os.remove():删除;os.chown()变更文件的所有者,os.chmod()变更文件的权限设置;