我们在开发的时候,要对数据进行持久化是必不可少的。我们经常用到i的主要是MYSQL和文件的方式对数据进行持久化,那么接下来我们主要聊聊python中的文件操作,主要涉及的模块主要有os,shutil和pathlib等模块。
Python中文件的读和写
在Python中实现文件的读写操作其实非常简单,但是所有的文件操作之前,我们都要打开文件,而在python中我们使用”open“函数打开,我们可以指定文件名,操作模式和编码信息等来获得操作文件的对象,接下来就可以对文件进行读写操作了。那么下面我们先说说操作模式:
模式 | 描述 |
---|---|
t | 文本模式 (默认)。 |
x | 写模式,新建一个文件,如果该文件已存在则会报错。 |
b | 二进制模式。 |
+ | 打开一个文件进行更新(可读可写)。 |
U | 通用换行模式(不推荐)。 |
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
rb | 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。 |
r+ | 打开一个文件用于读写。文件指针将会放在文件的开头。 |
rb+ | 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。 |
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb | 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
w+ | 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb+ | 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
a | 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
ab | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
a+ | 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 |
ab+ | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
有了上面对操作模式的介绍,那么我们就可以根据自己的需求选择打开文件的方式,但我们打开文件之后,就可以对文件数据进行操作,下面我在这里先给大家一些我们经常使用到的文件操作函数,如下:
open(name,mode) | 直接打开一个文件,根据mode模式不同,来决定文件不存在是否创建文件 |
fp.read([size]) | size为读取的长度,以byte为单位 |
fp.readline([size]) | 读一行,如果定义了size,有可能返回的只是一行的一部分 |
fp.readlines([size]) | 把文件每一行作为一个list的一个成员,并返回这个list |
fp.write(str) | 把str写到文件中,write()并不会在str后加上一个换行符 |
fp.writelines(seq) | 把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西 |
fp.close() | 关闭文件 |
fp.flush() | 把缓冲区的内容写入硬盘 |
fp.fileno() | 返回一个长整型的”文件标签“ |
fp.isatty() | 文件是否是一个终端设备文件(unix系统中的) |
fp.tell() | 返回文件操作标记的当前位置,以文件的开头为原点 |
fp.next() | 返回下一行,并将文件操作标记位移到下一行 |
fp.seek(offset[,whence]) | 将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。 |
fp.truncate([size]) | 把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。 |
下面我们开始举一些代码例子,说明这些函数的使用,如下:
def main():
f = open('test.txt', 'r', encoding='utf-8')
print(f.read())
f.close()
if __name__ == '__main__':
main()
通过上面的例子,我们对文件进行读取文件内容的操作。但是如果”open“函数指定的文件(test.txt)不存在或者无法打开,那么将引发异常状况导致程序崩溃。为了让代码有一定的健壮性和容错性,我们可以使用Python的异常机制对这种情况的处理,如下:
def main():
f = None
try:
f = open('test.txt', 'r', encoding='utf-8')
print(f.read())
except FileNotFoundError:
print('无法打开指定的文件!')
except UnicodeDecodeError:
print('读取文件时解码错误!')
finally:
if f:
f.close()
if __name__ == '__main__':
main()
如果我们不愿意在`finally`代码块中关闭文件对象释放资源,也可以使用上下文语法,通过`with`关键字指定文件对象的上下文环境并在离开上下文环境时自动释放文件资源,代码如下:
def main():
try:
with open('test.txt', 'r', encoding='utf-8') as f:
print(f.read())
except FileNotFoundError:
print('无法打开指定的文件!')
except UnicodeDecodeError:
print('读取文件时解码错误!')
if __name__ == '__main__':
main()
通过上面我们知道在python中对文件的打开,读写和关闭等操作的知识点。但是我们在创建文件的时候,也需要知道在哪里创建(即那个目录下创建),下面我们简单的介绍一下文件夹的操纵函数。
python文件和文件夹操作函数
函数 | 描述 |
os.getcwd() | 得到当前工作目录 |
os.listdir() | 返回指定目录下的所有文件和目录名 |
os.mkdir(“test”) | 创建单个目录 |
os.makedirs(r"home/python”) | 创建多级目录 |
os.rename(old, new) | 重命名 |
os.stat(file) | 获取文件属性 |
os.chmod(file) | 修改文件权限与时间戳 |
os.path.getsize(filename) | 获取文件大小 |
os.path.isabs() | 判断是否是绝对路径 |
os.remove() | 函数用来删除一个文件 |
os.removedirs(r“/home/python”) | 删除多个目录 |
os.path.isfile() | 检验给出的路径是否是一个文件 |
os.path.isdir() | 检验给出的路径是否是一个目录 |
os.path.splitext() | 分离扩展名 |
os.path.dirname() | 获取路径名 |
os.path.basename() | 获取文件名 |