文件系统

标准库OS常用命令

文件的打开与关闭

文件的读与写

tell与seek

  • 标准库OS常用命令
os.getcwd查看当前路径
os.chdir修改当前路径
os.mkdir建立一个子文件夹,已存在时会报错
os.rmdir删除一个文件夹,不存在时会报错
os.listdir列出当前目录或指定目录下所有文件夹及文件的名称,返回一个列表
os.rename修改文件或文件夹的名称
os.remove删除一个文件
  • 文件的打开与关闭
    文件是一个存储在辅助存储器上的数据序列,可以包含任何数据内容。概念上,文件时数据的集合和抽象 。文件包括两种类型:文本文件二进制文件
    在Windows系统中,文件被具象为一个个图标,若想修改文件中的内容,需要双击打开文件;若文件使用完毕,需关闭文件。在程序中操作文件的步骤与通过图形界面操作文件的步骤类似。
    Python中可通过内置方法open() 打开文件
open(file, mode='r', buffering=-1)

该方法中的参数file一般为文件的路径名;参数mode用于设置文件的打开模式,默认值为“r”,表示以只读模式打开文件;参数buffering用于设置访问文件时采用的缓冲方式,默认值为-1,表示采用系统默认的缓冲机制。若使用open()方法成功打开文件,则返回一个文件流,否则设置error。

open()函数提供7中基本的打开模式:‘r’, ‘w’, ‘x’, ‘a’, ‘b’, ‘t’, ‘+’

类型描述
r以只读方式打开文件,文件的指针将会放在文件的开头,这是默认模式
w打开一个文件只用于写入,如果该文件已存在则将其覆盖,如果该文件不存在,创建新文件
a打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入
rb以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式
wb以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件
ab以二进制格式打开一个文件用于追加,如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入
r+打开一个文件用于读写。文件指针将会放在文件的开头
w+打开一个文件用于读写。如果改文件已存在则将其覆盖。如果该文件不存在
a+打开一个文件用于读写。如果该文件存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写
rb+以二进制格式打开一个文件用于读写,文件指针将会放在文件的开头
wb+以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
ab+以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

文件关闭 f.close
利用上述知识可以做一个小练习:

  • 查看当前路径
  • 在当前路径下建立一个名为“big_data”的文件夹
  • 在“big_data”文件夹下建立文件“a.txt”,“b.doc”,“c. py”,以及子文件夹“power_big_data”
  • 将“big_data”下的所有文件名前加上前缀“great_”
  1. f.close()
    由于文件读写时都有可能出现错误,一旦出错,后面的f.close()就不可调用。所以为了保证无论是否出错都能正确地关闭文件,我们可以使用try…finally来实现
try:
	f = open('/path/to/file','r')
	print(f.read())
finally:
    if f:
        f.close()
  1. 使用With Open 函数打开
with open('/path/to/file','r')as f:
	print(f.read())
  1. f.read() 读取全部文件内容:这和前面的try…finally是一样的,但是代码更加简洁,并且不必调用f.close()方法。
  • 调用read()会一次性读取文件的全部内容,如果文件有10G,内存就爆了
  • 保险起见,可以反复调用read(szie)方法,每次最多读取size个字节的内容。例如:read(2019)就是每次读取2019个字节的数据内容
  • 调用readline()可以每次读取一行内容,调用readlines()一次读取所有内容并按行返回list。
  • 如果文件很小,read()一次性读取最方便;如果不能确定文件大小,反复调用read(size)比较保险;如果是配置文件,调用readlines()最方便。

Python中提供了一些获取文件读写位置以及操作文件读写位置的方法,下面将对这些方法进行讲解。

  1. tell()
    用户可通过tell()方法获取文件当前的读写位置。
由以上的例子可以看出,打开一个文件之后,文件默认的读写位置为0;当对文件进行操作后,文件的读写位置也随之移动。
  1. f.seek()
    一般情况下,文件的读写时顺序的,但并非每次读写都需从当前位置开始。Python提供了seek()方法,使用该方法可控制文件的读写位置,实现文件的随机读写。seek()方法的声明如下:
seek(offset,from)

其中参数offset表示偏移量,即读写位置需要移动的字节数;from用于指定文件的读写位置,该参数的取值为:0、1、2,它们代表的含义分别如下:

  • 0:表示文件开头
  • 1:表示使用当前读写位置
  • 2:表示文件末尾
照理说,按照seek()方法的格式file.seek(offset,from),后面的1代表从当前位置开始算起进行偏移,那又为什么报错呢?

这是因为,在文本文件中,没有使用b模式选项打开的文件,只允许从文件头开始计算相对位置,从文件尾计算时就会引发异常。将

f=open("a.txt") 改成f = open("a.txt","rb") 就可以了

参考文章点击此处

文件的其他属性与方法

分类名称功能
方法fileno()返回底层文件的文件描述符
flush()清空文件对象,将缓存中的内容写入磁盘
readable()若文件对象已打开且等待读取,则返回True,否则返回False
sekkable()若文件支持随机存取,则返回True,否则返回False
truncate(size)截取文件到当前文件读写位置,若给定size,则截取为size大小
_ next _()返回文件对象的下一行
属性mode获取文件对象的打开模式
name获取文件对象的文件名
encoding获取文件使用的编码格式
closed若文件已关闭则返回True,否则返回False

写文件
Python中可通过write()方法向文件中写入数据,write()方法的定义:write(str)
其中str表示要写入文件中的字符串。若调用成功则返回本次写入文件中的字节数。

文件缓冲
Python中open()方法的参数buffering可用来设置访问文件的缓冲方式。

  • 若buffering为0,表示采用非缓冲方式
  • 若buffering为1,表示每次缓冲一行数据
  • 若buffering大于1,表示使用给定值作为缓冲区的大小
  • 若buffering省略或为负值,表示使用默认缓冲机制

写入内容
写文件:调用open()函数时,传入标识符‘w’或者‘wb’表示写文本或写二进制文件

  • 我们可以反复调用write()来写入文件,但是务必要调用f.close()来关闭文件
  • 当我们写文件时,操作系统往往不会立刻把数据写入磁盘,二是放到内存缓存起来,空闲的时候再慢慢写入
  • 只有调用close()方法时,操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了。所以,还是用with语句更保险

要写入特定编码的文本文件,给open()函数传入encoding参数,将字符串自动转换成指定编码

打开非utf-8编码的文件
要读取非UTF-8编码的文本文件,需要给open()函数传入encoding参数。例如,读取GBK编码的文件

f = open('a.txt','r',encoding='gbk')
f.read()

打开非utf-8编码的文件

要读取二进制 文件,比如图片、视频等等,用‘rb’模式打开文件即可

f = open('…….jpg','rb')
f.read()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值