文件系统

python文件系统

1、标准库OS常用命令

  • 常用命令

常用命令的调用方式

>>>import os
>>>os.常用命令()
常用命令描述
getcwd查看当前路径
chdir修改当前路径
mkdir建立一个子文件夹,已存在时会报错
rmdir删除一个文件夹,不存在时会报错
listdir列出当前目录或指定目录下所有文件夹及文件的名称,返回一个列表
rename修改文件或文件夹的名称
remove删除一个文件

注意:如果想要把一个目录下的文件名前都加上前缀,则可以通过循环遍历来实现

>>>for i in os.listdir():
>>>       os.rename(i,'前缀'+i)     

2、文件的打开与关闭

文件概述
  • 文件可以包含任何数据内容。概念上,文件是数据的集合和抽象,类似地,函数是程序的集合和抽象。用文件形式组织和表达数据更有效也更为灵活。

  • 文件包括两种类型:文本文件和二进制文件

    • 二进制文件直接由比特0和比特1组成,没有统一字符编码,文件内部数据的组织格式与文件用途有关。

    • 二进制文件和文本文件最重要的区别在于是否有统一的字符编码

    • 无论文件创建为文本文件或者二进制文件,都可以用“文本文件方式”和“二进制文件方式”打开,打开后的操作不同

    • python中可通过内置方法Open()打开文件,open()方法的申明如下:

         open(file,mode = 'r',buffering = -1)
      

      该方法中的参数file一般为文件的路径名,参数mode用于设置文件的打开模式,默认值为‘r’,表示以只读模式打开文件,参数buffering用于设置访问文件时采用的缓冲方式,默认值为-1,表示采用系统默认的缓冲机制。若使用open()方法成功打开文件,则返回一个文件流,否则设置errno

文件的打开与关闭
  • 文件的打开
    OPen()函数提供7种基本的打开模式
打开模式含义
‘r’只读模式,如果文件不存在,则返回异常FIileNotFoundError,默认值
‘w’覆盖写模式,文件不存在则创建,存在则完全覆盖源文件
‘x’创建写模式,文件不存在则创建,存在则返回异常FileExistsError
‘a’追加写模式,文件不存在则创建,存在则返回原文件最后追加内容
‘b’二进制文件模式
‘t’文本文件模式,默认值
‘+’与r/w/x/a一同使用,在原功能基础上增加同时读写功能
‘rb’以二进制格式打开一个文件用于只读,文件指针将会放在文件的开头,这是默认模式
‘r+’打开一个文件用于读写,文件指针会放在文件的开头
‘w+’打开一个文件用于读写,如果该文件已存在则将其覆盖,如果文件不存在,创建新文件
‘wb+’以二进制格式打开一个文件用于读写,如果该文件已存在则将其覆盖,如果该文件不存在,创建新文件

r /w /x /a 等价于

rtwtxtat
r+w+x+a+
rbwbxbab
rb+wb+xb+ab+

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 打开非utf-8编码的文件
    要读取非utf-8编码的文本文件,需要给open()函数传入encoding参数,例如,读取GBK编码的文件
>>>f = open('/Users/z9761/Desktop/gbk.txt','r',encoding = 'gbk')
>>>f,read()

遇到有些编码不规范的文件,你可能会遇到UnicodeDecodeError,因为在文本文件中可能夹杂了一些非法编码的字符。遇到这种情况,open()函数还接收一个errors参数,表示如果遇到编码错误后如何处理,最简单的方法时直接忽略:

>>>f = open('/Users/z9761/Desktop/gbk.txt','r',encoding = 'gbk',error = 'ignore')
  • 打开二进制文件
    前面讲的默认都是读取文本文件,并且是utf-8编码的文本文件,要读取二进制文件,比如图片、视频等等,用‘rb’模式打开文件即可:
>>>f = open('/Users/z9761/Desktop/aaa.jpg','rb')
>>>f.read()
b'\xff\xd8\xff\xe1\x00\x18Exif\x00\x00.....'       #十六进制表示的字节
  • 文件的关闭
f.close()
  • 程序执行完毕后,系统会关闭由该程序打开的文件,但更好的做法,是在文件使用完毕后,由程序调用close()方法关闭文件。
  • 在文件使用完毕后,及时使用close()函数关闭文件是有必要的

2、使用with open()函数打开
使用方法
每次都这么写实在太繁琐了,所以python引入了with语句来自动帮我们调研close()方法

>>>with open('/path/to/file','r') as f:
>>>      print(f.read())

说明:

  • f.read()读取全部文件内容

  • 调用read()会一次性读取文件的全部内容,如果文件有10G,内存就爆了

  • 要保险起见,可以反复调用read(size)方法,每次最多读取size个字节的内容,例如,read(1024)每次读取1024个字节的数据内容

  • 调用readline()可以每次读取一行内容,调用readlines()一次读取所有内容并按行返回list。因此,要根据需要决定怎么调用

  • 如果文件很小,read()一次性读取最方便,如果不能确定文件大小,反复调用read(size)比较保险,如果是配置文件,调用readlines()最方便

>>>for line in f.readlines():
>>>       print(line.strip())    #把末尾的'\n'在strip()函数中可以把目标内容line里面所有的空格,空行等都删除掉,只剩余文字内容
  • read()方法可从指定文件中读取指定字节的数据,该方法的定义如下:
>>>read(size)

其中size用于指定从文件中读取的数据的字节数,若参数缺省,则一次读出指定文件中的所有数据,以读取文件a.txt中的数据为例,read()的用法如下:

>>>f = open('./a.txt')
>>>f.read(5)                 #从a.txt中读取5个字节
'hello'
>>>f,read(3)               #从a.txt中读取3个字节
' it'
>>>f.read()                #读取剩余的全部数据
‘heima.\nhello it cast.hello world.’
>>>f.read()
..                         #再次调用,读取到的数据为空

我们会发现,在文件的一次打开与关闭之间进行的读写操作都是连续的,程序总是从上次读写的位置继续向下进行读写操作,实际上,每个文件对象都有一个称为“文件读写位置”的属性,该属性用于记录文件当前读写的位置。

python中提供了一些获取文件读写位置以及操作文件读写位置的方法,下面将对这些方法进行讲解。
1、tell()
用户可通过tell()方法获取文件当前的读写位置,在打开一个文件后,文件默认的读写位置为0,当对文件进行读操作后,文件的读写位置也随之移动。
2、f.seek()
一般情况下,文件的读写是顺序的,但并非每次读写都需从当前位置开始。python提供了seek()方法,使用该方法可控制文件的读写位置,实现文件的随机读写。seek()方法的声明如下:

>>>seek(offest,from)

其中参数offest表示偏移量,即读写位置需要移动的字节数,from用于指定文件的读写位置,该参数的取值为:0、1、2,他们代表的含义分别如下:

  • 0:表示文件开头
  • 1:表示使用当前读写位置
  • 2:表示文件末尾

在这里插入图片描述

文件的其它属性与方法

调用方法

>>>文件名.方法或属性
  • 文件的方法
名称功能
fileno()返回底层文件的文件描述符
flush()清空文件对象,将缓存中的内容写入磁盘
readable()若文件对象以打开且等待读取,则返回True,否则返回False
seekable()若文件支持随机存取,则返回True,否则返回False
truncate(size)截取文件到当前文件读写位置,若给定size,则截取为size大小
next()返回文件对象的下一行
  • 文件的属性
名称功能
mode获取文件对象的打开模式
name获取文件对象的文件名
encoding获取文件使用的编码格式
closed若文件已关闭则返回True,否则返回False

写文件

python中可通过write()方法向文件中写入数据,write()方法的定义如下:
write(str)
其中str表示要写入文件中字符串,若调用成功则返回本次写入文件中的字节数

>>>f = open('myfile.txt','w')       #要写入内容,必须要先打开文件
>>>d.write("hello world.\n")       #写入字符串
13                                                #本次写入文件的字节数
>>>f.write("hello sky.")
10
>>>f.write("hello flower.")
13
f.close()                                        #关闭文件

文件缓冲

python中的open()方法的参数buffering可用来设置访问文件的缓冲方式,若buffering设置为0,则表示采用非缓冲方式:若设置为1则表示每次缓冲一行数据,若设置为大于1的值则表示使用给定值作为缓冲区的大小。当然若参数buffering缺省,或被设置为负值时,表示使用默认缓冲机制(由设备类型决定)

相比内存与缓冲区之间的读写,内存与磁盘间的读写时间消耗更大,因此采用有缓冲的打开方式可减少内存与磁盘的交互次数,提高文件读写的效率

这次关于文件的内容就到这

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值