文件(file)
- 通过python程序来对计算机中的各种文件进行增删改查的操作
- I/O(Input / Output)
- 操作文件的三个必备步骤
(1)打开文件
(2)对文件进行各种操作(读、写),然后保存
(3)关闭文件
打开文件
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
- 上述函数只有一个必须传的参数 file:要打开的文件的名字(路径)
(如果目标文件跟当前文件在同一目录下,则直接使用文件名即可,不用加完整路径)
- 在windows系统中的文件路径用的分隔符是\:C:\Users\LanceMai\Desktop\hello.py
可以用/来代替\ :C:/Users/LanceMai/Desktop/hello.py
或者可以使用 \\ 来代替 \ :C:\\Users\\LanceMai\\Desktop\\hello.py
或者可以使用原始字符串r' ' :r'C:\Users\LanceMai\Desktop\hello.py'
- 表示路径,可以使用..来返回上一级目录
..\\Desktop\\hello.py
- 如果目标文件距离当前文件比较远,可以使用绝对路径,绝对路径一定要包含根目录
C:\Users\LanceMai\Desktop\hello.py
关闭文件
1、不常用的方式
# 打开文件
file_name = 'demo.txt'
# 调用open()来打开文件,将该对象赋值给变量file_obj
file_obj = open(file_name)
# 当我们获取了文件对象之后,所有的对文件的操作都应该通过对象来进行
# 读取文件内容:read()方法,读取文件内容,它会将内容全部保存为一个字符串返回
content = file_obj.read()
# 打印内容
print(content)
# 关闭文件
# 调用close()方法来关闭文件,以释放内存
file_obj.close()
2、常规方式
# with ... as 语句
with open(file_name) as file_obj:
# 在with语句中可以直接使用file_obj来做文件操作
# 此时这个文件只能在with语句块里面使用,一旦with结束则文件自动close()
print(file_obj.read())
3、常用格式
# 结合异常处理
file_name = 'demo.txt'
try:
with open(file_name) as file_obj:
content = file_obj.read()
print(content)
except FileNotFoundError:
print(‘f{file_name} 文件不存在!’)
文件简单读取
file_name = 'demo.txt'
try:
# 调用open()来打开一个文件,可以将文件分成两种类型
# 第一种是纯文本文件(使用uft-8等编码编写的文本文件)
# 第二种是二进制文件(图片、mp3、ppt等文件)
# open()打开文件时,默认是以文本问价的形式打开的,但是open()默认的编码是None:
# encoding=None
所以处理文本文件时,必须指定文件的编码
# 例如: 读取中文文件'古诗.txt'时,可能读不出来,那么就要指定该文件的编码
# encoding='utf-8'
file_name = '古诗.txt'
with open(file_name, encoding='utf-8') as file_obj:
# 直接调用read()会将文本文件所有内容<全部>读取出来
content = file_obj.read()
print(content)
except FileNotFoundError:
print('f{file_name} 文件不存在!')
读取大文件
# read()会将文本文件所有内容<全部>读取出来,当文件比较大时,容易造成内存溢出
# 因此对于比较大的文件,不要直接调用read()
# read()可以接受一个size作为参数,用来指定要读取字符的数量
默认值为-1,表示读取全部字符
可以为size指定一个值,这样read()会读取指定数量的字符
每一次读取都是从上次读取到的位置开始读取的
如果字符的数量少于size,则会读取剩余所有的字符
如果已经读取到了文件的最后吗,,则会返回空串''
content = file_obj.read(6)
content = file_obj.read(6)
content = file_obj.read(6)
content = file_obj.read(6)
- 读取大文件的方式
file_name = 'demo.txt'
try:
with open(file_name, encoding='uft-8') as file_obj:
# 定义一个变量,来指定每次读取的大小
chunk = 100
# 创建一个循环来读取文件内容
while True:
# 读取chunk大小的内容
content = file_obj.read(chunk)
# 检查是否读取到了内容
if not content:
# 内容读取完毕
break # 退出循环
# 输出内容
print(content, end='') # 加上 end=''来美化格式
except FileNotFoundError:
print('f{file_name} 文件不存在!')
- 以上是一段一段地显示,如果希望一段一段读取然后将他们拼接起来,集中显示
那么用以下办法:
file_name = 'demo.txt'
try:
with open(file_name, encoding='uft-8') as file_obj:
# 定义一个变量,来指定每次读取的大小
chunk = 100
# 创建一个循环来读取文件内容
while True:
# 读取chunk大小的内容
content = file_obj.read(chunk)
# 检查是否读取到了内容
if not content:
# 内容读取完毕
break # 退出循环
# 输出内容
file_content += content # 将读取到的字符串进行拼接
except FileNotFoundError:
print('f{file_name} 文件不存在!')
print('file_content') # 最后集中显示
readline()、readlines()
# 以下均省略异常处理代码
- readline()
用于读取一行内容(只读取一行,想读多行则需要多次调用)
with open(file_name, encoding='uft-8') as file_obj:
print(file_obj.readline(), end='')
print(file_obj.readline(), end='')
print(file_obj.readline(), end='')
- readlines()
用于一行一行内容的读取,他会一次性将读取到的内容封装到一个列表中返回
一行内容是一个元素
import pprint
with open(file_name, encoding='uft-8') as file_obj:
r = file_obj.readlines()
pprint.pprint(r[0])
pprint.pprint(r[1])
pprint.pprint(r[2])
pprint.pprint(r[3])
- 循环(文件可逐行迭代)
with open(file_name, encoding='uft-8') as file_obj:
for t in file_obj: # 逐行读取
print(t)
文件写入
file_name = 'demo.txt'
# 使用open()打开文件时必须要指定打开文件后所要做的操作(读、写、追加)
# 如果不指定操作类型,则默认时读取文件(此时不能向文件中写内容)
# r ---> 只读
# w ---> 新建只写(如果文件不存在会创建文件,如果文件存在则会截断文件,即把原来内容删掉重写)
# a ---> 追加内容,如果文件不存在会创建文件,如果文件存在则会会文件中追加内容
# + ---> 为操作符增加功能
r+ 可读可写(覆盖写),文件不存在则报错
w+ 可读读写,文件不存在则创建
a+ 附加读写
# x 新建文件,如果文件不存在则创建,存在则报错
with open(file_name, encoding='uft-8') as file_obj:
# write()来向文件写入内容
# 如果操作的是一个文本文件,则write()需要传递一个字符串作为参数
# 该方法可以分多次向文件中写入内容
# 写入完成后,该方法会返回写入字符个数,可以通过一个变量来获取
# 如:num = file_obj.write('aaa\n')
file_obj.write('aaa\n') ---> \n换行 \t制表符
file_obj.write('adfsd\t')
file_obj.write('aaadsf\n')
file_obj.write(str(125)) # 只能写入str类型,其他类型要通过str()转换为str
- 读取模式
t ---> 文本文件(默认值)
b ---> 二进制文件
file_name = '青花瓷.flac' ---> 音乐文件为二进制文件
with open(file_name, 'rb') as file_obj:
# 读取<文本>文件时,size是以<字符>为单位的
# 读取<二进制>文件时,size是以<字节>为单位的
print(file_obj.read(100))
# 将读取到的内容写出来
# 定义一个新文件
new_name = 'new.flac'
with open(new_name, 'wb') as new_obj:
# 定义每次读取的大小
chunk = 1024 * 100 # 每次读取100kb,可以调整大小,单位为字节bit, 1024bit = 1kb
while True:
# 从已有对象file_obj中读取数据
content = file_obj.read(chunk)
if not content
break # 内容读取完毕,终止循环
# 将读取到的数据写入新对象new_obj中
new_obj.write(content)
seek()、tell()
- tell() 查看当前读取的位置
print('当前读取到了 --->', file_obj.tell())
- seek() 修改当前读取的位置(修改指针位置)
# seek(a, b=0)
a ---> 要切换到的位置,用数字表示
b ---> 计算位置的方式
可选值:
0 ---> 从头计算,默认值
1 ---> 从当前位置开始计算
2 ---> 从最后位置开始计算
# file.obj.seek(-10, 2) ---> 从最后位置开始计算,跳到-10个位置,
# 说明要从倒数第10个开始计算
file_obj.seek(55)
文件的其他操作
import os
from pprint import pprint
- os.listdir() 获取指定目录的目录结构
需要一个路径作为参数,会获取到该路径下的目录结构,默认路径为 . (当前目录)
该方法会返回一个列表,目录中的每一个文件(夹)的名字都是列表中的元素
r = os.listdir()
- os.getcwd() 获取当前所在的目录
r = os.getcwd()
- os.chdir() 切换当前所在的目录,作用相当于cd
os.chdir('c:/')
- os.mkdir() 创建目录
os.mkdir('aaa') # 在当前目录下创建一个名字叫aaa的目录
- os.rmdir() 删除目录
os.rmdir('abc')
- os.remove() 删除文件
# 删除文件前要打开文件
open('aa.txt', 'w') # 设为可写的方式
os.remove('aa.txt')
- os.rename('旧名字', '新名字') 重命名
os.rename('aa.txt', 'bb.txt')
os.raname('bb.txt', 'C:/Users/LanceMai/Desktop/hello.py') # 将文件进行移动