7.2 Python文件操作

文件(file)

- 通过python程序来对计算机中的各种文件进行增删改查的操作
- I/O(Input / Output)
- 操作文件的三个必备步骤
    (1)打开文件
    (2)对文件进行各种操作(读、写),然后保存
    (3)关闭文件

打开文件

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None) 

- 上述函数只有一个必须传的参数 file:要打开的文件的名字(路径)
    (如果目标文件跟当前文件在同一目录下,则直接使用文件名即可,不用加完整路径)
- 在windows系统中的文件路径用的分隔符是\:C:\Users\LanceMai\Desktop\hello.py
    可以用/来代替\ :C:/Users/LanceMai/Desktop/hello.py
    或者可以使用 \\ 来代替 \ :C:\\Users\\LanceMai\\Desktop\\hello.py
    或者可以使用原始字符串r' ' :r'C:\Users\LanceMai\Desktop\hello.py'
- 表示路径,可以使用..来返回上一级目录
            ..\\Desktop\\hello.py
- 如果目标文件距离当前文件比较远,可以使用绝对路径,绝对路径一定要包含根目录
    C:\Users\LanceMai\Desktop\hello.py

关闭文件

1、不常用的方式
# 打开文件
file_name = 'demo.txt'

# 调用open()来打开文件,将该对象赋值给变量file_obj
file_obj = open(file_name)

# 当我们获取了文件对象之后,所有的对文件的操作都应该通过对象来进行
# 读取文件内容:read()方法,读取文件内容,它会将内容全部保存为一个字符串返回
content = file_obj.read()

# 打印内容
print(content)

# 关闭文件
# 调用close()方法来关闭文件,以释放内存
file_obj.close()

2、常规方式
# with ... as 语句
with open(file_name) as file_obj:
    # 在with语句中可以直接使用file_obj来做文件操作
    # 此时这个文件只能在with语句块里面使用,一旦with结束则文件自动close()
    print(file_obj.read())
    
3、常用格式
# 结合异常处理

file_name = 'demo.txt'

try:
    with open(file_name) as file_obj:
        content = file_obj.read()
        print(content)

except FileNotFoundError:
print(‘f{file_name} 文件不存在!’)

文件简单读取

file_name = 'demo.txt'

try:
    # 调用open()来打开一个文件,可以将文件分成两种类型
    # 第一种是纯文本文件(使用uft-8等编码编写的文本文件)
    # 第二种是二进制文件(图片、mp3、ppt等文件)
    # open()打开文件时,默认是以文本问价的形式打开的,但是open()默认的编码是None:
    # encoding=None
        所以处理文本文件时,必须指定文件的编码
    # 例如: 读取中文文件'古诗.txt'时,可能读不出来,那么就要指定该文件的编码
    # encoding='utf-8'
    
    file_name = '古诗.txt'
    with open(file_name, encoding='utf-8') as file_obj:
        # 直接调用read()会将文本文件所有内容<全部>读取出来
        content = file_obj.read()
        print(content)
    except FileNotFoundError:
        print('f{file_name} 文件不存在!')

读取大文件

# read()会将文本文件所有内容<全部>读取出来,当文件比较大时,容易造成内存溢出
# 因此对于比较大的文件,不要直接调用read()
# read()可以接受一个size作为参数,用来指定要读取字符的数量
    默认值为-1,表示读取全部字符
    可以为size指定一个值,这样read()会读取指定数量的字符
        每一次读取都是从上次读取到的位置开始读取的
        如果字符的数量少于size,则会读取剩余所有的字符
        如果已经读取到了文件的最后吗,,则会返回空串''
        content = file_obj.read(6)
        content = file_obj.read(6)
        content = file_obj.read(6)
        content = file_obj.read(6)

- 读取大文件的方式

file_name = 'demo.txt'

try:
    with open(file_name, encoding='uft-8') as file_obj:
        # 定义一个变量,来指定每次读取的大小
        chunk = 100
        
        # 创建一个循环来读取文件内容
        while True:
            # 读取chunk大小的内容
            content = file_obj.read(chunk)
            
            # 检查是否读取到了内容
            if not content:
                # 内容读取完毕
                break # 退出循环
                
            # 输出内容
            print(content, end='') # 加上 end=''来美化格式
except FileNotFoundError:
    print('f{file_name} 文件不存在!')
    
- 以上是一段一段地显示,如果希望一段一段读取然后将他们拼接起来,集中显示
    那么用以下办法:

file_name = 'demo.txt'

try:
    with open(file_name, encoding='uft-8') as file_obj:
        # 定义一个变量,来指定每次读取的大小
        chunk = 100
        
        # 创建一个循环来读取文件内容
        while True:
            # 读取chunk大小的内容
            content = file_obj.read(chunk)
            
            # 检查是否读取到了内容
            if not content:
                # 内容读取完毕
                break # 退出循环
                
            # 输出内容
            file_content += content # 将读取到的字符串进行拼接
            
except FileNotFoundError:
    print('f{file_name} 文件不存在!')
    
print('file_content') # 最后集中显示

readline()、readlines()

# 以下均省略异常处理代码
- readline()
    用于读取一行内容(只读取一行,想读多行则需要多次调用)
with open(file_name, encoding='uft-8') as file_obj:
    print(file_obj.readline(), end='')
    print(file_obj.readline(), end='')
    print(file_obj.readline(), end='')
    
- readlines()
    用于一行一行内容的读取,他会一次性将读取到的内容封装到一个列表中返回
    一行内容是一个元素
import pprint
with open(file_name, encoding='uft-8') as file_obj:    
    r = file_obj.readlines()
    pprint.pprint(r[0])
    pprint.pprint(r[1])
    pprint.pprint(r[2])
    pprint.pprint(r[3])

- 循环(文件可逐行迭代)
with open(file_name, encoding='uft-8') as file_obj:
    for t in file_obj: # 逐行读取
        print(t)

文件写入

file_name = 'demo.txt'

# 使用open()打开文件时必须要指定打开文件后所要做的操作(读、写、追加)
# 如果不指定操作类型,则默认时读取文件(此时不能向文件中写内容)
# r ---> 只读
# w ---> 新建只写(如果文件不存在会创建文件,如果文件存在则会截断文件,即把原来内容删掉重写)
# a ---> 追加内容,如果文件不存在会创建文件,如果文件存在则会会文件中追加内容
# + ---> 为操作符增加功能
    r+ 可读可写(覆盖写),文件不存在则报错
    w+ 可读读写,文件不存在则创建
    a+ 附加读写
# x 新建文件,如果文件不存在则创建,存在则报错

with open(file_name, encoding='uft-8') as file_obj:
    # write()来向文件写入内容
    # 如果操作的是一个文本文件,则write()需要传递一个字符串作为参数
    # 该方法可以分多次向文件中写入内容
    # 写入完成后,该方法会返回写入字符个数,可以通过一个变量来获取
    # 如:num = file_obj.write('aaa\n')
    file_obj.write('aaa\n')  ---> \n换行  \t制表符
    file_obj.write('adfsd\t')
    file_obj.write('aaadsf\n')
    file_obj.write(str(125))   # 只能写入str类型,其他类型要通过str()转换为str
    
- 读取模式
    t ---> 文本文件(默认值)
    b ---> 二进制文件

file_name = '青花瓷.flac'  ---> 音乐文件为二进制文件
with open(file_name, 'rb') as file_obj:
    # 读取<文本>文件时,size是以<字符>为单位的
    # 读取<二进制>文件时,size是以<字节>为单位的
    print(file_obj.read(100))
    
    # 将读取到的内容写出来
    # 定义一个新文件
    new_name = 'new.flac'
    
    with open(new_name, 'wb') as new_obj:
    
        # 定义每次读取的大小
        chunk = 1024 * 100  # 每次读取100kb,可以调整大小,单位为字节bit, 1024bit = 1kb
        
        while True:
            # 从已有对象file_obj中读取数据
            content = file_obj.read(chunk)
            
            if not content
                break # 内容读取完毕,终止循环
            
            # 将读取到的数据写入新对象new_obj中
            new_obj.write(content)

seek()、tell()

- tell() 查看当前读取的位置
    print('当前读取到了 --->', file_obj.tell())
    
- seek() 修改当前读取的位置(修改指针位置)
# seek(a, b=0)
    a ---> 要切换到的位置,用数字表示
    b ---> 计算位置的方式
        可选值:
            0 ---> 从头计算,默认值
            1 ---> 从当前位置开始计算
            2 ---> 从最后位置开始计算
            # file.obj.seek(-10, 2) ---> 从最后位置开始计算,跳到-10个位置,
            #                            说明要从倒数第10个开始计算
    
file_obj.seek(55)

文件的其他操作

import os
from pprint import pprint

- os.listdir() 获取指定目录的目录结构
    需要一个路径作为参数,会获取到该路径下的目录结构,默认路径为 .  (当前目录)
    该方法会返回一个列表,目录中的每一个文件(夹)的名字都是列表中的元素
r = os.listdir()

- os.getcwd() 获取当前所在的目录
r = os.getcwd()

- os.chdir() 切换当前所在的目录,作用相当于cd
os.chdir('c:/')

- os.mkdir() 创建目录
os.mkdir('aaa') # 在当前目录下创建一个名字叫aaa的目录

- os.rmdir() 删除目录
os.rmdir('abc') 

- os.remove() 删除文件
# 删除文件前要打开文件
open('aa.txt', 'w') # 设为可写的方式
os.remove('aa.txt')

- os.rename('旧名字', '新名字')  重命名
os.rename('aa.txt', 'bb.txt')
os.raname('bb.txt', 'C:/Users/LanceMai/Desktop/hello.py') # 将文件进行移动
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值