0918课堂小结

文件处理

什么是文件

操作系统提供的虚拟的概念,用于存储信息(用二进制存储信息)

什么是文件处理

修改存储的信息

操作文件的流程

  1. 打开文件

    使用open()函数打开 文件, f = open(r'test.py','w',encoding='utf8')

    括号内参数分别为: 文件路径(路径地址前的r 可以使路径中的特殊意义字符失效)、打开方式、读取编码方式

  2. 修改\读取文件

    f.write() f.read()分别为写入信息、读取信息

  3. 保存文件

    f.flush()快速保存

  4. 关闭文件

    f.close()

文件的三种打开方式

一般默认的读写内容的模式为t模式 可以忽略直接写为r 、w、a

  1. r 只读模式

    r: read,只读模式,只能读不能写,文件不存在时报错。

    f = open(r'test.py', 'rt', encoding='utf8')
    f.write('slkdjfklj')
    data = f.read()
    print(data)
    print(f.readable()) # 判断是否可读 true
    print(f.writable()) # 判断是否可写 false
  2. w只写模式 (清空后写入)

    w: 只能写,不能读,文件存在的时候回清空文件后再写入内容;文件不存在的时候会创建文件后写入内容。

    f = open(r'test.py', 'wt', encoding='utf8')
    print(f.readable())  # false
    print(f.writable())  # true
  3. a只写模式 (追加写入)

    a: 可以追加。文件存在,则在文件的末端写入内容;文件不存在的时候会创建文件后写入内容。

    f = open(r'test.py', 'at', encoding='utf8')
    print(f.readable())  # false
    print(f.writable())  # true

文件的两种读取格式

  1. b模式 文件打开读取二进制

    b模式是通用的模式,因为所有的文件在硬盘中都是以二进制的形式存储的,需要注意的是:b模式读写文件,一定不能加上encoding参数,因为二进制无法再编码。

    b模式常用于爬虫或是音频、图片、视频的保存

  2. t模式 打开TXT类型文件

    t模式可以和r、w、a连用,rt、wt、at指的都是操作文本文件。一般默认的读写内容的模式为t模式

绝对路径和相对路径

  1. 绝对路径

    • Windows系统绝对路径从盘符(C:、D:)开始写一个完整的路径。
    • macos系统从根目录(/Users)开始写一个完整的路径。
  2. 相对路径

    相对于当前执行文件所在的文件夹开始找。

    f = open('test.txt') # test.txt与py文件同路径位置, 可直接写文件名

with管理上下文

之前用open()方式打开文件,还需要手动将文件关闭 释放占用内存, 更简单方便的就是with open()

with open()方法不仅提供自动释放操作系统占用的方法,并且with open可以使用逗号分隔,一次性打开多个文件,实现文件的快速拷贝。

# 两种写法
# with open('32.txt', 'rb') as fr, open('35r.txt', 'wb') as fw:

with open('32.txt', 'rb') as fr, \   #斜杠表示换行
        open('35r.txt', 'wb') as fw:
    f.write(f.read())

文件的高级应用

可读、可写

  • r+t: 可读、可写

    # 可简写为r+
    with open('36w.txt', 'r+', encoding='utf-8') as fr:
        print(fr.readable()) # true
        print(fr.writable()) # true
  • w+t: 可写、可读

    # 可简写为w+
    with open('36w.txt', 'w+', encoding='utf-8') as fw:
        print(fw.readable()) # true
        print(fw.writable()) # true
  • a+t: 可追加、可读

    # 可简写为a+
    with open('36w.txt', 'a+', encoding='utf-8') as fa:
        print(fa.readable()) # true
        print(fa.writable()) # true

文件内指针移动

在utf8编码中,8个进制位为一个字节,3个8进制位组成一个字符(针对中文,英文是一个字节一个字符)

  1. seek(offset,whence): offset代表文件指针的偏移量,偏移量的单位是字节个数

    with open('36.txt', 'rb') as fr:
        print(f"fr.seek(4, 0): {fr.seek(4, 0)}")  # 0相当于文件头开始;1相当于当前文件所在位置;2相当于文件末尾
        # fr.seek(0,2)  # 切换到文件末尾
  2. tell(): 每次统计都是从文件开头到当前指针所在位置

    with open('36r.txt', 'rb') as fr:
        fr.seek(4, 0)
        print(f"fr.tell(): {fr.tell()}")
  3. read(n): 只有在模式下的read(n),n代表的是字符个数,除此之外,其他但凡涉及文件指针的都是字节个数

    with open('36r.txt', 'rt', encoding='utf-8') as fr:
        print(f"fr.read(3): {fr.read(3)}")
  4. truncate(n): truncate(n)是截断文件,所以文件的打开方式必须可写,但是不能用w或w+等方式打开,因为那样直接清空文件了,所以truncate()要在r+或a或a+等模式下测试效果。它的参照物永远是文件头。并且truncate()不加参数,相当于清空文件。

    with open('36r.txt', 'ab') as fr:
        fr.truncate(2) # 截断2个字节后的所有字符,如果3个字节一个字符,只能截断2/3个字符,还会遗留1/3个字符,会造成乱码

登录注册

# # 注册
#
count = 0
while count < 3:
    username_inp = input('请输入你的用户名:')
    pwd_inp = input('请输入你的密码:')
    re_pwd_inp = input('请在此输入你的密码:')

    if not pwd_inp == re_pwd_inp:
        print('两次密码输入不一致')
        count += 1
        continue

    with open('user_info.txt', 'a', encoding='utf8') as fa:
        fa.write(f'{username_inp}:{pwd_inp}\n')  # :表示用户名和密码的分割;|用户和用户之间的分割
        fa.flush()
        break

# 登录
username_inp = input('请输入你的用户名:')
pwd_inp = input('请输入你的密码:')

with open('user_info.txt', 'r', encoding='utf8') as fr:
    for user_info in fr:
        username, pwd = user_info.split(':')

        if username.strip() == username_inp and pwd.strip() == pwd_inp:  # strip可以去掉两端的换行符
            print('登录成功')
            break
        # else:
        #     continue  # continue一般不写在最后一行
    else:
        print('登录失败')

文件修改的两种方式

硬盘上从来没有修改一说,硬盘上只有覆盖,即新内容覆盖新内容。

修改文件内容的思路为:以读的方式打开原文件,以写的方式打开一个新的文件,把原文件的内容进行修改,然后写入新文件,之后利用os模块的方法,把原文件删除,重命名新文件为原文件名,达到以假乱真的目的。

方式一

将硬盘存放的该文件的内容全部加载到内存,在内存中是可以修改的,修改完毕后,再由内存覆盖到硬盘(word,vim,nodpad++等编辑器)

import os

with open('37r.txt') as fr, \
        open('37r_swap.txt', 'w') as fw:
    data = fr.read()  # 全部读入内存,如果文件很大,会很卡
    data = data.replace('tank', 'tankSB')  # 在内存中完成修改

    fw.write(data)  # 新文件一次性写入原文件内容

# 删除原文件
os.remove('37r.txt')
# 重命名新文件名为原文件名
os.rename('37r_swap.txt', '37r.txt')
print('done...')

方式二

将硬盘存放的该文件的内容一行一行地读入内存,修改完毕就写入新文件,最后用新文件覆盖源文件。

import os

with open('37r.txt') as fr,\
        open('37r_swap.txt', 'w') as fw:
    # 循环读取文件内容,逐行修改
    for line in fr:
        line = line.replace('jason', 'jasonSB')
        # 新文件写入原文件修改后内容
        fw.write(line)

os.remove('37r.txt')
os.rename('37r_swap.txt', '37r.txt')
print('done...')

转载于:https://www.cnblogs.com/faye12/p/11544353.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值