Python-Python文件操作:文件的编码(读取、操作)、open()函数、mode常用基础访问模式、读操作方法(read()、readlines()、readline()、for循环、close

版本说明

当前版本号[20230727]。

版本修改说明
20230727初版

目录

知识总览图

image-20230727211259522

Python文件操作

文件的编码

​ 计算机只能识别:0和1,那么我们丰富的文本文件是如何被计算机识别,并存储在硬盘中呢?

​ 答案:使用编码技术(密码本)将内容翻译成0和1存入。

​ 编码技术即:翻译的规则,记录了如何将内容翻译成二进制,以及如何将二进制翻译回可识别内容。

​ 编码就是:一种规则集合,记录了内容和二进制间进行相互转换的逻辑

我 1011

喜 -> 1101

欢 1111

你 1001

计算机中有许多可用编码:

•UTF-8

•GBK

•Big5

•等

不同的编码,将内容翻译成二进制也是不同的。

编码有许多,所以要使用正确的编码, 才能对文件进行正确的读写操作呢。

image-20230604202116685

如上,如果你给喜欢的女孩发送文件,使用编码A进行编码(内容转二进制)

女孩使用编码B打开文件进行解码(二进制反转回内容)

查看文件编码

我们可以使用Windows系统自带的记事本,打开文件后,即可看出文件的编码是什么:

image-20230604202306116

UTF-8是目前全球通用的编码格式

除非有特殊需求,否则,一律以UTF-8格式进行文件编码即可。

为什么需要使用编码?

  • 计算机只认识0和1,所以需要将内容翻译成0和1才能保存在计算机中。
  • 同时也需要编码, 将计算机保存的0和1,反向翻译回可以识别的内容

文件的读取

什么是文件

​ 内存中存放的数据在计算机关机后就会消失。要长久保存数据,就要使用硬盘、光盘、U 盘等设备。为了便于数据的管理和检索,引入了“文件”的概念。

​ 一篇文章、一段视频、一个可执行程序,都可以被保存为一个文件,并赋予一个文件名。**操作系统以文件为单位管理磁盘中的数据。**一般来说,文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别。

文件操作

在日常生活中,文件操作主要包括打开、关闭、读、写等操作。

大概可以分为三个步骤(简称文件操作三步走):

① 打开文件

② 读写文件

③ 关闭文件

注意:

可以只打开和关闭文件,不进行任何读写

open()打开函数

在Python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件,语法如下

open(name, mode, encoding)

name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。

mode:设置打开文件的模式(访问模式):只读、写入、追加等。

encoding:编码格式(推荐使用UTF-8)

示例代码:

f = open("F:/代码.txt", "r", encoding="UTF-8")
# encoding的顺序不是第三位,所以不能用位置参数,用关键字参数直接指定

注意:

​ 此时的fopen函数的文件对象,对象是Python中一种特殊的数据类型,拥有属性和方法,可以使用对象.属性或对象.方法对其进行访问,后续面向对象课程会给大家进行详细的介绍。

mode常用的三种基础访问模式

image-20230604203316064

读操作相关方法
read()方法
文件对象.read(num)

num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。

如:

f = open("F:/代码.txt", "r", encoding="UTF-8")
print(f"该文件前10个字节内容为:{f.read(10)}")
print(f"该文件剩余全部内容为:{f.read()}")

image-20230604204418920

readlines()方法:【全部行】

​ readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素

f = open("F:/代码.txt", "r", encoding="UTF-8")
print(f"该文件全部行内容为:{f.readlines()}")

# 关闭文件
f.close()

image-20230604204813982

readline()方法:一次读取一行内容
f = open("F:/代码.txt", "r", encoding="UTF-8")
print(f"该文件第一行内容为:{f.readline()}")
print(f"该文件第二行内容为:{f.readline()}")
print(f"该文件第三行内容为:{f.readline()}")

image-20230604204614390

for循环读取文件行

也可以加入计数变量,看一共有几行,第几行对应哪个数据

f = open("F:/代码.txt", "r", encoding="UTF-8")
count = 1
for i in f:		# 每一个i临时变量,就记录了文件的一行数据
    print(f"每{count}行的数据是{i}")
    count += 1
close() 关闭文件对象
f = open("python.txt", "r")
f.close()

​ 最后通过close,关闭文件对象,也就是关闭对文件的占用

​ 如果不调用close,同时程序没有停止运行,那么这个文件将一直被Python程序占用

with open 语法
with open("F:/代码.txt", "r", encoding="UTF-8") as f:
  • 通过在with open的语句块中对文件进行操作
  • 可以在操作完成后自动关闭close文件,避免遗忘掉close方法

操作汇总

image-20230604210730507

课后练习:单词计数

通过Windows的文本编辑器软件,将如下内容,复制并保存到:word.txt,文件可以存储在任意位置

pikaqiu python itcast
beijing shanghai pikaqiu
shenzhen guangzhou pikaqiu
wuhan hangzhou pikaqiu
zhengzhou bigdata pikaqiu

通过文件读取操作,读取此文件,统计pikaqiu单词出现的次数

示例代码:

f = open("F:/word.txt", "r", encoding="UTF-8")
# cc = f.read()
# cc = cc.count("pikaqiu")   通过字符串来读取次数
# print(f"此文本内共有{cc}个pikaqiu")
count = 0
for line in f:
    line = line.strip()#去除开头和结尾的空格和换行符
    words = line.split(" ")
    for word in words:
        if word == "pikaqiu":
            count += 1 #通过count来累计数量

print(f"此文本内共有{count}个pikaqiu")
f.close()

image-20230605202222067

文件的写入

写操作快速入门

案例演示:

# 1. 打开文件
f = open('python.txt', 'w')

# 2.文件写入
f.write('hello world')

# 3. 内容刷新
f.flush()

注意:

直接调用write,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区

调用flush的时候,内容会真正写入文件

这样做是避免频繁的操作硬盘,导致效率下降(攒一堆,一次性写磁盘)

写操作注意

  • 文件如果不存在,使用”w”模式,会创建新文件
  • 文件如果存在,使用”w”模式,会将原有内容清空
  • close()方法,带有flush()方法的功能

文件的追加

案例演示:

# 1. 打开文件,通过a模式打开即可
f = open('python.txt', 'a')

# 2.文件写入
f.write('hello world')

# 3. 内容刷新
f.flush()

注意:

a模式,文件不存在会创建文件

a模式,文件存在,会在最后追加写入文件

  1. 追加写入文件使用open函数的”a”模式进行写入

  2. 追加写入的方法有(和w模式一致):

  • wirte(),写入内容
  • flush(),刷新内容到硬盘中
  1. 注意事项:
  • a模式,文件不存在,会创建新文件
  • a模式,文件存在,会在原有内容后面继续写入
  • 可以使用”\n”来写出换行符

文件操作综合案例

完成文件备份案例

需求:有一份账单文件,记录了消费收入的具体记录,将内容复制并保存为 bill.txt文件,内容如下:

name,date,money,type,remarks
周杰轮,2022-01-01,100000,消费,正式
周杰轮,2022-01-02,300000,收入,正式
周杰轮,2022-01-03,100000,消费,测试
林俊节,2022-01-01,300000,收入,正式
林俊节,2022-01-02,100000,消费,测试
林俊节,2022-01-03,100000,消费,正式
林俊节,2022-01-04,100000,消费,测试
林俊节,2022-01-05,500000,收入,正式
张学油,2022-01-01,100000,消费,正式
张学油,2022-01-02,500000,收入,正式
张学油,2022-01-03,900000,收入,测试
王力鸿,2022-01-01,500000,消费,正式
王力鸿,2022-01-02,300000,消费,测试
王力鸿,2022-01-03,950000,收入,正式
刘德滑,2022-01-01,300000,消费,测试
刘德滑,2022-01-02,100000,消费,正式
刘德滑,2022-01-03,300000,消费,正式

我们现在要做的就是:

  • 读取文件
  • 将文件写出到bill.txt.bak文件作为备份
  • 同时,将文件内标记为测试的数据行丢弃

实现思路:

  • open和r模式打开一个文件对象,并读取文件
  • open和w模式打开另一个文件对象,用于文件写出
  • for循环内容,判断是否是测试,不是测试就write写出,是测试就continue跳过
  • 将2个文件对象均close()
fr = open("F:/bili.txt", "r", encoding="UTF-8")
fw = open("F:/bili.txt.bak", "w", encoding="UTF-8")
for line in fr:
    line = line.strip()
    if line.split(",")[4] == "测试":
        continue
    fw.write(line)
    fw.write("\n")

fr.close()
fw.close()

image-20230605210432946

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

放下华子我只抽RuiKe5

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值